1、Hadoop開(kāi)發(fā)工程師
Hadoop是一個(gè)分布式文件系統(Hadoop Distributed File System),簡(jiǎn)稱(chēng)HDFS。Hadoop是一個(gè)能夠對大量數據進(jìn)行分布式處理的軟件框架, 以一種可靠、高效、可伸縮的方式進(jìn)行數據處理。所以說(shuō)Hadoop解決了大數據如何存儲的問(wèn)題,因而在大數據培訓機構中是必須學(xué)習的課程。
2、數據分析師
數據分析師是數據師的一種,指的是不同行業(yè)中,專(zhuān)門(mén)從事行業(yè)數據搜集、整理、分析,并依據數據做出行業(yè)研究、評估和預測的專(zhuān)業(yè)人員。在工作中通過(guò)運用工具,提取、分析、呈現數據,實(shí)現數據的商業(yè)意義。
作為一名數據分析師、至少需要熟練SPSS、STATISTIC、Eviews、SAS、大數據魔鏡等數據分析軟件中的一門(mén),至少能用Acess等進(jìn)行數據庫開(kāi)發(fā),至少掌握一門(mén)數學(xué)軟件如matalab、mathmatics進(jìn)行新模型的構建,至少掌握一門(mén)編程語(yǔ)言?傊,一個(gè)優(yōu)秀的數據分析師,應該業(yè)務(wù)、管理、分析、工具、設計都不落下。
3、數據挖掘工程師
做數據挖掘要從海量數據中發(fā)現規律,這就需要一定的數學(xué)知識,最基本的比如線(xiàn)性代數、高等代數、凸優(yōu)化、概率論等。
經(jīng)常會(huì )用到的語(yǔ)言包括Python、Java、C或者C++,有些人用Python或者Java比較多。有時(shí)用MapReduce寫(xiě)程序,再用Hadoop或者Hyp來(lái)處理數據,如果用Python的話(huà)會(huì )和Spark相結合。
4、大數據可視化工程師
隨著(zhù)大數據在人們工作及日常生活中的應用,大數據可視化也改變著(zhù)人類(lèi)的對信息的閱讀和理解方式。從百度遷徙到谷歌流感趨勢,再到阿里云推出縣域經(jīng)濟可視化產(chǎn)品,大數據技術(shù)和大數據可視化都是幕后的英雄。