大數據工程師就是一群“玩數據”的人,玩出數據的商業(yè)價(jià)值,讓數據變成生產(chǎn)力。大數據和傳統數據的最大區別在于,它是在線(xiàn)的、實(shí)時(shí)的,規模海量且形式不規整,無(wú)章法可循,因此“會(huì )玩”這些數據的人就很重要。
大數據想象成一座不停累積的礦山,那么大數據工程師的工作就是,
第一步,定位并抽取信息所在的數據集,相當于探礦和采礦。
第二步,把它變成直接可以做判斷的信息,相當于冶煉。最后是應用,把數據可視化等。
因此分析歷史、預測未來(lái)、優(yōu)化選擇,這是大數據工程師在“玩數據”時(shí)最重要的三大任務(wù)。通過(guò)這三個(gè)工作方向,他們幫助企業(yè)做出更好的商業(yè)決策。