互聯(lián)網(wǎng)的大數據(400-1109951)
互聯(lián)網(wǎng)上的數據每年增長(cháng)50%,每?jì)赡瓯銓⒎环,而目前世界?0%以上的數據是最近幾年才產(chǎn)生的。據IDC預測,到2020年全球將總共擁有35ZB的數據量;ヂ(lián)網(wǎng)是大數據發(fā)展的前哨陣地,隨著(zhù)WEB2.0時(shí)代的發(fā)展,人們似乎都習慣了將自己的生活通過(guò)網(wǎng)絡(luò )進(jìn)行數據化,方便分享以及記錄并回憶。
互聯(lián)網(wǎng)上的大數據很難清晰的界定分類(lèi)界限,我們先看看BAT的大數據:
百度擁有兩種類(lèi)型的大數據:用戶(hù)搜索表征的需求數據;爬蟲(chóng)和阿拉丁獲取的公共web數據。搜索巨頭百度圍繞數據而生。它對網(wǎng)頁(yè)數據的爬取、網(wǎng)頁(yè)內容的組織和解析,通過(guò)語(yǔ)義分析對搜索需求的精準理解進(jìn)而從海量數據中找準結果,以及精準的搜索引擎關(guān)鍵字廣告,實(shí)質(zhì)上就是一個(gè)數據的獲取、組織、分析和挖掘的過(guò)程。搜索引擎在大數據時(shí)代面臨的挑戰有:更多的暗網(wǎng)數據;更多的WEB化但是沒(méi)有結構化的數據;更多的WEB化、結構化但是封閉的數據。
阿里巴巴擁有交易數據和信用數據。這兩種數據更容易變現,挖掘出商業(yè)價(jià)值。除此之外阿里巴巴還通過(guò)投資等方式掌握了部分社交數據、移動(dòng)數據。如微博和高德。
騰訊擁有用戶(hù)關(guān)系數據和基于此產(chǎn)生的社交數據。這些數據可以分析人們的生活和行為,從里面挖掘出政治、社會(huì )、文化、商業(yè)、健康等領(lǐng)域的信息,甚至預測未來(lái)。
在信息技術(shù)更為發(fā)達的美國,除了行業(yè)知名的類(lèi)似Google,Facebook外,已經(jīng)涌現了很多大數據類(lèi)型的公司,它們專(zhuān)門(mén)經(jīng)營(yíng)數據產(chǎn)品,比如:
Metamarkets:這家公司對Twitter、支付、簽到和一些與互聯(lián)網(wǎng)相關(guān)的問(wèn)題進(jìn)行了分析,為客戶(hù)提供了很好的數據分析支持。
Tableau:他們的精力主要集中于將海量數據以可視化的方式展現出來(lái)。Tableau為數字媒體提供了一個(gè)新的展示數據的方式。他們提供了一個(gè)免費工具,任何人在沒(méi)有編程知識背景的情況下都能制造出數據專(zhuān)用圖表。這個(gè)軟件還能對數據進(jìn)行分析,并提供有價(jià)值的建議。
ParAccel:他們向美國執法機構提供了數據分析,比如對15000個(gè)有犯罪前科的人進(jìn)行跟蹤,從而向執法機構提供了參考性較高的犯罪預測。他們是犯罪的預言者。
QlikTech:QlikTech旗下的Qlikview是一個(gè)商業(yè)智能領(lǐng)域的自主服務(wù)工具,能夠應用于科學(xué)研究和藝術(shù)等領(lǐng)域。為了幫助開(kāi)發(fā)者對這些數據進(jìn)行分析,QlikTech提供了對原始數據進(jìn)行可視化處理等功能的工具。
GoodData:GoodData希望幫助客戶(hù)從數據中挖掘財富。這家創(chuàng )業(yè)公司主要面向商業(yè)用戶(hù)和IT企業(yè)高管,提供數據存儲、性能報告、數據分析等工具。
TellApart:TellApart和電商公司進(jìn)行合作,他們會(huì )根據用戶(hù)的瀏覽行為等數據進(jìn)行分析,通過(guò)鎖定潛在買(mǎi)家方式提高電商企業(yè)的收入。
DataSift:DataSift主要收集并分析社交網(wǎng)絡(luò )媒體上的數據,并幫助品牌公司掌握突發(fā)新聞的輿論點(diǎn),并制定有針對性的營(yíng)銷(xiāo)方案。這家公司還和Twitter有合作協(xié)議,使得自己變成了行業(yè)中為數不多可以分析早期tweet的創(chuàng )業(yè)公司。
Datahero:公司的目標是將復雜的數據變得更加簡(jiǎn)單明了,方便普通人去理解和想象。
舉了很多例子,這里簡(jiǎn)要歸納一下,在互聯(lián)網(wǎng)大數據的典型代表性包括:
1-用戶(hù)行為數據(精準廣告投放、內容推薦、行為習慣和喜好分析、產(chǎn)品優(yōu)化等)
2-用戶(hù)消費數據(精準營(yíng)銷(xiāo)、信用記錄分析、活動(dòng)促銷(xiāo)、理財等)
3-用戶(hù)地理位置數據(O2O推廣,商家推薦,交友推薦等)
4-互聯(lián)網(wǎng)金融數據(P2P,小額貸款,支付,信用,供應鏈金融等)
5-用戶(hù)社交等UGC數據(趨勢分析、流行元素分析、受歡迎程度分析、輿論監控分析、社會(huì )問(wèn)題分析等)