精品福利视频一区二区三区,免费A级毛片无码无遮挡,偷窥目拍性综合图区,亚洲欧洲无码AV电影在线观看,超清无码熟妇人妻AV在线电影

認證培訓,h3c認證體系,網(wǎng)絡(luò )工程師
豐沃創(chuàng  )新

身為數據科學(xué)家怎么能不掌握這四大技能!

  • 發(fā)布時(shí)間: 2018-2-28 12:43:44

想成為一名高級數據科學(xué)家除了擁有卓越的專(zhuān)業(yè)技能,你還需要其它技能來(lái)拉近和業(yè)務(wù)經(jīng)理的距離。這看起來(lái)簡(jiǎn)單,但隨著(zhù)每年新技術(shù)的不斷累積,技術(shù)和業(yè)務(wù)之間的距離會(huì )繼續增大。因此,我們發(fā)現管理者和數據科學(xué)家有清晰的合作方向是非常重要的。

業(yè)務(wù)和IT知識都是十分專(zhuān)業(yè)的,然而由于技能的專(zhuān)業(yè)化,許多企業(yè)都出現了兩個(gè)專(zhuān)業(yè)間的空白。我們的任務(wù)是幫助填補它!

數據科學(xué)家必須有技術(shù)方面的扎實(shí)基本功,這包括編程、查詢(xún)、數據清洗等。然而隨著(zhù)數據科學(xué)家的成長(cháng),他們需要更多地關(guān)注設計決策以及與管理者的溝通,這會(huì )大大增強經(jīng)驗豐富的數據科學(xué)家的影響力。他們可以做出更高層次的決策,并幫助陷入困境的年輕數據科學(xué)家,而不是被困在日復一日的編碼中。更有經(jīng)驗的數據科學(xué)家能利用他們的經(jīng)驗來(lái)做出簡(jiǎn)化復雜系統、優(yōu)化數據流的設計決策,同時(shí)協(xié)助決定哪些項目最為恰當,這使得數據科學(xué)家自身及其公司都能有更大獲益。

能夠做到化繁為簡(jiǎn)

數據科學(xué)家往往希望將他們所知道的每一種技術(shù)和算法都應用于每一個(gè)問(wèn)題的解決方案上。相應地,這就會(huì )使系統非常復雜難以維護。

數據科學(xué)確實(shí)需要復雜抽象的模型及大量的復雜技術(shù)(從Hadoop到Tensorflow)。在這個(gè)充斥著(zhù)復雜性的領(lǐng)域,人們會(huì )傾向于開(kāi)發(fā)復雜的系統和算法,稍不留神就會(huì )在開(kāi)發(fā)中涉及四、五種不同的技術(shù)并使新的熱門(mén)算法或框架。然而,像大多數涉及工程的其他領(lǐng)域一樣,減少復雜性往往會(huì )帶來(lái)諸多好處。

如果馮•諾依曼,埃爾溫•薛定諤和愛(ài)因斯坦可以幫助我們理解數學(xué)和物理驅動(dòng)領(lǐng)域的復雜性,那么我們數據科學(xué)家不能隱藏在復雜性背后。

工程師的角色就是去簡(jiǎn)化任務(wù)。如果你曾經(jīng)建造或看到過(guò)魯布•戈德堡機械(Rube Goldberg machine),你會(huì )理解什么是用復雜方法去完成簡(jiǎn)單任務(wù)。一些數據科學(xué)家的算法和數據系統看起來(lái)像是用膠帶和口香糖粘起來(lái)的老鼠夾,而不是簡(jiǎn)潔有效的解決方案。更簡(jiǎn)單的系統意味著(zhù)隨著(zhù)時(shí)間推移系統會(huì )更加容易維護,并且未來(lái)的數據科學(xué)家能夠按需添加和刪除模塊。但若你使用三種不同的語(yǔ)言,兩個(gè)數據源,十個(gè)算法且沒(méi)有留下任何文檔資料,未來(lái)的工程師可能會(huì )默默詛咒你哦。

簡(jiǎn)單的算法和系統也應使添加和刪減模塊是容易的。因此當需要技術(shù)進(jìn)行改變和更新或者需要刪除模塊時(shí),可憐的未來(lái)數據科學(xué)家不會(huì )陷入和你的代碼一起玩疊疊樂(lè )積木游戲(Jenga)的困境 。但會(huì )糾結于“如果刪了這段代碼,系統會(huì )不會(huì )崩潰”。(這一糾結的根源是怕出現技術(shù)債務(wù))

知道如何在沒(méi)有主鍵的情況下關(guān)聯(lián)匹配數據

強大的數據專(zhuān)家能做的重要工作之一是:將可能沒(méi)有主鍵或明顯聯(lián)系的數據集關(guān)聯(lián)在一起。數據可以呈現人之間或業(yè)務(wù)之間的日常交互。能夠在這些數據中找出統計模式,是數據科學(xué)家可以幫助決策者作出明智決定的重要能力。然而,你想要關(guān)聯(lián)在一起的數據并不總是位于相同的系統或有著(zhù)相同粒度。

與數據打交道的人會(huì )知道,數據并不總是很好的整合在一個(gè)數據庫中。比如,財務(wù)數據與IT服務(wù)管理數據通常是分開(kāi)存放的,外部的數據源往往可能并不是在同一個(gè)維度進(jìn)行的聚合。這會(huì )成為一個(gè)問(wèn)題,因為找出數據中的價(jià)值有時(shí)確實(shí)會(huì )需要來(lái)自其他部門(mén)或系統的數據。

數據嚙合

數據嚙合是需要在相同的粒度級別上進(jìn)行的。一種理解的方式是:將一塊大拼圖與由許多小塊數據拼圖組成的大拼圖組合起來(lái)。

例如,假如給你提供了醫療保單、信用卡和社區犯罪率的數據,想由此找出這些社會(huì )經(jīng)濟因素如何影響病人,你會(huì )怎樣處理?一些數據可能是以人為單位,而另一些數據可能是街道或城市級別,而且沒(méi)有明確的方式來(lái)關(guān)聯(lián)這些數據集。最好的處理方式是什么?這成為了一個(gè)不能忽視且必須被解決的問(wèn)題。

對項目進(jìn)行優(yōu)先排序

作為數據科學(xué)家,你需要知道如何解釋可能不劃算的項目的投資回報率(ROI)。這與良好的直接溝通有關(guān)(我們的團隊永遠不會(huì )停止討論如何溝通),也與能夠清楚表達價(jià)值并且對長(cháng)短期目標進(jìn)行優(yōu)先排序有關(guān)(重申一遍,說(shuō)起來(lái)容易做起來(lái)難)

團隊總是會(huì )有超出他們處理能力的過(guò)多的項目和項目要求。有經(jīng)驗的團隊成員需要起帶頭作用來(lái)幫助決策者決定哪些項目是值得進(jìn)行的。在有很大機會(huì )成功但可能不會(huì )有最高投資回報率的短期項目和很有可能會(huì )失敗但同時(shí)也會(huì )產(chǎn)生較大投資回報率的長(cháng)期項目之間需要有一個(gè)良好的平衡。

這種情況下,決策矩陣會(huì )有助于簡(jiǎn)化過(guò)程。

經(jīng)典的決策矩陣之一是一個(gè)2*2矩陣,行和列分別為重要性和緊迫性。多數的大學(xué)商業(yè)課程中都會(huì )出現這種矩陣,它很簡(jiǎn)單,這也是它很棒的原因。

我曾在公司和一些很聰明的人共事,但還是工作中的每個(gè)項目都被列為優(yōu)先。如果你沒(méi)聽(tīng)過(guò)這個(gè)說(shuō)法,我會(huì )在這里講出來(lái):

如果每件事都被優(yōu)先考慮,那么,相當于沒(méi)有事情被排在優(yōu)先。

選擇正確的項目意味著(zhù)必須做出取舍。不是所有的事情都是高優(yōu)的。

許多公司都存在這個(gè)問(wèn)題,這就是為什么對于數據科學(xué)家團隊中有經(jīng)驗的成員,能夠清晰表達出哪些項目需要當下執行還是以后執行是非常重要的。而使用這個(gè)簡(jiǎn)單的矩陣能帶來(lái)一定幫助。

(簡(jiǎn)潔十分重要,使用矩陣來(lái)明確投資回報率是有幫助的)。

有了簡(jiǎn)明直接的溝通,項目繼續向前推進(jìn),信任也隨之建立起來(lái)了。

能夠開(kāi)發(fā)出穩健且最優(yōu)的系統

做出能在受控環(huán)境中操作的算法或模型是一回事。將穩健模型集成到實(shí)時(shí)且能處理大量數據的系統又是另一回事。根據公司的不同,有時(shí)數據科學(xué)家只需開(kāi)發(fā)算法本身,之后開(kāi)發(fā)人員或機器學(xué)習工程師會(huì )負責將其轉為上線(xiàn)的產(chǎn)品。

然而還會(huì )有其他的情況,小的公司和小的團隊可能會(huì )需要數據科學(xué)家團隊來(lái)將代碼轉為上線(xiàn)產(chǎn)品。這意味著(zhù)算法需要能以合理的速度控制數據流量。如果算法要運行三個(gè)小時(shí)并且需要被實(shí)時(shí)訪(fǎng)問(wèn),這顯然不能在產(chǎn)品上使用。因此,良好的系統設計及優(yōu)化是必要的。

隨著(zhù)數據增多,越來(lái)越多的人會(huì )與系統交互,模型跟上腳步是十分重要的。

當高級數據專(zhuān)家的技術(shù)能力和其他能力相結合時(shí),才能對他們自身和其公司產(chǎn)生最大的影響。數據科學(xué)家寶貴的經(jīng)驗是非常有價(jià)值的,這些經(jīng)驗能夠指導年輕的開(kāi)發(fā)人員做出更好的設計決策,幫助管理者找出哪些項目會(huì )帶來(lái)最好的投資回報率,從而也放大了他們的參與對于團隊的影響。

精品福利视频一区二区三区,免费A级毛片无码无遮挡,偷窥目拍性综合图区,亚洲欧洲无码AV电影在线观看,超清无码熟妇人妻AV在线电影