傳動網 > 新聞頻道 > 行業資訊 > 資訊詳情

看硅谷四大不同類型公司如何玩轉大數據

時間:2016-04-26

來源:網絡轉載

導語:難道有數據就叫大數據公司了?如果慶豐包子留存有這半個多世紀以來的購買者和交易記錄它就得叫大數據公司了?是,但也不是。

難道有數據就叫大數據公司了?如果慶豐包子留存有這半個多世紀以來的購買者和交易記錄它就得叫大數據公司了?是,但也不是。

看硅谷四大不同類型公司如何玩轉大數據

歸納下硅谷“大數據公司”的類型大概如下:

1.數據的擁有者、數據源:特點是業務優勢能收集到大量數據,就像煤老板壟斷一個地區的礦一樣。其實大多數有能力產生或收集數據的公司都屬于這類型,比如VantageSports和收集了PB級數據的包子鋪。

2.大數據咨詢:特點是非常技術,提供從基礎設施規劃建設維護到軟件開發和數據分析等的服務,但不擁有數據,比如Cloudera這家不到500人的startup是最著名的Hadoop架構咨詢公司。

3.做大數據工具的:比如AMPLab出來的Databricks和Yahoo人主導的Hortonworks。

4.整合應用型:特點是收集擁有或購買一些數據,然后結合AI來解決更多實際的痛點。

可能從真正意義上來說,大數據公司應該只屬于第四種類型:AI。

我相信未來是AI的,而AI的食物是數據。大數據行業最有價值的部分在于如何利用機器去處理數據得到洞見,影響組織和個人的行為,從而改變世界。收集和整理數據在未來會變得標準化和自動化,而利用AI進行分析的能力會變得更為關鍵。

再看硅谷主打AI的公司,現在大致可以分成以下三類了:

1.分析用戶行為,改進產品和營銷的,比如LinkedIn的推薦系統和用iBeacon實現店內營銷;

2.統籌大量分散個體,利用大數據實現精確有效的預測和規劃的,比如Uber和前段時間出現的AmazonFresh及GrubMarket;

3.分析識別各種類型的數據,開發更智能的設備和程序,比如Google大腦及無人車和以Nest為代表的智能設備等。

這些產品都有一個很明顯的共性,就是在努力嘗試把機器變得更智能以減輕人類的工作量。這個目的與科技發展的動力相符合,因此認為之前所說的第四種類型的公司是最有希望改變世界的。

目前硅谷的創業公司正在探索新的應用領域和方法,比如說物聯網這塊。現在智能設備們才剛剛起步,Nest、被Nest收購的Dropcam、Iotera、emberlight等等都屬于少部分人的玩具。待到家家戶戶都安裝了智能冰箱、智能燈泡、智能桌子、智能沙發等等的時候,大數據的威力才會伴隨著巨大的使用規模而發揮出來。

展望一下未來的話,如果參照以前的技術革命和行業發展來看大數據,那么大數據的底層設施將會逐漸被隔離,被模塊化和標準化,甚至是自動化,而在其上的中間層和應用層將成為各大公司的數據工程師們激烈攻克的主戰場。

硅谷公司的大數據運行現狀

目前硅谷各個公司的數據處理水平和模式差別還是蠻大的。除Facebook等幾個很領先的公司外,大部分公司要么還沒有能力自行處理數據,要么就是正在建立單獨的數據處理部門,主要負責從數據基本處理到后期分析的各個環節,然后再送到公司內部的其他部門。

對于這些公司來說,建立一個單獨的數據處理部門可能還有還路漫漫其修遠兮。普遍來說,各公司自主建立數據處理平臺存在著幾個難點:

1.沒有足夠優秀的數據工程師來組建團隊

2.沒有足夠能力整合數據

3.沒有易于操作的基礎軟硬件來支持數據分析

這幾個主要難點使得大數據分析越來越專業化、服務化,以至于我們漸漸看到一條“硅谷數據處理產業鏈”的出現。從數據的儲存,數據分析平臺建立,到數據分析,數據可視化等等各個環節的成本越來越高,這使得本身技術能力很強的公司都還是使用專業數據處理公司提供的服務,而將更多的人才和資源放到核心業務的開發上。

另外,就是各個公司對于數據處理的要求也越來越高。不僅僅需要有效的處理結果,也需要數據處理可以self-service、self-managing、保證數據安全性、完善實時分析。這些諸多需求也使得專業化團隊的優勢更加突出。而這樣一條整合服務鏈的行程,也給眾多的大數據公司提供了機會。

即使存在很多投機貼標簽的人,即使一片片的大數據startups被拍死在沙灘上,即使Gartner預測大數據概念將被回歸現實,但相信會有更多的人投入到大數據這個行業,開發出更智能,更有影響力的產品。畢竟,大數據本身,不像一個單純的pitch那樣,它能夠保證的是一定可以中看并且中用。

硅谷巨頭們的大數據玩法

將一共呈現硅谷四大不同類型的公司如何玩轉大數據,其中包括了著名FLAG中的三家(Apple在大數據這塊來說表現并不突出)。

Evernote:今年新建AI部門劍指深度學習

Evernote的全球大會上,CEOPhilLibin提到,Evernote的一個重要方向就是“讓Evernote變成一個強大的大腦”。要實現這個目標,就不得不提他們剛剛整合改組的AugmentedIntelligence團隊(以下簡稱AIteam)。

是什么

Zeesha是這個團隊里元老級的人物:“我是在2012年加入Evernote的,直接加入到了當時剛剛建立的數據處理團隊,這也就是現在AIteam的雛形。我們最開始的項目都是簡單易行的小項目,比如按照你的個人打字方式來優化用戶的輸入體驗。”

傳統意義上的AI指的是通過大量數據和算法讓機器學會分析并作出決定。而這里講到IA則是讓電腦進行一定量的運算,而終極目的是以之武裝人腦,讓人來更好的做決定。這兩個概念在具體實施中自然有不少相通之處,但是其出發點卻是完全不同的。

這個區別也是EvernoteAIteam的亮點所在。作為一個筆記記錄工具,Evernote與Google之類的搜索引擎相比,最大的區別就是它非常的個人化。用戶所儲存的筆記、網站鏈接、照片、視頻等都是他思維方式和關注點的體現。

從哪來

Zeesha小組的初衷便是,通過分析用戶儲存的筆記來學習其思維方式,然后以相同的模式從第三方數據庫(也就是互聯網上的各種開源信息)抽取信息推送給用戶,從而達到幫助用戶思考的過程。從這個意義上講,Zeesha版的未來Evernote更像是一個大腦的超級外掛,為人腦提供各種強大的可理解的數據支持。

到哪去

不用說,這樣一個新創團隊自然也面臨這諸多方面的挑戰。當下一個比較重要的技術難點就是Evernote用戶的數據量。雖然Evernote的用戶量已經達到了一億,但是由于整個團隊的關注點在個人化分析,外加隱私保護等諸多原因,AIteam并沒有做跨用戶的數據分析。

這樣做的結果就是團隊需要分析一億組各不相同的小數據組。比如,假設我只在Evernote上面存了10個筆記,那Evernote也應該能夠通過這些少量的數據來分析出有效結果。當然,這些技術的直接結果是用戶用Evernote越多,得到的個性化用戶體驗就越好。長期來講,也是一個可以增加用戶黏性的特點。

Facebook:大數據主要用于外部廣告精準投放和內部交流

Facebook有一個超過30人的團隊花了近4年的時間才建立了Facebook的數據處理平臺。如今,Facebook仍需要超過100名工程師來支持這個平臺的日常運行。可想而知,光是大數據分析的基礎設施就已經是一個耗時耗力的項目了。

Facebook的一大價值就在于其超過13.5億活躍用戶每天發布的數據。而其大數據部門經過七八年的摸索,才在2013年把部門的keyfoundation定位成廣告的精準投放,開始建了一整套自己的數據處理系統和團隊。并進行了一系列配套的收購活動,比如買下世界第二大廣告平臺Atlas。

目前公司超過30%的團隊,包括工程師、ProductManagers、BusinessAnalysts等多個職位人群每個月都一定會使用這項服務。這個數據處理平臺的建立讓各個不同部門之間可以通過數據容易地交流,明顯改變了公司的運行方式。

小扎克在2013年第一季度戰略時提到的最重點就是公司的大數據方向,還特別提出不對盈利做過多需求,而是要求基于大數據來做好以下三個功能:

·發布新的廣告產品。比如類似好友,管理特定好友和可以提升廣告商精確投放的功能。

·除與Datalogix,Epsilon,Acxiom和BlueKai合作外,以加強廣告商定向投放廣告的能力。

·通過收購AtlasAdvertisingSuite,加強廣告商判斷數字媒體廣告投資回報率(ROI)。

LinkedIn:大數據如何直接支持銷售和變現賺錢

LinkedIn大數據部門的一個重要功用是分析挖掘網站上巨大的用戶和雇主信息,并直接用來支持銷售并變現。其最核心團隊商業分析團隊的總監SimonZhang說,現在國內大家都在討論云,討論云計算,討論大數據,討論大數據平臺,但很少有人講:我如何用數據產生更多價值,通俗點講,直接賺到錢。

但這個問題很重要,因為關系到直接收入。四年半前LinkedIn內所有用戶的簡歷里抽取出來大概有300萬公司信息,作為銷售人員不可能給每個公司都打電話,所以問題來了:哪家公司應該打?打了后會是個有用的call?

銷售們去問Simon,他說只有通過數據分析。而這個問題的答案在沒有大數據部門之前這些決策都是拍腦袋想象的。

Simon和當時部門僅有的另外三個同事寫出了一個模型后發現:真正買LinkedIn服務的人,在決定的那個環節上,其實是一線的產品經理,和用LinkedIn在上面獵聘的那些人。但他們做決策后是上面的老板簽字,這是一個迷惑項。數據分析結果出來后,他們銷售人員改變投放策略,把目標群體放在這些中層的管理人身上,銷售轉化率瞬間增加了三倍。

今天LinkedIn的“獵頭”這塊業務占據了總收入的60%。是怎么在四年里發展起來的,他透露當時建造這個模型有以下這么幾個步驟:

1.分析每個公司它有多少員工。

2.分析這個公司它招了多少人。

3.分析人的位置功能職位級別一切參數,這些都是我們模型里面的各種功能。

4.然后去分析,他們內部有多少HR員工,有多少負責獵頭的人,他們獵頭的流失率,他們每天在Linkedin的活動時間是多少。

這是LinkedIn大數據部門最早做的事情。

Simon講,公司內部從大數據分析這一個基本項上,可以不斷迭代出新產品線。LinkedIn的三大商業模型是人才解決方案、市場營銷解決方案和付費訂閱,也是我們傳統的三大收入支柱。事實上我們還有一個,也就是第四個商業模型,叫“銷售解決方案”,已經在今年7月底上線。這是賣給企業級用戶的。LinkedIn大數據系統是一個牛逼的模型,只需要改動里面一下關鍵字,或者一個參數,就可以變成另一個產品。“我們希望能幫到企業級用戶,讓他們在最快的速度里知道誰會想買你的東西。”

Google:一個閉環的大數據生態圈

2011年,Google推出了基于Google基礎架構為客戶提供大數據的查詢服務和存儲服務的BigQuery,有點類似于Amazon的AWS,雖然目前從市場占有率上看與AWS還不在一個數量級,但價格體系更有優勢。Google通過這個迎上了互聯網公司拼服務的風潮,讓多家第三方服務中集成了BigQuery可視化查詢工具。搶占了大數據存儲和分析的市場。

BigQuery和GAE(GoogleAppEngine)等Google自有業務服務器構建了一個大數據生態圈,程序創建,數據收集,數據處理和數據分析等形成了閉環。再來看Google的產品線,搜索,廣告,地圖,圖像,音樂,視頻這些,都是要靠大數據來支撐,根據不同種類數據建立模型進行優化來提升用戶體驗提升市場占有率的。

單獨說一下Googlemaps,這個全球在移動地圖市場擁有超過40%的市場占有率的產品,也是美國這邊的出行神器。它幾乎標示了全球有互聯網覆蓋的每個角落,對建筑物的3D視覺處理也早在去年就完成,這個數據處理的工作量可能是目前最大的了,但這也僅限于數據集中的層面。真正的數據分析和挖掘體現在:輸入一個地點時,最近被最多用戶采用的路徑會被最先推薦給用戶。

Google還把Google+,Panoramio和其他Google云平臺的圖片進行了標記和處理,將圖片內容和地理位置信息地結合在一起,圖像識別和社交系統評分處理后,Google能夠把質量比較高的的圖片推送給用戶,優化了用戶看地圖時的視覺感受。

大數據為Google帶來了豐厚的利潤,比如在美國你一旦上網就能感覺到時無處不在的Google廣告(AdSense)。當然,它是一把雙刃劍,給站長們帶來收入的同時,但如何平衡用戶隱私的問題,是大數據處理需要克服的又一個技術難關,或許還需要互聯網秩序的進一步完善去支持。

除Facebook等幾個很領先的公司外,大部分公司要么還沒有自行處理數據的能力。最后附上兩個例子,想說這邊的大公司沒有獨立大數據部門也是正常的,采取外包合作是普遍現象:

Pinterest:

Pinterest曾嘗試自行通過AmazonEMR建立數據處理平臺,但是因為其穩定性無法控制和數據量增長過快的原因,最終決定改為使用Qubole提供的服務。在Qubole這個第三方平臺上,Pinterest有能力處理其0.7億用戶每天所產生的海量數據,并且能夠完成包括ETL、搜索、adhocquery等不同種類的數據處理方式。盡管Pinterest也是一個技術性公司,也有足夠優秀的工程師來建立數據處理團隊,他們依然選擇了Qubole這樣的專業團隊來完成數據處理服務。

Nike:

不僅僅硅谷的互聯網公司,眾多傳統企業也逐漸開始使用大數據相關技術。一個典型的例子就是Nike。Nike從2012年起與API服務公司Apigee合作,一方面,他們通過Apigee的API完善公司內部的數據管理系統,讓各個部門的數據進行整合,使得公司內部運行更加順暢、有效率。另一方面,他們也通過API開發NikeFuelBand相關的移動產品。更是在2014年開啟了Nike+FuelLab項目,開放了相關API,使得眾多的開放者可以利用Nike所收集的大量數據開發數據分析產品,成功地連接了Nike傳統的零售業務,新的科技開發,和大數據價值。

 

中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統
  • 工業電源
  • 電力電子
  • 工業互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0