人工智能已經成為時下最熱門的風口,各行各業的公司都在試圖通過該技術提升工作效率和競爭優勢。
在芯片領域,輝達作為領先的硬件生產商,影響力不可忽視。此前,美銀美林集團在一份報告中表示,輝達將會成為人工智能芯片的主導供貨商,該公司正在創造人工智能計算行業的標準。
除了輝達之外,過去兩年出現了一批人工智能芯片創業企業,他們都躍躍欲試地想要成為下一個輝達,不過,但真正的競爭可能來自AMD、谷歌這樣的老牌企業,以及一批中國AI芯片公司。
當下的中國,人工智能已經上升到國家戰略。根據2017年7月國務院印發的《新一代人工智能發展規劃》,2020年,中國人工智能的戰略目標是,技術和應用與世界先進水平同步,人工智能產業成為新的重要經濟增長點,核心產業規模超過1500億元,帶動相關產業規模超過1兆元。
那么,趕上世界東風的中國AI芯片公司如今發展如何?他們能在多大程度上與輝達形成競爭?
輝達:AI芯片市場領導者
輝達無疑是AI芯片市場中無可爭議的領導者。2017年,輝達可謂是風光無限。從游戲、數據中心到人工智能,市場對輝達芯片的需求一路上升。
由于深度學習對計算速度的要求是「暴力」的,輝達GPU芯片可以讓大量處理器并行運算,速度比CPU快十倍甚至幾十倍,因而成為絕大部分人工智能研究者和開發者的必備「核彈」。
《財經天下周刊》的消息稱,國內搞AI創業的人幾乎全在用輝達GPU和平臺,一個小型AI創業團隊在輝達芯片上花費幾十萬元很正常。
硅谷明星投資人AndreessenHorowitz也透露:「我們投資了一大串各個領域做深度學習的創業公司,每一個都跑在輝達的平臺上。」
受此影響,輝達的股價也一路飆升,從2015年的20美元漲到如今的逾220美元,漲幅超1000%,市值已突破1300億美元。
除了在芯片行業居于前列,輝達在游戲顯卡、自動駕駛領域也很活躍。
在近期舉行的2018年CES展會上,輝達發布了最新65英寸高端游戲顯示器,宏碁、華碩和惠普將利用其技術規格與標準作為4KHDR顯示器進行生產。這種超大型的顯示器搭載G-Sync,很適合高端游戲PC產品。
在自動駕駛方面,輝達創始人黃仁勛于美國西部時間1月7日晚在拉斯韋加斯召開記者會,宣布與福斯以及Uber的重大合作項目。黃仁勛還透露,輝達目前在自動駕駛領域已經擁有超過320家合作企業和機構。
輝達在人工智能領域的強大實力可見一斑。
AI芯片追趕者:Intel、AMD、谷歌
輝達也并非是GPU領域的唯一巨頭,Intel、AMD和谷歌也有著不可忽視的優勢。
在半導體市場,Intel多年來一直占據「龍頭」地位。然而,人工智能的崛起使得這家全球最大的個人計算機零件和CPU制造商正遭受著嚴峻的挑戰。在此壓力下,Intel選擇通過「強強聯合」的方式來回擊。
2017年12月,相爭50多年的Intel和AMD宣布將連手推出一款結合英特爾處理器和AMD圖形單元的筆記本計算機芯片,一時間業內嘩然。
芯謀研究總監王笑龍認為:「如果Nvidia在個人計算機GPU上營收減少,那么Nvidia在新市場的開發就會被牽制,所以Intel選擇和AMD合作。」
數據研究機構Gartner的研究主管AlanPriestley也認為,Intel和AMD的合作將會對Nvida產生一些影響,「目前Intel和AMD聯合推出的這款芯片的應用領域也正是NvidiaGPU的應用領域。很明顯,Intel處理器已經滲入到這個領域內,并且通過新款芯片,AMD也會在這一領域內獲得立足點。」
除此之外,第二梯隊的谷歌也在試圖引發新的顛覆。
2016年,谷歌宣布將獨立開發一種名為TPU的全新處理系統。該系統是專門為機器學習應用而設計的專用芯片。透過降低芯片的計算精度,減少實現每個計算操作所需的晶體管數量,從而能讓芯片的每秒運行的操作個數更高,讓經過精細調優的機器學習模型就能在芯片上運行得更快。與CPU、GPU相比,TPU效率提高了15-30倍,效能提升了30-80倍。
崛起中的國產AI芯片廠商
隨著「中國制造2025」、「網絡強國」等重大戰略的實施,中國芯片企業也在迅速發展,其實力不可小覷。
寒武紀科技
寒武紀是全球第一個成功流片并擁有成熟產品的AI芯片公司,擁有終端AI處理器IP和云端高性能AI芯片兩條產品線。2016年發布的寒武紀1A處理器(Cambricon-1A)是世界首款商用深度學習專用處理器,該產品還入選第三屆世界網絡大會(烏鎮)評選的十五項「世界網絡領先科技成果」。
寒武紀的團隊則源自中國科學院計算技術研究所,后者是中國第一個專門從事計算器科學技術綜合性研究的國立學術機構,聯想、曙光等一批高技術企業就誕生自該所,目前它也是寒武紀科技的重要股東和產學研長期合作伙伴。
2017年8月,寒武紀科技完成1億美元A輪融資,由國投創業,阿里巴巴創投、聯想創投、國科投資、中科圖靈、元禾原點、涌鏵投資聯合投資。本輪融資后,該公司躋身「獨角獸」行列。
華為
2017年的數據顯示,華為已經成為中國第一大、全球第三大智能型手機制造商。但華為在研發手機的同時,也在研發人工智能處理器。
2017年9月,在柏林IFA展上,華為正式對外發布了最新的麒麟970芯片,這也是華為首款人工智能(AI)芯片。該芯片首次采用臺積電10nm工藝,與高通最新的驍龍835芯片是一個工藝,但集成55億個晶體管遠比高通的31億顆、蘋果A10的33億顆多,帶來的是功耗降低20%。
據了解,麒麟970在繼承過去數代成果的基礎上,首次集成NPU(NeuralNetworkProcessingUnit)專用硬件處理單元,創新設計了HiAI行動計算架構,其AI性能密度大幅優于CPU和GPU。
同年10月,搭載麒麟970的華為Mate10開賣,成為目前市面上第一款搭載AI芯片的智能型手機。
深鑒科技
深鑒科技公司由四位畢業于清華大學和史丹佛大學的科技人員于2016年創立,是一家專注深度學習處理器解決方案的人工智能科技公司,致力于深度學習處理器與編譯程序原創技術的研發,從而讓所有算法開發者都能便捷使用。
2017年10月,深鑒科技公布了其芯片計劃。官方信息表示,由深鑒自主研發的芯片「聽濤」、「觀海」將在2018年第第三季推出,其中,「聽濤」系列芯片采用臺積電28納米制程,核心使用深鑒自己的亞里士多德架構,峰值性能1.1瓦4.1TOPS,預計將于上半年完成產品裝載。
此外,深鑒科技也公布了深度神經網絡開發工具包——「DNNDK」,這是一個深度學習軟件開發工具包,旨在簡化和加速深度學習應用程序的開發。該產品不僅極大降低DPU平臺深度學習應用開發門坎和部署難度,還能夠大大縮短算法部署到硬件的周期,實現AI行業產品研發過程極致提速。深鑒科技CEO姚頌說,DNNDK是國內首個深度學習開發工具包,可以對標輝達TensorRT。
由于其在AI領域的突出優勢,2017年10月深鑒科技宣布完成最新一輪4000萬美金融資,由螞蟻金服、三星電子領投,招商局創投、華創資本跟投。此前,該公司分別于2016年5月和2017年5月完成了天使輪、A輪融資。
地平線機器人
2015年,前百度研究院副院長余凱創立地平線機器人,并開啟了研究高難度的、基于深度神經網絡算法的處理器芯片的道路。
時隔兩年半,地平線機器人于2017年12月20日宣布推出旗下的兩款嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝影機。
其中,面向智能駕駛的嵌入式人工智能視覺芯片被命名為「征程(Journey)1.0處理器」,該芯片支持高性能的L2ADAS系統;能夠同時對行人、機動車、車道線、交通標示牌、紅綠燈等8類目標進行準備的實時檢測與識別。
而面向攝影機的視覺芯片被命名為「旭日(Sunrize)1.0處理器」,它集合了地平線的深度學習算法,可廣泛應用于智能安防、智能城市等場景。
這兩款處理器采用關注模型(AttentionEngine)+認知模型(CognitionEngine)的數據處理流模式,可將芯片的計算速度提升10倍以上。
余凱還透露,地平線將會在2018年推出下一代面向自動駕駛的征程處理器。
2017年10月,地平線機器人完成了近億美元A+輪融資,本輪融資由英特爾投資領投,嘉實投資聯合投資,其他投資方包括現任股東晨興資本、高瓴資本、雙湖投資和線性資本。
比特大陸
據公開信息,比特大陸成立于2013年,目前在全球擁有超過1000名員工,分布在北京、臺灣、北美等地區。該公司目前芯片出貨量達數十億,在全球建立了百億次計算的數據中心。
2017年11月,比特大陸公布了該公司人工智能品牌SOPHON(「算豐」),并帶來了全球首款張量加速計算芯片BM1680,以及板卡SC1/SC1+、智能影音分析服務器SS1等產品。
據悉,BM1680是一款面向深度學習應用的張量計算加速處理的專用定制芯片,適用于CNN、RNN、DNN等深度神經網絡的推理預測和訓練。
按照規劃,比特大陸將于2018年發布第2代算豐AI芯片BM1682,計算能力將大幅提升,后續還將陸續發布第三代、第四代。湯煒偉表示,按照規劃每隔9個月左右就會推出新的算豐AI芯片,而再過一兩代,比特大陸有信心在深度學習推理上超過GPU的實際性能。
2017年9月,比特大陸被曝將從IDG資本、紅杉資本等風投公司募得5000萬美元,以提升其在主流投資者中的地位。
Thinkforce
據Thinkforce官網信息,2017年,這家公司由芯片設計、算法軟件、系統開發領域的資深專家創立,該公司立志于設計融合一流AI算法和先進制成工藝,并以此構建人工智能硬件平臺,提供一站式行業應用解決方案。
2017年12月,Thinkforce宣布完成由依圖科技、云鋒基金、紅杉資本、高瓴資本的4.5億元A輪融資。
同時,Thinkforce還公布了其計劃推出的AI芯片特點:基于業界先進的半導體制程工藝,采用自主研發的微內核ManyCore架構,能完成AI云虛擬化調度在芯片級的實現。此架構將AI云的彈性計算和調度提升一個量級,類似CPU的虛擬化給云端運算的彈性調度帶來成倍的成本節約。同時,該技術結合自主研發的固件和TFDL軟件SDK能夠實現對于各類神經網絡模型的計算加速,相對于輝達主流計算卡能實現5倍以上的功耗和成本節省。
在資本和技術的雙重刺激下,中國的AI芯片業的未來將不可估量。