9月7日,由中國工程院信息與電子工程學(xué)部主辦、浪潮集團(tuán)承辦的AICC中國人工智能計(jì)算大會在北京舉行,海內(nèi)外數(shù)十位知名專家分享了AI在互聯(lián)網(wǎng)、云計(jì)算、超算等眾多行業(yè)的創(chuàng)新實(shí)例。在現(xiàn)場,機(jī)器之能采訪到英偉達(dá)全球副總裁暨中國區(qū)企業(yè)事業(yè)總經(jīng)理沈威,與其就當(dāng)前人工智能芯片市場以及英偉達(dá)的底氣展開了探討,沈威表示:「除GPU天生適合深度學(xué)習(xí)這一任務(wù)以外,英偉達(dá)的CUDA計(jì)算平臺是決勝的關(guān)鍵。」
不可否認(rèn),GPU為深度學(xué)習(xí)的大規(guī)模應(yīng)用奠定了硬件基礎(chǔ)。然而,隨著人工智能時(shí)代的到來,深度學(xué)習(xí)技術(shù)專用芯片之爭也愈發(fā)火熱。芯片巨頭英特爾大量收購人工智能相關(guān)公司,研發(fā)人工智能專用芯片,站臺FPGA,并已與很多垂直領(lǐng)域的企業(yè)進(jìn)行合作;谷歌研制了基于硬件定義編程架構(gòu)的TPU;曾是英偉達(dá)重要客戶的微軟也開始為自己的數(shù)據(jù)中心研發(fā)基于FPGA的可重復(fù)編程AI芯片。此外,一些專業(yè)的人工智能公司,如科大訊飛等,也在研發(fā)適合自身業(yè)務(wù)的專用芯片。
GPU、FPGA、ASIC是AI芯片市場打得火熱的三種架構(gòu),其中GPU是當(dāng)前的主流。與CPU相比,GPU在硬件架構(gòu)上擁有更多的計(jì)算單元,使其成為AI芯片的天然選擇;FPGA即現(xiàn)場可編程門陣列,是一種軟件定義的架構(gòu),開發(fā)者可以通過編程定義片上單元的功能;ASIC代指為專門目的而設(shè)計(jì)的集成電路,將功能燒制到芯片上,適合較為穩(wěn)定的解決方案,且產(chǎn)品升級難度較大,但功耗較低。目前,F(xiàn)PGA和ASIC還處于試驗(yàn)階段,有能力使用FPGA的人工智能廠家并不多,絕大部分的AI芯片市場依然被英偉達(dá)占領(lǐng),生態(tài)的構(gòu)建并不容易,F(xiàn)PGA與ASIC的AI之路也任重而道遠(yuǎn)。
在其他廠家積極開拓新戰(zhàn)場時(shí),英偉達(dá)仍然堅(jiān)信「GPU天生適合深度學(xué)習(xí)任務(wù)」。9月7日,英偉達(dá)全球副總裁、中國區(qū)企業(yè)事業(yè)總經(jīng)理沈威在AICC上與機(jī)器之能就這一話題進(jìn)行了討論。沈威認(rèn)為,英偉達(dá)CUDA運(yùn)算平臺是關(guān)鍵,CUDA讓GPU的計(jì)算能力得以釋放,讓普通的程序員也能用JAVA、C++等編程語言在GPU上工作。
以下為采訪實(shí)錄,機(jī)器之能做了不改變原意的整理:
人工智能芯片戰(zhàn)場愈發(fā)火熱,不論芯片廠商還是AI領(lǐng)域的垂直公司都在試圖搶占市場。這是是否英偉達(dá)的AI戰(zhàn)略造成影響?現(xiàn)在再提GPU是深度學(xué)習(xí)芯片的唯一霸主是否不再合適?
從2012年谷歌的李飛飛教授開啟ImageNet以來,我們很開心看到GPU在人工智能市場的接受度很高,同時(shí)我們也看到很多跟隨者。不過我覺得這是一件好事,首先,這意味著這些公司中的任何一家,對人工智能、深度學(xué)習(xí)這件事情都非常認(rèn)同。不過我們在高性能運(yùn)算、人工智能領(lǐng)域已經(jīng)投入了很多年,具有先發(fā)優(yōu)勢。從歷史的發(fā)展來看,深度學(xué)習(xí)為什么要用英偉達(dá)的GPU?因?yàn)樯疃葘W(xué)習(xí)與高性能計(jì)算關(guān)系非常密切,深度學(xué)習(xí)任務(wù)中涉及到大量的運(yùn)算,這是英偉達(dá)非常擅長的事情。
剛才我們說的是硬件方面,硬件很多半導(dǎo)體廠商都在做。但他們都忽略了一點(diǎn),就是平臺。我們的CUDA運(yùn)算平臺從2006年開始開放,到現(xiàn)在已經(jīng)是第9代,CUDA將GPU的高性能運(yùn)算能力開放給一般的程序員。雖然半導(dǎo)體工藝是與時(shí)俱進(jìn)的,但如果沒有好的編程環(huán)境,技術(shù)人員們還是很難迎接這次深度學(xué)習(xí)的浪潮。這就間接回答了你的問題。不論哪家公司,可能他們在市場上也已經(jīng)有很長時(shí)間了,但我個人認(rèn)為,它的編程語言還不能針對數(shù)據(jù)中心的海量數(shù)據(jù)進(jìn)行更便利地編程。大家可能看到,在深度學(xué)習(xí)時(shí)代,英偉達(dá)進(jìn)行了一次面向人工智能的轉(zhuǎn)型,但其實(shí)我們早已鋪墊好相關(guān)能力。
現(xiàn)在GPU、FPGA、ASIC這三種架構(gòu)都能完成深度學(xué)習(xí)任務(wù),你對這三種架構(gòu)的優(yōu)劣勢作何評價(jià)?
深度學(xué)習(xí)主要分為線下訓(xùn)練和線上推理,目前在線下訓(xùn)練用戶無一例外地都在使用GPU加速他們的訓(xùn)練過程。不僅僅是因?yàn)镚PU的運(yùn)算速度快,更重要是英偉達(dá)建立了一個完善的生態(tài)系統(tǒng),我們提供了許多SDK來加速所有深度學(xué)習(xí)框架,并和這些框架深度集成,如cuDNN、NCCL、cuBLAS等。在線上推理方向,英偉達(dá)目前的方案是TensroRT加低功耗的NVIDIATeslaP4GPU加速器。現(xiàn)在國內(nèi)各大云服務(wù)提供商都在使用TeslaP4做線上推理,包括科大訊飛。
事實(shí)上,深度學(xué)習(xí)遠(yuǎn)沒有成熟,每天都在變化演進(jìn)、迭代,GPU目前還是最佳選擇。ASIC是一種專用芯片,它是為了某種特定需求而專門定制的芯片,目前還不能與GPU這樣擁有很成熟生態(tài)的通用芯片同日而語。FPGA的生態(tài)系統(tǒng)才剛剛開始,道路還很漫長。
英偉達(dá)在無人駕駛和智能家居方面推出了自己的專用芯片,是否意味著英偉達(dá)看重這兩個應(yīng)用領(lǐng)域?更廣闊的例如金融、醫(yī)療方面為何沒有專用芯片的布局?
GPU天生解決深度學(xué)習(xí)問題,人工智能本身和人腦有很多類似的地方,需要眼睛看,腦子想。英偉達(dá)希望在GPU最擅長、最深耕的視覺運(yùn)算上發(fā)力,因此英偉達(dá)在自動駕駛和嵌入式端布局了兩種產(chǎn)品。其他領(lǐng)域我們也非常地看好,金融、醫(yī)療、制造是國內(nèi)外爆發(fā)增長的幾個GPU應(yīng)用點(diǎn),在這些領(lǐng)域我們有很多的合作伙伴。英偉達(dá)處在整個IT生態(tài)圈中,我們必須要跟不同行業(yè)的公司進(jìn)行合作。
目前英偉達(dá)的生態(tài)圈中,有哪些比較堅(jiān)實(shí)的合作伙伴?
我們有不同層次的合作伙伴。一種是跟服務(wù)器廠商的合作,因?yàn)樵谟布用鎲螁螢橛脩籼峁〨PU,用戶是沒有辦法使用的,浪潮,曙光,華為等都是我們的合作伙伴;還有就是行業(yè)解決方案層面,在一個整機(jī)做好之后,可能會需要針對不同行業(yè),例如醫(yī)療、制造業(yè)等等進(jìn)行優(yōu)化,以適合客戶不同的應(yīng)用場景,在這個層面科大訊飛、商湯都是我們的合作伙伴,我們叫SolutionPartner。
這些合作伙伴做得都很好,因?yàn)樯疃葘W(xué)習(xí)才剛剛開始,很少有人在用過CUDA開發(fā)環(huán)境之后說不喜歡英偉達(dá)。因?yàn)槟悴豢赡茏约簭牧汩_始寫一些函數(shù)庫、優(yōu)化庫,我倒是很好奇,不用英偉達(dá)的人他們要怎么做。深度學(xué)習(xí)解決方案提供商們在算法和數(shù)據(jù)方面都有自己的努力,但是如果沒有我們GPU的加速,他們的更新迭代和開發(fā)速度就會大大降低,走向市場的周期也會被拉長,所以我們也是幫助他們更快走向市場的必不可少的要素。
現(xiàn)在有很多中小企業(yè)或高校實(shí)驗(yàn)室不能負(fù)擔(dān)大規(guī)模的GPU集群,英偉達(dá)是否想要爭取這一部分市場?
其實(shí)我們也有關(guān)注到這一方面。我們和全世界很多大公司一樣,會和很多高校合作教育、培訓(xùn)相關(guān)的項(xiàng)目,現(xiàn)在非常多高校在他們的計(jì)算中心里面有GPU集群,并且我們也有合作開設(shè)相關(guān)課程。另一方面,我相信大家也注意到了云計(jì)算的發(fā)展,現(xiàn)在國內(nèi)幾家領(lǐng)先的云服務(wù)廠商都已經(jīng)用到了英偉達(dá)非常多GPU,所以他們也提供非常多基于GPU的方案。對于不想自己買設(shè)備的廠家來說,我覺得云服務(wù)是一種選擇。云是一種趨勢,能夠更快捷地惠及新的開發(fā)者、新的初創(chuàng)公司。