在AI大熱的2018年,ISSCC的人工智能芯片僅僅只有一個session,然而在2019年,除了machinelearning的session7,還帶了兩個半session:session14Machinelearning&DigitalLDO,和session24SRAM&Computation-in-Memory,并且一只腳邁進從來只有Intel/AMD等的超大司才能占據最大session2Processor(session1是全場報告PlenaryTalk)。
講到PlenaryTalk,ISSCC2019的第一演講嘉賓是——YannLeCun!第二嘉賓也是AI芯片發到手軟的Hoi-JunYoo。
毫不夸張的說,ISSCC2019中最大的明星就是AI,沒有之一。
從目前的已經發布的ISSCC2019的文章列表,我們可以看出新一年的AI芯片的三大主旨——
存內計算的競技場
自今年ISSCC上存內計算首次出現后,明年的ISSCC上的存內計算可謂大爆發。所謂存內計算,就是在馮諾依曼瓶頸出現的今天,將處理器和存儲器融合在一起,有效地避免受制于通信帶寬而導致的系統性能的下降。
今年的ISSCC后,小編還一度吐槽了一下存內計算(不以非馮為目的AI存儲器都是耍流氓?)。然而歷史的潮流總不會因為某些人的表演而停下。這不,ISSCC2019首次出現了超過1Mb容量的RRAM存內計算(神馬是RRAM,請點擊RAM的前世,今生,與未來),并可以實現多比特的CNN。相比于去年的單比特SRAM為主的設計,可以說該設計才是真正為突破馮諾伊曼瓶頸帶來了曙光。
另外,本次入圍ISSCC的大陸文章中,有兩篇皆為面向人工智能應用的存內計算設計,分別是來自清華大學的可變精度超高能效加速器。
以及來自東南大學與清華大學合作的“三明治”RAM,如果小編沒有猜錯BWN指的是BinaryWeightNetwork,即weight是2進制的架構。
值得指出的是,存內計算不僅出現在machinelearning領域,在處理器的其他應用領域被應用了起來,比如圖論(離散數學處理器?)等場合。
機器人帶來的新機遇
除去存內計算,ISSCC2019還給AI芯片指了一條新路。縱觀幾個AI芯片session,一個過去不曾出現但是今年開始不斷被重復的詞——Robot/Robotics。在Session17開篇就是有日本Sony公司帶來的invitedtalk。
在具體的科研成果展示中,Intel帶來了面向多機器人協同系統中,小型機器人的通用芯片。
而佐治亞理工帶來了面向群體機器人(swarmrobotics)高能效計算計算平臺。
這里可以科普一下,群體機器人就是一群機器人。
密西根大學還帶來了一個SLAM(simultaneouslocalizationandmapping,即時定位和地圖構建)處理器。SLAM作為視覺機器人/VR-AR的核心功能,典型使用方式是讓機器人在某個空間內走一走,然后就能構建出空間,如下圖所示。(電影版《盜墓筆記》中,裘德考就是用了幾十個小型無人機,遠程構建了蛇母陵的3D結構,理論上這就是SLAM)。
傳統的SLAM是依靠ARM+IPU實現,但是隨著與CNN結合,智能化的SLAM對于處理器的要求不斷提高,GPU已經逐漸進入SLAM的硬件需求。
此次出現的即是CNN和SLAM專用結合的模式。
先定一個小目標,10TOPS還是TOPS/W
除了聚焦新技術之外,唯性能至上的ISSCC也不斷在尋求數字系統上的性能突破。在ISSCC2019上,若要靠性能可以一展風采,在性能上幾乎都得看齊10TOPS甚至是10TOPS/W的數量級。芯片性能的提升手段可以是令人乍舌的新工藝,或者是善用矩陣的稀疏性等等。
值得指出的是,其實上述在存內計算或者是智能機器人芯片中的許多設計都滿足了這個小目標。