時間:2024-03-13 16:44:00來源:21ic電子網
一、什么是通用人工智能(AGI)?
通用人工智能(Artificial General Intelligence,簡稱AGI)是指擁有與人類相當甚至超過人類智能的人工智能類型。通用人工智能不僅能像人類一樣進行感知、理解、學習和推理等基礎思維能力,還能在不同領域靈活應用、快速學習和創造性思考。
1 AGI發展綜述
1.1 AGI的概念
AGI通用人工智能,也稱強人工智能(Strong AI),指的是具備與人類同等甚至超越人類的智能,能表現出正常人類所具有的所有智能行為。
ChatGPT是大模型發展量變到質變的結果,ChatGPT具備了一定的AGI能力。隨著ChatGPT的成功,AGI已經成為全球競爭的焦點。
與基于大模型發展的AGI對應的,傳統的基于中小模型的人工智能,也可以稱為弱人工智能。它聚焦某個相對具體的業務方面,采用相對中小參數規模的模型,中小規模的數據集,然后實現相對確定、相對簡單的人工智能場景應用。
1.2 AGI特征之一:涌現
“涌現”,并不是一個新概念。凱文·凱利在他的《失控》中就提到了“涌現”,這里的“涌現”,指的是眾多個體的集合會涌現出超越個體特征的某些更高級的特征。
在大模型領域,“涌現”指的是,當模型參數突破某個規模時,性能顯著提升,并且表現出讓人驚艷的、意想不到的能力,比如語言理解能力、生成能力、邏輯推理能力等等。
對外行(比如作者自己)來說,涌現能力,可以簡單的用“量變引起質變”來解釋:隨著模型參數的不斷增加,終于突破了某個臨界值,從而引起了質的變化,讓大模型產生了許多更加強大的、新的能力。
如果想詳細了解大模型“涌現”能力的詳細分析,可以參閱谷歌的論文《Emergent Abilities of Large Language Models》。
當然,目前,大模型發展還是非常新的領域,對“涌現”能力的看法,也有不同的聲音。例如斯坦福大學的研究者對大語言模型“涌現”能力的說法提出了質疑,認為其是人為選擇度量方式的結果。詳見論文《Are Emergent Abilities of Large Language Models a Mirage?》。
1.3 AGI特征之二:多模態
每一種信息的來源或者形式,都可以稱為一種模態。例如,人有觸覺、聽覺、視覺等;信息的媒介有文字、圖像、語音、視頻等;各種類型的傳感器,如攝像頭、雷達、激光雷達等。多模態,顧名思義,即從多個模態表達或感知事物。而多模態機器學習,指的是從多種模態的數據中學習并且提升自身的算法。
傳統的中小規模AI模型,基本都是單模態的。比如專門研究語言識別、視頻分析、圖形識別以及文本分析等單個模態的算法模型。
基于Transformer的chatGPT出現之后,之后的AI大模型基本上都逐漸實現了對多模態的支持:
首先,可以通過文本、圖像、語音、視頻等多模態的數據學習;
并且,基于其中一個模態學習到的能力,可以應用在另一個模態的推理;
此外,不同模態數據學習到的能力還會融合,形成一些超出單個模態學習能力的新的能力。
多模態的劃分是我們人為進行劃分的,多種模態的數據里包含的信息,都可以被AGI統一理解,并轉換成模型的能力。在中小模型中,我們人為割裂了很多信息,從而限制的AI算法的智能能力(此外,模型的參數規模和模型架構,也對智能能力有很大影響)。
1.4 AGI特征之三:通用性
從2012年深度學習走入我們的視野,用于各類特定應用場景的AI模型就如雨后春筍般的出現。比如車牌識別、人臉識別、語音識別等等,也包括一些綜合性的場景,比如自動駕駛、元宇宙場景等。每個場景都有不同的模型,并且同一個場景,還有很多公司開發的各種算法和架構各異的模型。可以說,這一時期的AI模型,是極度碎片化的。
而從GPT開始,讓大家看到了通用AI的曙光。最理想的AI模型:可以輸入任何形式、任何場景的訓練數據,可以學習到幾乎“所有”的能力,可以做任何需要做的決策。當然,最關鍵的,基于大模型的AGI的智能能力遠高于傳統的用于特定場合的AI中小模型。
完全通用的AI出現以后,一方面我們可以推而廣之,實現AGI+各種場景;另一方面,由于算法逐漸確定,也給了AI加速持續優化的空間,從而可以持續不斷的優化AI算力。算力持續提升,反過來又會推動模型向更大規模參數演進升級。
2 專用和通用的關系
牧本波動(Makimoto's Wave)是一個與摩爾定律類似的電子行業發展規律,它認為集成電路有規律的在“通用”和“專用”之間變化,循環周期大約為10年。也因此,芯片行業的很多人認為,“通用”和“專用”是對等的,是一個天平的兩邊。設計研發的產品,偏向通用或偏向專用,是基于客戶場景需求,對產品實現的權衡。
但從AGI的發展來看,基于大模型的AGI和傳統的基于中小模型的專用人工智能相比,并不是對等的兩端左右權衡的問題,而是從低級智能升級到高級智能的問題。我們再用這個觀點重新來審視一下計算芯片的發展歷史:
專用集成電路ASIC是貫穿集成電路發展的一直存在的一種芯片架構形態;
在CPU出現之前,幾乎所有的芯片都是ASIC;但在CPU出現之后,CPU迅速的取得了芯片的主導地位;CPU的ISA包含的是加減乘除等最基本的指令,也因此CPU是完全通用的處理器。
GPU最開始的定位是專用的圖形處理器;自從GPU改造成了定位并行計算平臺的GP-GPU之后,輔以幫助用戶開發的CUDA的加持,從而成就了GPU在異構時代的王者地位。
隨著系統復雜度的增加,不同客戶系統的差異性和客戶系統的快速迭代,ASIC架構的芯片,越來越不適合。行業逐漸興起了DSA的浪潮,DSA可以理解成ASIC向通用可編程能力的一個回調,DSA是具有一定編程能力的ASIC。ASIC面向具體場景和固化的業務邏輯,而DSA則面向一個領域的多種場景,其業務邏輯部分可編程。即便如此,在AI這種對性能極度敏感的場景,相比GPU,AI-DSA都不夠成功,本質原因就在于AI場景快速變化,但AI-DSA芯片迭代周期過長。
從長期發展的角度看,專用芯片的發展,是在給通用芯片探路。通用芯片,會從各類專用計算中析取出更加本質的足夠通用的計算指令或事務,然后把之融合到通用芯片的設計中去。比如:
CPU完全通用,但性能較弱,所以就通過向量和張量等協處理器的方式,實現硬件加速和性能提升。
CPU的加速能力有限,于是出現了GPU。GPU是通用并行加速平臺。GPU仍然不是性能最高的加速方式,也因此,出現了Tensor Core加速的方式。
Tensor Core的方式,仍然沒有完全釋放計算的性能。于是,完全獨立的DSA處理器出現。
上一篇:安裝工業機器人共分幾步?
下一篇:開關電源維修方法步驟
中國傳動網版權與免責聲明:凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
產品新聞
更多>2025-06-16
2025-06-09
2025-06-06
2025-05-19
2025-04-30
2025-04-11