時間:2024-03-12 13:41:23來æºï¼šè™•芯ç©å¾‹
è¿‘æœŸçš„å…¨åœ‹æ”¿å”æœƒè°ä¹Ÿè«‡åˆ°äº†é€™å€‹---“人工智能已經æˆç‚ºåœ‹å®¶é–“科技競çˆçš„å¿…çˆä¹‹åœ°ã€‚è¦æ·±å…¥æŒ–掘國產AIèŠ¯ç‰‡ç®—åŠ›æ½›åŠ›ï¼ŒåŠ é€ŸæŽ¨å‹•åœ‹ç”¢æ“ä½œç³»çµ±ç™¼å±•ï¼Œå¤¯å¯¦äººå·¥æ™ºèƒ½ç™¼å±•ç®—åŠ›åº•åº§ï¼ŒåŠ©æŽ¨æ–°è³ªç”Ÿç”¢åŠ›è·‘å‡ºåŠ é€Ÿåº¦â€ã€‚所以我們談下AI芯片。
作為專為AI計算需求而è¨è¨ˆåˆ¶é€ 的集æˆé›»è·¯ï¼ŒAI芯片ä¸åƒ…驿–°äº†è¨ˆç®—機處ç†ä¿¡æ¯çš„æ–¹å¼ï¼Œæ›´åœ¨åœ–åƒè˜åˆ¥ã€èªžéŸ³è˜åˆ¥ã€è‡ªç„¶èªžè¨€è™•ç†ã€è‡ªå‹•é§•é§›ç‰å¤šå€‹å‰æ²¿é ˜åŸŸç™¼æ®äº†è‡³é—œé‡è¦çš„作用。
AI芯片的基本概念
AI芯片,也稱作AIåŠ é€Ÿå™¨æˆ–æ™ºèƒ½èŠ¯ç‰‡ï¼Œæ˜¯ä¸€ç¨®ç‰¹åˆ¶çš„å¾®è™•ç†å™¨ï¼Œå°ˆé–€ç‚ºé«˜æ•ˆé‹è¡Œäººå·¥æ™ºèƒ½ç®—法而è¨è¨ˆã€‚ä¸åŒäºŽå‚³çµ±çš„CPUã€GPUç‰é€šç”¨è™•ç†å™¨ï¼ŒAI芯片致力于解決AI應用ä¸çš„å¤§è¦æ¨¡å¹¶è¡Œè¨ˆç®—å•題,尤其是é‡å°ç¥žç¶“網絡模型的密集型數å¸é‹ç®—,如矩陣乘法ã€å·ç©æ“作和激活函數計算ç‰ã€‚這種高度定制化的è¨è¨ˆæ¥µå¤§åœ°æå‡äº†è¨ˆç®—效率,é™ä½Žäº†èƒ½è€—,并實ç¾äº†å¯¦æ™‚響應和高性能推ç†èƒ½åŠ›ã€‚
AI芯片的技術原ç†èˆ‡æž¶æ§‹
人工神經網絡模型 AIèŠ¯ç‰‡çš„æ ¸å¿ƒåŽŸç†åŸºäºŽäººå·¥ç¥žç¶“網絡,其ä¸èŠ¯ç‰‡å…§éƒ¨çš„è™•ç†å–®å…ƒæ¨¡æ“¬äº†ç”Ÿç‰©ç¥žç¶“元的工作機制。æ¯ä¸€å€‹è™•ç†å–®å…ƒèƒ½å¤ ç¨ç«‹é€²è¡Œå¾©é›œçš„æ•¸å¸é‹ç®—,例如權é‡ä¹˜ä»¥è¼¸å…¥ä¿¡è™Ÿå¹¶ç´¯åŠ ï¼Œå½¢æˆç¥žç¶“元的激活輸出。激活函數則決定了信號如何轉化為有æ„ç¾©çš„çµæžœï¼Œå®ƒæ˜¯AI芯片ä¸ä¸å¯æˆ–缺的一部分。
硬件架構 AIèŠ¯ç‰‡çš„ç¡¬ä»¶æž¶æ§‹å¤šç¨®å¤šæ¨£ï¼Œæ ¹æ“šå…¶è¨è¨ˆç›®æ¨™å’Œæ‡‰ç”¨å ´æ™¯ï¼Œå¯åˆ†ç‚ºä»¥ä¸‹å¹¾é¡žï¼š
GPU(圖形處ç†å™¨ï¼‰: GPU原本主è¦ç”¨äºŽåœ–å½¢æ¸²æŸ“ï¼Œä½†å› å…¶å¹¶è¡Œè¨ˆç®—èƒ½åŠ›å¼·ï¼Œè¢«å»£æ³›ç”¨äºŽè¨“ç·´å¤§åž‹æ·±åº¦å¸ç¿’æ¨¡åž‹ï¼Œå°¤å…¶æ“…é•·è™•ç†æµ®é»žæ•¸å¯†é›†åž‹è¨ˆç®—任務。
FPGA(ç¾å ´å¯ç·¨ç¨‹é–€é™£åˆ—): FPGAå…·æœ‰é«˜åº¦éˆæ´»çš„å¯ç·¨ç¨‹æ€§ï¼Œèƒ½å¤ 在硬件層é¢å¿«é€Ÿé‡æ–°é…ç½®ä»¥é©æ‡‰ä¸åŒçš„AI算法,é©ç”¨äºŽæ—©æœŸé–‹ç™¼éšŽæ®µå’Œå‹•æ…‹å·¥ä½œè² è¼‰çš„å ´æ™¯ã€‚
ASIC(專用集æˆé›»è·¯ï¼‰: ASIC是為特定AI任務定制的芯片,相較于GPUå’ŒFPGA,它在特定應用ä¸çš„計算效率更高,能耗更低,但缺ä¹é€šç”¨æ€§ã€‚
TPU(張é‡è™•ç†å–®å…ƒï¼‰: Google推出的TPU是專門é‡å°æ©Ÿå™¨å¸ç¿’任務è¨è¨ˆçš„ASIC實例,專注于高效的矩陣é‹ç®—,尤其é©åˆTensorFlow框架下的深度å¸ç¿’模型。
AIèŠ¯ç‰‡çš„åˆ†é¡žèˆ‡å¸‚å ´æ‡‰ç”¨
AI芯片廣泛應用于å„å€‹é ˜åŸŸï¼ŒåŒ…æ‹¬ä½†ä¸é™äºŽï¼š
1ã€è‡ªå‹•駕駛:AIèŠ¯ç‰‡èƒ½å¤ å¯¦æ™‚è™•ç†è»Šè¼›å‚³æ„Ÿå™¨æ”¶é›†çš„æ•¸æ“šï¼Œå¯¦ç¾ç²¾ç¢ºçš„導航和決ç–,æé«˜è‡ªå‹•駕駛的安全性和å¯é 性。
2ã€æ™ºèƒ½å®‰é˜²ï¼šAI芯片å¯ç”¨äºŽè¦–é »ç›£æŽ§ã€äººè‡‰è˜åˆ¥ç‰å®‰é˜²é ˜åŸŸï¼Œæé«˜å®‰å…¨ç›£æŽ§çš„æ•ˆçŽ‡å’Œæº–ç¢ºæ€§ã€‚
3ã€æ™ºèƒ½å®¶å±…:AIèŠ¯ç‰‡èƒ½å¤ æ”¯æŒæ™ºèƒ½å®¶å±…è¨å‚™çš„æ™ºèƒ½åŒ–控制和管ç†ï¼Œæå‡å±…ä½é«”驗。
4ã€é†«ç™‚å¥åº·ï¼šAI芯片å¯ç”¨äºŽé†«ç™‚å½±åƒåˆ†æžã€ç–¾ç—…診斷ç‰é ˜åŸŸï¼Œè¼”助醫生進行精準治療。
國內AI芯片ç¾ç‹€ä»¥åŠæœªä¾†æŒ‘戰
國內AIèŠ¯ç‰‡å¸‚å ´è¿‘å¹´ä¾†ç™¼å±•è¿…çŒ›ï¼Œæ¶Œç¾å‡ºäº†ä¸€æ‰¹å…·æœ‰å‰µæ–°èƒ½åŠ›å’Œå¸‚å ´ç«¶çˆåŠ›çš„ä¼æ¥ï¼Œå…¶ä¸ä¸€äº›çŸ¥å的包括è¯ç‚ºã€å¯’æ¦ç´€ã€åœ°å¹³ç·šã€ç™¾åº¦ç‰ï¼Œåœ‹å¤–有英å‰é”ç‰ï¼Œä¸‹é¢åˆ†åˆ¥åˆ—舉了æ¯å€‹å…¬å¸çš„一款芯片的介紹:
è¯ç‚ºæµ·æ€çš„æ˜‡é¨°910
é”芬奇架構
架構:基于é”芬奇架構è¨è¨ˆ
制程工è—:7nm
æ ¸å¿ƒæ•¸é‡ï¼šé…備有大é‡AICoreï¼ˆäººå·¥æ™ºèƒ½å…§æ ¸ï¼‰ï¼Œä¾‹å¦‚æåˆ°çš„256個AICore
性能指標:åŠç²¾åº¦ï¼ˆFP16)算力:高é”256TeraFLOPS(æ¯ç§’è¬å„„次浮點é‹ç®—)
整數精度(INT8)算力:å¯é”512 TeraOPS(æ¯ç§’è¬å„„次整數é‹ç®—)
支æŒé«˜é€Ÿå…§å˜æŽ¥å£å’Œé€šé“,比如128通é“å…¨é«˜æ¸…è¦–é »ç·¨è§£ç¢¼èƒ½åŠ›
最大功耗:約為350瓦
寒æ¦ç´€çš„æ€å…ƒ370
MLUæž¶æ§‹
架構:MLUarch03
算力:最高256 TOPS(INT8),64 TOPS(FP16)
制程工è—:7nm
性能指標:最大算力高é”256TOPS(INT8精度)
集æˆçš„æ™¶é«”管數é‡ï¼š390億個
å…§å˜æ”¯æŒï¼šæ”¯æŒLPDDR5å…§å˜
æ‡‰ç”¨å ´æ™¯ï¼šé©ç”¨äºŽäº‘計算數據ä¸å¿ƒ
最大功耗: 250W
地平線的å¾ç¨‹5
地平線架構
å¾ç¨‹5:
æž¶æ§‹ï¼šé›™æ ¸BPUï¼šåœ°å¹³ç·šè‡ªç ”çš„ç¬¬äºŒä»£è²è‘‰æ–¯æž¶æ§‹ï¼Œå°ˆç‚ºAI計算優化。
算力:單顆芯片AI算力最高å¯é”128TOPSï¼Œèƒ½å¤ è™•ç†å¤§é‡çš„并行計算任務。
功耗:30W
å·¥è—:16nm
æ‡‰ç”¨å ´æ™¯ï¼šè‡ªå‹•é§•é§›ã€æ™ºèƒ½åº§è‰™ã€æ™ºèƒ½ç›£æŽ§ç‰è»Šè¼‰AI
百度昆侖芯片
昆侖架構
架構:百度昆侖2èŠ¯ç‰‡é‡‡ç”¨è‡ªç ”çš„ç¬¬äºŒä»£XPU架構,這是一種é‡å°AI計算進行了深度優化的架構è¨è¨ˆï¼Œèƒ½å¤ é«˜æ•ˆåŸ·è¡Œå¤§è¦æ¨¡å¹¶è¡Œè¨ˆç®—任務,特別é©åˆæ·±åº¦å¸ç¿’和機器å¸ç¿’算法的處ç†ã€‚
算力:INT8整數精度算力é”到256TeraOPS(æ¯ç§’è¬å„„次整數é‹ç®—)。
åŠç²¾åº¦ï¼ˆFP16)算力為128 TeraFLOPS(æ¯ç§’è¬å„„次浮點é‹ç®—)。
功耗:最大120W
å·¥è—: 7nm。
æ‡‰ç”¨å ´æ™¯ï¼šç™¾åº¦æ˜†ä¾–2芯片é©ç”¨äºŽäº‘ã€ç«¯ã€é‚Šç‰å¤šå ´æ™¯çš„AI計算需求。
英å‰é”H100
Nvidia H100SM
架構:Hopper架構
算力:FP64為67TFLOPS;
FP32為989TFLOPS;
FP16為1979TFLOPS;
BF16為1979TFLOPS;
INT8為3958TFLOPS
功耗:700W
å·¥è—:4nm
æ‡‰ç”¨å ´æ™¯ï¼šæ©Ÿå™¨å¸ç¿’ã€æ·±åº¦å¸ç¿’訓練和推ç†ã€ç§‘å¸è¨ˆç®—æ¨¡æ“¬ã€æ•¸æ“šåˆ†æžã€è‡ªç„¶èªžè¨€è™•ç†ç‰
å¯ä»¥çœ‹å‡ºï¼Œç›¡ç®¡åœ‹å…§AI芯片在è¨è¨ˆå’Œæ‡‰ç”¨ä¸Šå–得了一定的æˆå°±ï¼Œä½†èˆ‡è‹±å‰é”ç‰åœ‹éš›é ˜å…ˆä¼æ¥ç›¸æ¯”,ä»å˜åœ¨ä¸€å®šçš„æ€§èƒ½å·®è·ã€‚國內AI芯片還é¢è‡¨è‘—一系列關éµçš„æŒ‘戰:
1ã€æŠ€è¡“å£å£˜èˆ‡æ ¸å¿ƒå°ˆåˆ©ï¼šåœ¨é«˜ç«¯èŠ¯ç‰‡è¨è¨ˆã€EDA工具ã€IPæ ¸ä»¥åŠå…ˆé€²åˆ¶é€ å·¥è—ç‰æ–¹é¢ï¼Œæˆ‘åœ‹ä¼æ¥èˆ‡åœ‹éš›é ˜å…ˆæ°´å¹³ç›¸æ¯”å˜åœ¨å·®è·ï¼Œå°¤å…¶æ˜¯åœ¨7nmåŠä»¥ä¸‹çš„先進制程上,å°å¤–國先進技術和è¨å‚™çš„ä¾è³´åº¦è¼ƒé«˜ï¼Œé‚„é¢è‡¨è¢«åˆ¶è£çš„風險。
2ã€å¸‚å ´ç«¶çˆèˆ‡å“牌èªçŸ¥ï¼šé›–ç„¶åœ‹å…§å¸‚å ´è¯ç‚ºç‰å» å•†å½±éŸ¿åŠ›è¼ƒå¤§ï¼Œä½†åœ¨åœ‹éš›å¸‚å ´ä¸Šï¼Œè‹±å‰é”ã€è‹±ç‰¹çˆ¾ã€AMDç‰å…¬å¸åœ¨AIèŠ¯ç‰‡é ˜åŸŸé‚„æ˜¯å æ“šäº†ä¸»å°Žåœ°ä½ï¼Œä¸åœ‹ä¼æ¥è¦åœ¨å…¨çƒèŒƒåœå…§å»ºç«‹å“牌影響力和客戶信任度尚需時日。
3ã€äººæ‰å„²å‚™èˆ‡åŸ¹é¤Šï¼šé«˜ç«¯AIèŠ¯ç‰‡ç ”ç™¼å’Œè¨è¨ˆéœ€è¦å¤§é‡å°ˆæ¥äººæ‰ï¼Œæ¶‰åŠçš„å°ˆæ¥æŠ€è¡“è¦†è“‹å»£æ³›ï¼ŒåŒ…æ‹¬é›†æˆé›»è·¯è¨è¨ˆã€ç®—æ³•å„ªåŒ–ã€ææ–™ç§‘å¸ç‰ï¼Œè€Œä¸åœ‹åœ¨äººæ‰åŸ¹é¤Šå’Œå¼•進方é¢é‚„需進一æ¥åŠ å¼·ï¼Œä»¥æ”¯æ’產æ¥çš„é•·é 發展。
éš¨è‘—åœ‹å…§ä¼æ¥çš„䏿–·åŠªåŠ›å’Œå‰µæ–°ï¼Œç›¸ä¿¡æœªä¾†é€™ä¸€å·®è·æœƒé€æ¼¸ç¸®å°ã€‚åŒæ™‚ï¼Œåœ‹å®¶ä¹Ÿæ‡‰åŠ å¤§å°AI芯片產æ¥çš„æ”¯æŒåŠ›åº¦ï¼ŒæŽ¨å‹•åœ‹å…§AI芯片產æ¥çš„快速發展。
上一篇:EtherCATé‹å‹•控制器在ROS上的...
ä¸‹ä¸€ç¯‡ï¼šé›»æ± å……é›»å™¨çš„åå‘電壓ä¿è·æ›¿...
ä¸åœ‹å‚³å‹•網版權與å…è²¬è²æ˜Žï¼šå‡¡æœ¬ç¶²æ³¨æ˜Ž[來æºï¼šä¸åœ‹å‚³å‹•ç¶²]的所有文å—ã€åœ–片ã€éŸ³è¦–å’Œè¦–é »æ–‡ä»¶ï¼Œç‰ˆæ¬Šå‡ç‚ºä¸åœ‹å‚³å‹•ç¶²(www.hysjfh.com)ç¨å®¶æ‰€æœ‰ã€‚如需轉載請與0755-82949061è¯ç³»ã€‚任何媒體ã€ç¶²ç«™æˆ–å€‹äººè½‰è¼‰ä½¿ç”¨æ™‚é ˆæ³¨æ˜Žä¾†æºâ€œä¸åœ‹å‚³å‹•ç¶²â€ï¼Œé•å者本網將追究其法律責任。
本網轉載并注明其他來æºçš„稿件,å‡ä¾†è‡ªäº’è¯ç¶²æˆ–æ¥å…§æŠ•稿人士,版權屬于原版權人。轉載請ä¿ç•™ç¨¿ä»¶ä¾†æºåŠä½œè€…ï¼Œç¦æ¢æ“…自篡改,é•è€…è‡ªè² ç‰ˆæ¬Šæ³•å¾‹è²¬ä»»ã€‚
相關資訊