時間:2024-01-15 17:20:43來æºï¼šAIOT大數據
這個話題很大,涉åŠé¢éžå¸¸å¯¬æ³›ï¼Œè€Œä¸”䏿˜¯ç´”技術å•題,相關的çˆè°ä¹ŸåŒæ¨£éžå¸¸å¤šã€‚
和我éŽåŽ»å¯«çš„æ–‡ç« ä¸€æ¨£ï¼Œæˆ‘çš„è§€é»žä¸€èˆ¬ä¹Ÿæ¯”è¼ƒæ¿€é€²ï¼Œå„ä½çœ‹å®˜è«‹é…Œæƒ…食用。
è¬å—é•·æ–‡é è¦?。?ï¼é€™å€‹è©±é¡Œéžå¸¸å¤§ï¼Œä½†å¯¦åœ¨ä¸æƒ³æ‹†æˆå¤šç¯‡äº†ï¼Œä¹Ÿå°±ä¸€å£æ°£è¬›å®Œäº†ã€‚
â€œç”Ÿæ…‹â€æœ¬èº«å°±æ˜¯å€‹å¾ˆå¯¬æ³›çš„è©žï¼Œç”Ÿæ…‹æœ¬èº«çš„å®šç¾©å¾ˆå®¹æ˜“é™·å…¥æ–‡å—æ¸¸æˆ²çš„范疇。「我今天更多從一些公èªçš„æ¨™çš„物出發去討論生態競çˆçš„底層é‚輯?ï¼?/span>
例如:
深度å¸ç¿’框架PyTorchã€
ç®—å編程CUDAã€
系統層編程語言C/C++ã€
算法應用層編程語言Pythonã€
甚至包括C/C++ç‚ºä¸»çš„é …ç›®çš„æ§‹å»ºç³»çµ±cmakeç‰ï¼Œ
èŠ¯ç‰‡å´æ¨™é…也是NVidia GPUã€
Intelçš„x86æœå‹™å™¨ã€
GPU之間通信的NVLinkã€
CPU和GPU之間的PCIe。
這些基本都是公èªçš„æ“æœ‰ä¸€å®šç”Ÿæ…‹çµ±æ²»åŠ›çš„è»Ÿä»¶ã€ç¡¬ä»¶ã€å”è°ï¼Œé€™äº›çµ„件組åˆåˆ°ä¸€èµ·ï¼Œå…±åŒå½¢æˆäº†æ•´å¥—行æ¥å…§æœ€æ¨™æº–化的體系。
這套體系實際上是自計算機誕生以來æŒçºŒè¿ä»£æ¼”進至今的一套事實標準組æˆçš„體系,其ä¸å¾ˆå¤šçµ„件都具有æ·å²çš„åŽšé‡æ„Ÿã€‚
整個體系ä¸å±¬äºŽä»»ä½•一個組織,是全行æ¥å¤šå¹´ç«¶çˆåšå¼ˆåŽçš„çµæžœï¼Œä½†åŒæ™‚,åšå¼ˆä¸çš„å‹è€…ä¹Ÿéƒ½æ“æœ‰æ•´å€‹é«”ç³»ä¸æŸä¸€ç”Ÿæ…‹ä½çš„話語權。
整個體系åˆå¤§å¤§å°å°çš„å„ç¨®ç”Ÿæ…‹ä½æ§‹æˆï¼Œç”Ÿæ…‹ä½ä¹‹é–“相互ä¾è³´ï¼Œã€Œæ¯å€‹ç”Ÿæ…‹ä½ä¸Šçš„組件既是其他生態ä½çš„æ‡‰ç”¨ã€ï¼Œéœ€è¦æ»¿è¶³ç›¸æ‡‰ç”Ÿæ…‹ä½çš„è¦å‰‡ï¼Œåˆçµ¦å…¶ä»–ç”Ÿæ…‹ä½æå»ºå¹³è‡ºï¼Œå¯ä»¥åˆ¶å®šç›¸æ‡‰çš„æ¸¸æˆ²è¦å‰‡ã€‚
「生態ä½çš„話語權并ä¸å–æ±ºäºŽèª°æ˜¯èª°çš„å¹³è‡ºï¼Œè€Œå–æ±ºäºŽéœ€æ±‚ã€ï¼Œä¾‹å¦‚NVidiaçš„GPUå義上ä»ç„¶æ˜¯Intel定義的“ä¸å¤®â€è™•ç†å™¨+å„種PCIe“從屬â€è¨å‚™æ¸¸æˆ²è¦å‰‡ä¸‹çš„“從屬â€è¨å‚™ï¼Œä½†ä»Šå¤©åœ¨AI的需求暴漲的情æ³ä¸‹ï¼Œã€ŒNVidia在這一塊的解決方案形態的定義上有著é è¶…Intel的話語權?ï¼?/span>
PyTorch雖然是基于C++å’ŒPython構建的深度å¸ç¿’框架,但C++å’ŒPythonèªžè¨€æœ¬èº«çš„æ¼”é€²ä¹Ÿå¾ˆé›£å°æ·±åº¦å¸ç¿’é ˜åŸŸæœ‰å¤šå¼·çš„è©±èªžæ¬Šã€‚
ã€Œç•¶ç„¶é€™ç¨®è©±èªžæ¬Šä¹Ÿå¹¶ä¸æ„味著å¯ä»¥ç‚ºæ‰€æ¬²ç‚ºï¼Œéœ€æ±‚本身也é™å®šäº†å„個掌æ¡äº†è©±èªžæ¬Šçš„玩家å¯ä»¥æŠ˜é¨°çš„邊界ã€ã€‚Intel雖然在傳統云ã€è™›æ“¬åŒ–ã€è™•ç†å™¨å®‰å…¨ã€åŒ…括PCIeã€CXLçš„æ¼”é€²ä¸Šæ“æœ‰å……分的折騰自由度,但在AIé ˜åŸŸåŸºæœ¬æ²’ä»€ä¹ˆè™Ÿå¬åŠ›ã€‚
åŒæ¨£ï¼ŒNVidia的折騰一定è¦èƒ½è§£æ±ºç›®å‰é«”系在AIé ˜åŸŸçš„å„é¡žç“¶é ¸å•題,漸進å¼åœ°è¬›æ•´å€‹é«”ç³»é€æ¼¸æ”¹é€ æˆä¸€å€‹æ›´åŠ é©ç”¨äºŽAI需求的整體解決方案。今天有很多人說NVidiaä¸åªæ˜¯ä¸€å®¶èŠ¯ç‰‡å…¬å¸ï¼Œæ›´æ˜¯ä¸€å®¶è»Ÿä»¶å…¬å¸ï¼Œæ˜¯ä¸€å®¶ç³»çµ±ç´šè§£æ±ºæ–¹æ¡ˆå…¬å¸ï¼ŒNVidia也æ£åœ¨æ‰“é€ å„è¡Œå„æ¥çš„æ•´é«”解決方案。
這些都是éž??陀^的評價,NVidiaäº‹å¯¦ä¸Šä¹Ÿç¢ºå¯¦ä¸æ–·åœç¹žGPUç”¢å“æ‰“é€ è¶Šä¾†è¶Šå¤šè¡Œæ¥çš„軟件解決方案,而且在很多垂直行æ¥éƒ½åšåˆ°äº†è€å¤§çš„地ä½?ï¼å‚…@并䏿„味著整體解決方案就是芯片競çˆçš„æœ‰æ•ˆé€”徑ã€ã€‚
「解決方案å¼çš„æ€ç¶æ˜¯ç›®å‰åœ¨èŠ¯ç‰‡é ˜åŸŸç«¶çˆæœ€å¸¸è¦‹çš„å‘ã€ã€‚
實際上解決方案å¼çš„ç”¢å“æ¨¡å¼æœ¬èº«å°±æ˜¯å·²ç¶“å–得生態統治力的玩家收割å„è¡Œå„æ¥çš„æ‰‹æ®µï¼Œã€Œæ˜¯æ§‹å»ºäº†ç”Ÿæ…‹çµ±æ²»åЛ之åŽçš„æžœï¼Œè€Œä¸æ˜¯ä»–們å–å¾—ç«¶çˆåŠ›çš„å› ã€ã€‚
ä»Šå¤©æœ‰ç„¡æ•¸å…¬å¸æŠŠç«¯åˆ°ç«¯è§£æ±ºæ–¹æ¡ˆç•¶ä½œå–å¾—ç«¶çˆåŠ›çš„æ–¹æ³•è«–ï¼Œä½†NVidiaé§•é¦çš„æ•´é«”è§£æ±ºæ–¹æ¡ˆæ˜¯ä¸Šè¿°äº‹å¯¦æ¨™æº–é«”ç³»ï¼Œè€Œå…¶ä»–çŽ©å®¶è‡ªå·±å¾žèŠ¯ç‰‡åˆ°è»Ÿä»¶å…¨æ£§æ‰“é€ è§£æ±ºæ–¹æ¡ˆï¼Œå¹¶æœŸæœ›é€šéŽè»Ÿç¡¬ä»¶æ•´é«”解決方案的競çˆåŠ›ä¾†æ§‹å»ºè‡ªå·±çš„ç”Ÿæ…‹ï¼Œå±¬å¯¦æžéŒ¯äº†å› 果。
äº‹å¯¦æ¨™æº–é«”ç³»å¯¦éš›ä¸Šéœ€è¦æ¥µå¼·çš„親和性,NVidiaçš„CUDA采用C/C++èªžè¨€æ“´å±•çš„å½¢å¼æ§‹å»ºï¼Œå¹¶ä¸”æ•´é«”è¨è¨ˆå°C/C++的編è¯ã€éˆæŽ¥ã€æ§‹å»ºã€èª¿è©¦ç‰é«”系具有更好的親和性,例如形å¼ä¸Šå…¼å®¹elfæ ¼å¼çš„object文件,兼容C/C++的整個函數調用和符號體系,最大化減少å°ç”¨æˆ¶é …目的侵入性。
這樣在一個復雜的C/C++é …ç›®ä¸ï¼Œåªæœ‰å’ŒGPU直接相關的代碼用nvccç·¨è¯å™¨ç·¨è¯ï¼Œå…¶ä»–代碼的編è¯ä»¥åŠæ•´å€‹é …ç›®çš„éˆæŽ¥å’Œæ§‹å»ºéƒ½åŽŸä¾†ç”¨å•¥é‚„ç”¨å•¥ã€‚é€™ç¨®å°C/C++的親和性實際上å°äºŽåˆ‡å…¥äº‹å¯¦æ¨™æº–體系是éžå¸¸é‡è¦çš„。
而今天CUDA已然æˆç‚ºäº‹å¯¦æ¨™æº–體系ä¸çš„ä¸€éƒ¨åˆ†ï¼Œæ–°çš„çŽ©å®¶å…¥å ´ï¼Œå°±ä¸æ¢è¦è€ƒæ…®C/C++的親和性,也一樣è¦è€ƒæ…®å°CUDA的親和性。
當然與哪些æ±è¥¿è¦ªå’Œå–決于è¦å¾žæ•´å€‹é«”系的大大å°å°ç”Ÿæ…‹ä½çš„什么ä½ç½®åˆ‡å…¥ï¼ŒNVidiaè¨è¨ˆCUDA時,深度å¸ç¿’還沒有起飛,C/C++也是高性能計算éžå¸¸ä¸»æµçš„å¹³è‡ºï¼Œé¸æ“‡å¾žC/C++åˆ‡å…¥è‡ªç„¶æ˜¯ç•¶æ™‚æœ€å„ªé¸æ“‡ã€‚
今天C/C++ä»ç„¶æ˜¯æœ€å„ªé¸æ“‡ä¹‹ä¸€ï¼Œä¸éŽæ·±åº¦å¸ç¿’在應用層也帶飛了Python,與Python親和也是今天一種å¯èƒ½çš„鏿“‡ï¼Œä½†åœ¨æ•´é«”è¨è¨ˆä¸Šå°±éœ€è¦è€ƒæ…®æ›´å¤šèˆ‡PythonåŠå…¶å‘¨é‚Šç”Ÿæ…‹çš„親和性。
åƒTVMé›–ç„¶é¸æ“‡äº†Python庫的形å¼ï¼Œä½†æ•´é«”上采用了Python寫編è¯å’Œå„ªåŒ–æµç¨‹é€™ç¨®å‘爹形å¼ï¼Œè‡ªç„¶è·ŸPython親和性完全扯ä¸ä¸Šé‚Šã€‚é€™é‡Œé¢æ²’æœ‰ä»€ä¹ˆæ¨™æº–ç”æ¡ˆï¼Œæˆæ•—全在細節之ä¸ï¼Œéœ€è¦å°å‘¨é‚Šç”Ÿæ…‹çš„親和性有極強的感知和ç†è§£ã€‚
å³ä½¿åƒTVM這種純軟件背景團隊的作å“甚至TensorFlow這種出自Googleé€™ç¨®é ‚ç´šè»Ÿä»¶å…¬å¸çš„作å“ï¼Œä¹Ÿå› ç‚ºç¼ºä¹é€™æ–¹é¢æ„è˜è€Œåœ¨ç”Ÿæ…‹ä¸Šå„種碰å£ã€‚
今天有無數微架構背景的架構師把編è¯å™¨ã€è»Ÿä»¶æ¡†æž¶ç•¶ä½œè¬é‡‘油,åªè‘—眼于最終的æ¥å‹™ï¼Œæœ€çµ‚åšå‡ºçš„產å“自然也和生態親和性相去甚é 。
這背åŽçš„細節把控其實無論軟件背景還是芯片背景都沒有å°å„ªå°åŠ£ï¼Œèƒ½åŒæ™‚清楚所有邊界上生態ä½çš„è¨è¨ˆç†å¿µæ‰æ˜¯æœ€é‡è¦çš„。
在今天AIé ˜åŸŸçš„è»Ÿä»¶ç”Ÿæ…‹å·²ç„¶åŒ…å«CUDAã€PyTorchç‰çµ„件構建的é¾å¤§é«”系,整個親和性的è¨è¨ˆå°±è®Šå¾—愈發困難,于是很多公å¸å°±èµ°ä¸Šäº†ç«¯åˆ°ç«¯æ•´é«”解決方案å¼çš„邪路。
芯片的算å編程語言åšä¸å¥½è¦ªå’Œæ€§ï¼Œå°±æŠŠä¸Šé¢å„種å¯èƒ½ç”¨åˆ°ç®—å編程語言的圖編è¯ã€æ·±åº¦å¸ç¿’æ¡†æž¶ã€æŽ¨ç†å¼•擎ã€ç”šè‡³å…·é«”æ¥å‹™å…¨éƒ½åšäº†ï¼Œä»¥æœŸæœ›æ¸›å°‘ç®—å編程語言親和性的å•題。
ä½†åŒæ™‚帶來的也有上層這些框架ã€å¼•擎與周邊生態的親和性。最åŽç‰äºŽæ˜¯ç‚ºäº†è§£æ±ºä¸€å€‹è¦ªå’Œæ€§å•é¡Œå‰µé€ äº†ç„¡æ•¸å€‹è¦ªå’Œæ€§å•é¡Œï¼Œåªæ˜¯åœ¨ä¸æ–·redirectå•題。
除了軟件棧之外,其他方é¢é¡žä¼¼çš„踩å‘ç°¡ç›´ä¸è¦å¤ªå¸¸è¦‹ï¼ŒèŠ¯ç‰‡æžä¸å¥½å°±åŒ…æˆæ•´æ©Ÿï¼Œæ•´æ©Ÿæžä¸å¥½å°±åŒ…æˆäº‘。最åŽé‚Šç•Œè¶Šæžè¶Šå¤§ï¼Œå‘¨é‚Šèˆ‡ä¹‹äº¤äº’的標準化生態ä½è¶Šæžè¶Šå¤šï¼Œè¦ªå’Œæ€§å•題基本就爆炸到無法解決了。
最åŽå¯¦éš›ä¸Šæ˜¯æ¸¸é›¢äºŽæ¨™æº–化體系之外的ç¨ç«‹é«”系。表é¢çœ‹èµ·ä¾†å’ŒNVidiaä¸€æ¨£åœ¨æ‰“é€ æ•´é«”è»Ÿç¡¬ä»¶è§£æ±ºæ–¹æ¡ˆï¼Œä½†NVidia是駕é¦è‘—äº‹å¯¦æ¨™æº–é«”ç³»ï¼Œè€Œä½ å¦‚æžœåªæ˜¯é§•é¦è‘—ä¸€å¥—æ¸¸é›¢äºŽæ¨™æº–åŒ–é«”ç³»ä¹‹å¤–çš„ç§æœ‰è§£æ±ºæ–¹æ¡ˆï¼Œå’Œäº‹å¯¦æ¨™æº–體系競çˆç„¡ç–‘是èšèœ‰æ’¼æ¨¹ã€‚
當然了,凡事都有例外,這種游離于標準化體系之外的解決方案在æŸäº›ç‰¹å®šçš„æ¥å‹™ä¸‹ä¹Ÿæ˜¯ä¸€ç¨®æ·å¾‘。極端一點的比如åƒç¤¦æ©Ÿï¼Œå› ç‚ºéœ€æ±‚è¶³å¤ å–®ä¸€ï¼Œè€Œä¸”å¸‚å ´è¦æ¨¡å·¨å¤§ï¼Œé€™æ™‚å€™æ‹‹é–‹ç¾æœ‰é«”系整個åšä¸€å¥—ç¨ç«‹çš„體系倒也是å¯ä»¥åˆ†ä¸€æ¯ç¾¹ã€‚
但無論如何,NVidiaé§•é¦è‘—事實標準體系競çˆåŠ›ä¹Ÿæ˜¯éžå¸¸å¼·æ‚çš„ï¼Œå¹¶ä¸”ä¹Ÿåœ¨ç¤¦æ½®æ™‚ç‹ ç‹ å¤§è³ºäº†ä¸€ç†ã€‚å°äºŽç¤¦è€æ¿è€Œè¨€ï¼Œç¤¦é›£äº†ç¤¦å¡ä¹Ÿå°±æ˜¯é›»å垃圾了,NVidia顯å¡é‚„能轉手翻新一下賣給游戲佬和AIå¸‚å ´ã€‚
å…¶ä»–å¸‚å ´ï¼Œæ¯”å¦‚å®‰é˜²æ”åƒé ã€è»Šè¼‰è‡ªå‹•駕駛芯片ç‰ç‰ï¼Œç›¸æ¯”ç¤¦æ©Ÿå¸‚å ´è‚¯å®šå·®ä¸å°‘,但好在需求還沒分化得特別嚴é‡ï¼Œä¹Ÿæœ‰è„«é›¢é«”系分一æ¯ç¾¹çš„空間。
到云端數據ä¸å¿ƒå°±åˆ¥æƒ³äº†ï¼Œå¾žè¨ˆç®—機發明至今多少巨é 共建的體系,æ¥å‹™éœ€æ±‚變化極快?ï¼è¦†è´¿^é€™ç¨®ç‰¹å®šå¸‚å ´åˆ†ä¸€æ¯ç¾¹é›–然有æ·å¾‘ï¼Œä¹ŸåŒæ¨£æ²’æ³•å»ºç«‹çœŸæ£æ„義上的生態統治力?ï¼?/span>
ä»Šå¤©ä½ å¯ä»¥èµ°æ·å¾‘æ‹¿åˆ°ä¸€å®šå¸‚å ´ï¼Œæ˜Žå¤©åˆ¥äººä¹Ÿå¯ä»¥èµ°æ·å¾‘æŠŠä½ çš„å¸‚å ´æ‹¿èµ°ã€‚ä»Šå¤©å®¢æˆ¶å¯ä»¥å…‹æœç”Ÿæ…‹çš„æ…£æ€§ä»˜å‡ºé·ç§»æˆæœ¬é·åˆ°ä½ 的自建體系上,明天也一樣å¯ä»¥é·åˆ°å…¶ä»–自建體系或者標準化體系上,走æ·å¾‘實際上也æ„味著和生態帶來的統治力和è·åŸŽæ²³ç„¡ç·£ã€‚
「解決方案層é¢çœŸå¯¦æœ‰æ•ˆçš„ç«¶çˆæ˜¯çˆå¥ªæ¨™æº–化體系內的話語權ã€ã€‚
這套體系里的æ¯ä¸€å€‹æ‰‹æ¡æ–¹å‘ç›¤ã€æŽŒæŽ§è‘—æŸä¸€å¡Šç”Ÿæ…‹ä½çš„çŽ©å®¶éƒ½å€ŸåŠ©è‡ªå·±çš„ç”Ÿæ…‹ä½æ ¹æ“šåœ°ï¼Œè©¦åœ–按照符åˆè‡ªå·±åˆ©ç›Šçš„æ–¹å¼æ¼¸é€²å¼æ”¹é€ æ•´å€‹æ¨™æº–åŒ–é«”ç³»ï¼Œã€ŒåŒæ™‚給競çˆå°æ‰‹ä½¿çµ†å?ï¼?/span>
「比如InteléŽåŽ»å¡è‘—PCIe帶寬的å‡ç´šé€Ÿåº¦ï¼Œè®“NVidiaçš„GPU始終å˜åœ¨å„ç¨®ç“¶é ¸ã€ï¼ŒåŒ…括今天Intel推出CXLä½œå‡ºä¸€å®šçš„è®“åˆ©ï¼Œå¸Œæœ›åœ˜çµæ›´å¤šçŽ©å®¶ä¸€èµ·æ‰“NVidia。
但這些都是已經æˆåŠŸä¸Šè»Šï¼Œæ‰‹æ¡æ–¹å‘盤的玩家之間的事情,沒有上車的玩家連åƒèˆ‡é€™å€‹å±¤é¢ç«¶çˆçš„è³‡æ ¼éƒ½æ²’æœ‰ï¼Œæ‰“é€ è‡ªå»ºçš„æ•´é«”è§£æ±ºæ–¹æ¡ˆåªæ˜¯ç‡Ÿé€ 了一種自己在車上的虛幻感。
其實NVidia本身也是生態競çˆçš„æ¥µä½³æ¡ˆä¾‹ï¼Œä½†å¸ç¿’NVidiaä¸èƒ½å…‰çœ‹äººå®¶ä»Šå¤©å¤§å£åƒè‚‰å°±æœ‰æ¨£å¸æ¨£ï¼Œæ›´é‡è¦çš„å而是éŽåŽ»30年里,NVidia怎么從車下的nobodyæˆåŠŸä¸Šè»Šï¼Œå¹¶ä¸”æ‹¿åˆ°äº†é«”ç³»é‡Œé¢ä¸€å€‹è¶³å¤ 大生態ä½çš„æ–¹å‘盤。
這個尺度應該拉長到30年這個尺度去看NVidia如何在生態競çˆçš„æ®˜é…·é‚輯里實ç¾äº†ä¸Šè»ŠæŽŒæ¡æ–¹å‘盤的壯舉。生態競çˆçš„é‚輯無比殘酷,事實標準往往會給大家一種錯覺,就是計算機系統似乎就應該是這樣的,éŽäºŽè‡ªç„¶è€Œç„¶äº†ï¼Œå¾žè€Œä½¿å¾ˆå¤šäººä½Žä¼°äº†ç”Ÿæ…‹ç«¶çˆçš„æ®˜é…·æ€§ï¼Œèªç‚ºè€é»ƒåªæ˜¯æœ‰è¶…å‡ºå¸¸äººçš„ç›´è¦ºå’Œå …æŒè³å°äº†è³½é“。
ã€Œå¯¦éš›ä¸Šå»ºç«‹è³½é“æœ¬èº«å°±æ˜¯å£¯èˆ‰ï¼Œåªä¸éŽå»ºç«‹æˆåŠŸäº†ï¼Œè®“äººè¦ºå¾—ä¼¼ä¹Žæœ¬ä¾†å°±æ‡‰è©²å˜åœ¨é€™æ¨£çš„è³½é“ã€ã€‚放到今天,我們會覺得計算機系統里自然而然就需è¦ä¸€å¡Šç¨ç«‹é¡¯å¡ï¼Œå› 為CPU的集æˆé¡¯å¡æ€§èƒ½å¤ªå·®äº†ï¼Œåªèƒ½æ»¿è¶³ä¸ä½Žç«¯éœ€æ±‚。但放到NVidia剛æˆç«‹çš„那個年代,這件事情å¯ä¸é€™ä¹ˆé¡¯ç„¶ã€‚
NVidia當時作為一個nobody,實際上需è¦ç«¶çˆçš„并䏿˜¯å·²ç¶“å˜åœ¨çš„幾百家顯å¡å…¬å¸ï¼Œè€Œæ˜¯ç•¶æ™‚整個標準化體系的王牌駕駛員Intel。
Intel作為車上的駕駛員,掌æ¡è‘—制訂游戲è¦å‰‡çš„æ¬ŠåŠ›ï¼Œè€ŒIntel制訂的游戲è¦å‰‡å°±æ˜¯å®ƒè‡ªå·±çš„產å“CPU作為“ä¸å¤®â€è™•ç†å™¨ï¼Œã€Œé€šéŽPCIe擴展的形å¼ï¼Œè®“åœç¹žCPU的整個計算機系統變得éžå¸¸å…·æœ‰å¯æ“´å±•性,å¯ä»¥åœç¹žCPUæ‰“é€ å„è¡Œå„æ¥çš„解決方案?ï¼?/span>
而這套游戲è¦å‰‡çš„æ®˜é…·ä¹‹è™•在于,一旦一種PCIeè¨å‚™çš„需求變得穩定,Intel就在CPUé‡Œå¢žåŠ ä¸€äº›å°ˆç”¨æŒ‡ä»¤ï¼ŒäºŽæ˜¯é€™ç¨®PCIeè¨å‚™å°±å¾žæ·å²é•·æ²³ä¸æŠ¹åŽ»äº†ï¼Œé€™ç¨®æ–¹å¼æ¶ˆå¤±çš„å„類PCIe擴展å¡ä¸è¨ˆå…¶æ•¸ï¼Œé¡¯å¡åœ¨é€™å¥—游戲è¦å‰‡ä¸‹ä¹Ÿå¹¶ä¸ä¾‹å¤–。
生態競çˆçš„æ®˜é…·å¯¦éš›ä¸Šæ˜¯é‹å‹•å“¡å’Œè£åˆ¤çš„ç«¶çˆã€‚任何一種新興需求都有潛力催生一些新的生態ä½ï¼Œä½†æ¸¸æˆ²è¦å‰‡çš„å®šåˆ¶è€…æœƒå»ºç«‹ä¸€å¥—è®“è‡ªå·±ç«‹äºŽä¸æ•—之地的è¦å‰‡ã€‚
生態競çˆéœ€è¦è‡ºä¸‹çš„nobodyæ§‹é€ ä¸€å€‹åœ¨é€™æ¨£ä¸€å€‹é«”ç³»å…§æ‰“é€ å¹¶å®ˆä½ç¨ç«‹ç”Ÿæ…‹ä½çš„æˆ°ç•¥ã€‚這個說實話,沒有å¯å¾©åˆ¶çš„路徑,ä¸åŒæ™‚間節點下標準化體系的形態是完全ä¸ä¸€è‡´çš„,ä¸åŒçš„需求和生態ä½å°ç”Ÿæ…‹è¦ªå’Œæ€§çš„è¦æ±‚,包括å¯ä»¥å€ŸåŠ›çš„é»žä¹Ÿæ˜¯å®Œå…¨ä¸ä¸€è‡´çš„。
如果沒有è€é»ƒå°äºŽé€™å ´ç«¶çˆæ·±åˆ»çš„æ´žå¯ŸåŠ›ï¼Œä»¥åŠç›¸æ‡‰çš„æˆ°ç•¥ï¼Œé¡¯å¡ä¹Ÿä¸€æ¨£æœƒæ¶ˆå¤±åœ¨æ·å²çš„é•·æ²³ä¸ã€‚è€é»ƒç•¶æ™‚æ„è˜åˆ°é€™å€‹å•題åŽï¼Œã€Œæå‡ºäº†Intel的摩爾定律是å八個月翻一番,NVidiaè¦åšåˆ°å…個月翻一番。用更快的性能æå‡æ›²ç·šå¿«é€Ÿæ‹‰é«˜éœ€æ±‚,讓Intel的集顯變æˆè½åŽçš„產å“ã€ã€‚于是NVidia把顯å¡è¶Šåšè¶Šå¤§ï¼ŒåŠŸè€—è¶Šåšè¶Šé«˜ï¼Œæ€§èƒ½æ‹‰å‡çš„幅度也é è¶…Intel,從而讓游戲畫質æå‡é£›å¿«ï¼Œå°Žè‡´Intel的集顯疲于去追NVidia的節å¥ï¼Œé¢ç©å’ŒåŠŸè€—å„æ–¹é¢éƒ½æ‰¿å—巨大的壓力。
「最終,ç¨ç«‹é¡¯å¡åœ¨Intel的游戲è¦å‰‡ä¸‹æˆç‚ºäº†äº‹å¯¦æ¨™æº–,NVidia也å¡ä½äº†æ¸¸æˆ²å¡é€™å€‹ä¸å¤§ä¸å°çš„生態ä½ã€ã€‚
但è€é»ƒé€™å¥—ç«¶çˆé‚輯,其實沒有直接借鑒的å¯èƒ½æ€§ï¼Œä»Šå¤©é¡¯å¡çš„ç”Ÿæ…‹ä½æ—©æˆç‚ºäº‹å¯¦æ¨™æº–ä¸çš„一環。我們å³ä½¿å¸æœƒäº†æ€Žä¹ˆåœ¨Intelçš„è¦å‰‡ä¸‹æ‰“Intel也沒有什么æ„ç¾©äº†ï¼Œå› ç‚ºæ™‚éŽå¢ƒé·ï¼Œä»Šå¤©åˆ¶è¨‚è¦å‰‡çš„變æˆäº†NVidia,「實際上æ¯å€‹å± é¾å°‘年都會æˆç‚ºæ–°çš„æƒ¡é¾ï¼Œä»–們的æˆåŠŸä¹ŸåŒæ™‚å µæ»äº†å°æ‡‰ç”Ÿæ…‹ä½çš„åŽä¾†è€…?ï¼?/span>
今天è¦çˆå–的是AI這個需求。è€é»ƒé€™å¥—打法背åŽçš„æ€æƒ³ï¼Œæ‰æ˜¯çœŸæ£å€¼å¾—å€Ÿé‘’çš„ï¼Œä½†å¦‚ä½•å› åœ°åˆ¶å®œåœ¨ç¾å¦‚今的情形下用好,也是極具挑戰性的。AIèŠ¯ç‰‡é€™å€‹å½¢æ…‹ä¸æ˜¯æ—¢æˆäº‹å¯¦ï¼Œè€Œæ˜¯éœ€è¦é AI芯片這個賽é“的“è€é»ƒâ€åŽ»çˆå–這個賽é“çš„ç¨ç«‹æ€§çš„,å¦å‰‡NVidiaçš„GPGPU就會把AIèŠ¯ç‰‡é€™å€‹è³½é“æ‰“æˆæ›‡èб䏀ç¾çš„形態,而GPGPU會生態ä½ä¹Ÿæœƒç¹¼çºŒæ“´å¤§åˆ°AIçš„æ•´å€‹é ˜åŸŸã€‚
éŽåŽ»å年,幾乎沒有人把NVidiaçš„GPGPU襯托æˆAI需求下的è½åŽç”¢å“,大家甚至在åšç”¢å“è¦åŠƒçš„æ™‚å€™ï¼Œä¹Ÿæ˜¯å°æ¨™è‘—自己產å“上市的時間點,去é ä¼°NVidia的產å“è¦æ ¼ã€‚
本質上是沿著和è€é»ƒä¸€æ¨£çš„æ›²ç·šåŽ»èµ°ï¼Œè‡ªç„¶ä¹Ÿä¸å¯èƒ½æŠŠè€é»ƒçš„ç”¢å“æžæˆè½åŽçš„產å“,也更ä¸å¯èƒ½çˆå–到ç¨ç«‹çš„生態ä½äº†ã€‚實際上大家產å“è¿ä»£çš„æ›²ç·šç”šè‡³æ¯”ä¸éŽNVidia,在16年那個時間節點宣傳的都是比NVidiaå¿«åå€ï¼Œåˆ°ä»Šå¤©é€™å€‹æ™‚é–“é»žå®£å‚³çš„ä¹Ÿåƒ…åƒ…æ˜¯å°æ¨™äº†ã€‚
åƒTPU這種產å“,其性能增長曲線甚至ä¸å¦‚NVidia。這種戰略æ„è˜çš„ç¼ºå¤±æœ¬èº«å°±æ˜¯è‡´å‘½çš„ã€‚èª ç„¶ï¼Œè®“èŠ¯ç‰‡æ€§èƒ½æå‡é€Ÿåº¦è¶…éŽNVidia也極具挑戰性,這ä¸åƒ…僅是æŸä¸€ä»£ç”¢å“æ¯”å®ƒé«˜å€‹å¤šå°‘ç™¾åˆ†æ¯”çš„æ€§èƒ½ï¼Œä¹Ÿä¸æ˜¯æ¯ä¸€ä»£éƒ½æ¯”NVidia高個多少百分比的性能。
而是NVidia基本2年一代產å“,性能æå‡3~5å€ï¼ŒæŒ‘戰者如果能æ¯ä»£ç›¸æ¯”自己上一代æå‡10~20å€ï¼Œå’ŒNVidiaçš„æ€§èƒ½å„ªå‹¢è¶Šæ‹‰è¶Šå¤§ã€‚é€™æ‰æ˜¯NVidia當年挑戰Intel時所作的壯舉,這å°äºŽèŠ¯ç‰‡è¨è¨ˆæœ¬èº«ä¹Ÿæ¥µå…·æŒ‘戰,但當年NVidia也是在摩爾定律演進的åŠå°Žé«”å·¥è—上走出了黃æ°å®šå¾‹å¢žé•·çš„GPU性能。
ã€Œç”Ÿæ…‹ç«¶çˆæœ€é›£çš„地方也在于沒有å¯å¾©åˆ¶çš„路徑。æ¯ä¸€å€‹æˆåŠŸå¾žé‹å‹•員翻身æˆç‚ºè£åˆ¤çš„玩家,本質上也都æˆåŠŸå»ºç«‹äº†æ–°çš„æ¸¸æˆ²è¦å‰‡ï¼Œå µæ»äº†åŽä¾†è€…ç«¶çˆé€™å€‹æ–°ç”Ÿæ…‹ä½çš„æ©Ÿæœƒ?ï¼?/span>
æ›å¥è©±è¬›ï¼Œæ¯ä¸€å€‹ç¿»èº«çš„æ¡ˆä¾‹éƒ½æ˜¯åœ¨ç‰¹å®šæ·å²æ™‚期,特定需求下,è¨è¨ˆä¸€å¥—超凡的戰略,并且é…åˆè¶…凡的戰術執行æ‰å®Œæˆçš„壯舉。這方é¢çš„å¾®æ“在今天實際上沒有任何ç¾å¯¦æ„義。而è€é»ƒä¸åƒ…完æˆäº†é€™æ¨£çš„壯舉,還完æˆäº†å…©æ¬¡ã€‚
NVidiaæˆç«‹çš„æœ€åˆå年,æˆåŠŸä¿ä½äº†ç¨ç«‹é¡¯å¡é€™å€‹ä¸å¤§ä¸å°çš„生態ä½ï¼Œä¹ŸæˆåŠŸä¸Šå¸‚ã€‚è€ŒIntel雖然沒能按æ»ç¨ç«‹é¡¯å¡çš„生態ä½ï¼Œä½†å€’也ä¸å¤ªå‹•æ–Intel的王牌駕駛員地ä½ï¼Œéš¨è‘—互è¯ç¶²çš„興起,Intel在數據ä¸å¿ƒå¤§æŠŠå¤§æŠŠæ’ˆéŒ¢ã€‚
è¦å’ŒIntel在數據ä¸å¿ƒé ˜åŸŸç«¶çˆï¼Œæœ€ç›´æŽ¥çš„辦法似乎是åšä¸€æ¬¾æ›´æœ‰ç«¶çˆåŠ›çš„CPU,但這件事AMDå’ŒARMåšäº†å¥½å¤šå¹´ï¼Œä¸€ç›´éƒ½ç¿»ä¸èµ·å·¨å¤§çš„æµªèŠ±ã€‚
ã€Œç”Ÿæ…‹ç«¶çˆæœ€æœ‰æ•ˆçš„路線是生態ä½çš„ç«¶çˆã€ã€‚
實際上åŒä¸€å€‹ç”Ÿæ…‹ä½å…§çš„ç«¶çˆåªå˜åœ¨å…©ç¨®å¯èƒ½æ€§ï¼šä¸€ç¨®æ˜¯ç”Ÿæ…‹ä½å»ºç«‹çš„åˆæœŸï¼Œæ–°èˆˆçš„需求催生了新的生態ä½ï¼Œä½†é€™å€‹ç”Ÿæ…‹ä½çš„è´å®¶é‚„æ²’å‡ºç¾æ™‚ï¼Œç„¡æ•¸çŽ©å®¶æœƒä¸‹å ´åŽ»ç«¶çˆé€™å€‹ç”Ÿæ…‹ä½ã€‚
但最終往往會決å‹å‡ºä¸€å…©å®¶ï¼Œä¸€æ—¦ç©©å®šä¸‹ä¾†ä¹‹åŽåŸºæœ¬æ˜¯æ²’有什么機會的。
å¦å¤–一種就是神仙打架了,整個標準化體系內有無數大大å°å°çš„生態ä½ï¼Œæ¯å€‹ç”Ÿæ…‹ä½ä¹Ÿæœƒå’Œå‘¨é‚Šçš„ç”Ÿæ…‹ä½æœ‰åƒçµ²è¬ç¸·çš„è¯ç³»ã€‚
ä¸€å€‹æ“æœ‰æ›´å¤§ç”Ÿæ…‹ä½çš„è£åˆ¤å¯ä»¥å€Ÿè‘—生態ä½çš„影響力去侵入其他ç¨å¼±ä¸€äº›çš„生態ä½ï¼Œæ“´å¼µè‡ªå·±çš„地盤,比如今天ARMè¯åˆè˜‹æžœå’ŒNVidia去侵è•x86的生態ä½ã€‚但這兩æ¢è·¯å¯¦éš›ä¸Šéƒ½ä¸é©åˆä»Šå¤©æˆ‘們這些nobody。
實際上åŽé¢é€™ç¨®ç”Ÿæ…‹ä½éƒ½ä¸é©åˆä»¥å°åšå¤§ï¼ŒNVidiaä¸Šå¸‚ä¹‹åŽæ‰€æŽŒæ¡çš„ç¨ç«‹é¡¯å¡çš„生態ä½ç›¸æ¯”Intelçš„x86生態ä½é‚„是å°åˆ°å¯ä»¥å¿½ç•¥ä¸è¨ˆçš„。
想以å°åšå¤§æ ¹æœ¬æ²’有å¯èƒ½æ€§ï¼Œç”šè‡³åˆ°16å¹´å‰åŽNVidia已經如日ä¸å¤©æ™‚,想把NVLink擴展到CPU上替æ›PCIe都沒能æˆåŠŸï¼Œåªç•™ä¸‹IBMçš„power處ç†å™¨åœ¨é¢¨ä¸å‡Œäº‚。
當然,NVidia今天åšARM CPU也是æŒçºŒä¸æ–·æƒ³ä¾µè•Intel最åŽçš„陣地,但這個éŽç¨‹ä»¥ä»Šå¤©NVidia的話語權ä»ç„¶ä¸æ˜¯ä¸€ä»¶å®¹æ˜“çš„äº‹æƒ…ï¼Œæ”¾åˆ°ç•¶å¹´åªæœ‰ç¨ç«‹é¡¯å¡çš„ç”Ÿæ…‹ä½æ™‚更是ä¸å¯èƒ½ã€‚
而nobodyåšåŒä¸€å€‹ç”Ÿæ…‹ä½å…§çš„ç«¶çˆå°±æ›´æ˜¯ç„¡ç¨½ä¹‹è«‡äº†ï¼Œä½†ä»Šå¤©ä»ç„¶æœ‰ç„¡æ•¸çީ家å‰èµ´åŽç¹¼è¦å’Œå·²æœ‰çš„生態ä½ä¸Šåšå·®ç•°åŒ–ç«¶çˆã€‚其實NVidiaçš„ç¬¬äºŒæ®µå£¯èˆ‰å‘æˆ‘們展示了å¦å¤–ä¸€ç¨®æ›´åŠ æœ‰æ•ˆçš„ç”Ÿæ…‹ç«¶çˆæ–¹å¼ã€‚
NVidia并䏿˜¯é 差異化的CPU去和Intelç«¶çˆçš„ï¼Œã€Œè€Œæ˜¯é æŠŠGPGPU的生態ä½åœ¨æ•¸æ“šä¸å¿ƒçš„åƒ¹å€¼å æ¯”è¶Šåšè¶Šå¤§å¯¦ç¾çš„?ï¼é«˜@個éŽç¨‹å¯¦éš›ä¸Šæ˜¯ã€ä¸åŒç”Ÿæ…‹ä½éš¨è‘—éœ€æ±‚è®ŠåŒ–çš„æ¤æ¶ˆå½¼é•·ã€ï¼Œè€Œã€Œä¸æ˜¯åŒä¸€å€‹ç”Ÿæ…‹ä½å…§éƒ¨æš´çƒˆåœ°æ›¿æ›ã€ã€‚
é€™ç¨®æ¤æ¶ˆå½¼é•·å°±æ„味著,在整個更替的全éŽç¨‹ï¼Œå…©ç¨®ç”Ÿæ…‹æ˜¯é«˜åº¦è¦ªå’Œå…±å˜çš„,而且在很長一段時間內,原有生態ä½çš„體釿œƒå¤§å¾—多。所以å³ä½¿ä»Šå¤©ä¸€è‡ºæœå‹™å™¨å…§90%以上的價值是NVidia的產å“,
「但æœå‹™å™¨çš„常見形態ä»ç„¶æ˜¯2個“ä¸å¤®â€è™•ç†å™¨æé…8個“從屬è¨å‚™â€GPUã€ã€‚這個形態實際上還是符åˆIntel的游戲è¦å‰‡ï¼Œåªä¸éŽâ€œå¾žå±¬è¨å‚™â€é€™é‚Šçš„生態ä½å·²ç¶“é 大于“ä¸å¤®â€è™•ç†å™¨çš„生態ä½äº†ï¼Œå¤§å®¶è²·æœå‹™å™¨æ›´å¤šæ˜¯ç‚ºäº†è²·é€™äº›â€œå¾žå±¬è¨å‚™â€ï¼Œè€Œä¸”也盡é‡è¿½æ±‚用更少的CPUä¾†æ”¯æŒæ›´å¤šçš„“從屬è¨å‚™â€ã€‚
實際上今天這種2CPU+8GPUé€™ç¨®çœ‹èµ·ä¾†è‡ªç„¶è€Œç„¶çš„å½¢æ…‹ä¹Ÿä¸æ˜¯å¤©ç„¶å°±è©²é€™æ¨£ï¼Œè€Œæ˜¯è€é»ƒæ•´å€‹å¸ƒå±€å’ŒåŸ·è¡Œçš„çµæžœï¼ŒIntel在這個éŽç¨‹è™•處給è€é»ƒæŒ–å‘,但奈何è€é»ƒå°ç”Ÿæ…‹ç«¶çˆé‚輯的深刻ç†è§£ä»¥åŠå幾年的布局。
這個éŽç¨‹å¯¦éš›ä¸Šè¦è§£æ±ºä¸‰å€‹å±¤ç´šçš„å•題:第一個層級是芯片本身è¦è¶³å¤ 好用,開發效率è¦è¶³å¤ 高。實際上今天很多AI芯片的開發效率是é 低于NVidiaçš„CUDA+GPGPU的。這個層級也是無數AI芯片玩家至今沒能é‚éŽåŽ»çš„åŽã€‚
第二個層級是更進一æ¥çš„è¦æ±‚ï¼ŒèŠ¯ç‰‡ä¸æ˜¯ä¸€ä»£ç”¢å“,而是一個延續åå¹¾å¹´ï¼Œéœ€è¦æœ‰æŒçºŒç”Ÿå‘½åŠ›çš„é«”ç³»ã€‚
硬件層é¢èƒ½æœ‰å»¶çºŒæ•¸åå¹´çš„æŒçºŒæ€§èƒ½æå‡ç©ºé–“,而且這個æå‡çš„é€Ÿåº¦è¦æ¯”ç«¶çˆå°æ‰‹çš„æ›´å¿«ï¼ŒåŒæ™‚軟件層é¢ä¹Ÿä¸å…‰æ˜¯é–‹ç™¼æ•ˆçއè¦é«˜ï¼Œåœ¨èŠ¯ç‰‡æŒçºŒæ¼”進的éŽç¨‹ä¸ï¼Œé€™ç¨®é–‹ç™¼æ•ˆçއã€å…¼å®¹æ€§è¦ç©©å®šå¹³æ»‘地延續幾å代產å“。
第三個層級就ä¸å…‰æ˜¯ç´”技術å•題了,畢竟生態是具有巨大慣性的,一個å†å¥½çš„æ–¹æ¡ˆå¦‚果游離于目å‰çš„主æµå½¢æ…‹å¤ªé ,也很難克æœç”Ÿæ…‹å·¨å¤§çš„æ…£æ€§ã€‚
åŒæ™‚,還需è¦è¶³å¤ å¥½çš„éœ€æ±‚ä¾†å‚¬åŒ–ï¼Œå› ç‚ºç”Ÿæ…‹ä½æ˜¯ç”±éœ€æ±‚產生的。
今天的AI芯片大多連第一個層級都還沒é‚éŽåŽ»ï¼Œè€é»ƒä¹Ÿç”¨å¥½å¹¾å¹´æ™‚間完æˆäº†GPU到GPGPUçš„æ”¹é€ ï¼ŒåŒæ™‚也建立了CUDA相關的體系,é‚éŽäº†å‰å…©å€‹è‡ºéšŽï¼ŒåŒæ™‚也為第三個階段的親和性åšäº†æ¥µè‡´çš„è¨è¨ˆï¼Œå°±åƒæˆ‘們最開始講的,一方é¢ä¿æŒå°C/C++這套體系的親和性,å¦ä¸€æ–¹é¢æ¸›å°‘å°ä¸ç›¸é—œéƒ¨åˆ†çš„侵入性。
但第三個階段ä¸å…‰æ˜¯æŠ€è¡“å•題,è€é»ƒçš„這套體系也需è¦éœ€æ±‚çš„æ±é¢¨å¹èµ·ä¾†ï¼Œåœ¨é‚£å€‹éšŽæ®µï¼Œè€é»ƒä¹Ÿå¾ˆé›£é 料什么樣的需求會爆發,åªèƒ½é ‚著股價下滑的壓力ç‰ï¼ŒåŒæ™‚投資å„種潛在的需求。
終于,ç‰ä¾†äº†2012å¹´AlexNet引爆的深度å¸ç¿’。整個這個階段,è€é»ƒçµ¦æˆ‘們演示了,和Intelçš„CPUç«¶çˆçš„æœ€ä½³æ–¹å¼ä¸æ˜¯åšå¦ä¸€ç¨®å½¢æ…‹çš„CPU,而是在Intel的游戲è¦å‰‡ä¸‹åšå¤§PCIeè¨å‚™åœ¨åŠ é€Ÿè¨ˆç®—é ˜åŸŸçš„ç”Ÿæ…‹ä½ã€‚
讓這個生態ä½å¾žCPU+PCIe擴展的體系下一個å°çš„生態ä½é€æ¼¸å¢žé•·ç‚ºä¸€å€‹è¶³å¤ 大的生態ä½ï¼Œç”šè‡³è¶…éŽCPU的生態ä½ï¼Œé€²è€Œåžå™¬Intel在數據ä¸å¿ƒçš„å¸‚å ´ä»½é¡ï¼Œç”šè‡³åˆ°ä»Šå¤©å¯ä»¥æ‹‰è‘—ARM試圖把Intel從數據ä¸å¿ƒçš„AIè§£æ±ºæ–¹æ¡ˆä¸æŠ¹æŽ‰ã€‚
å…¶å¯¦é€™å€‹äº‹æƒ…å°æˆ‘們今天去æžAI芯片的生態是有很大借鑒æ„ç¾©çš„ï¼Œç•¶ç„¶é€™ç¨®å€Ÿé‘’ä¸æ˜¯æˆ°è¡“層é¢çš„å¾®æ“,生態競çˆçš„æˆ°è¡“æˆ°ç•¥éƒ½å¾ˆé›£å¾©åˆ¶ï¼Œç•¢ç«Ÿä»Šå¤©è¦æ‡‰å°çš„æ˜¯NVidia以åŠCUDA的軟件體系。
但從更å®è§€çš„層é¢ä¾†è¬›ï¼Œå’ŒNVidia CUDAç«¶çˆçš„ä¸ä¸€å®šæ˜¯AMD ROCm,這個本質上還是åŒä¸€å€‹ç”Ÿæ…‹ä½å…§éƒ¨çš„ç«¶çˆï¼ŒAMD錯éŽäº†2012年那個å‰åŽçš„æ™‚間窗å£åŽå…¶å¯¦å°±æ²’太多直接從這個生態內部競çˆçš„æ©Ÿæœƒäº†ã€‚
實際上,CUDA之上還有深度å¸ç¿’框架的生態ä½ï¼Œç•¶ç„¶æ·±åº¦å¸ç¿’框架在12å¹´å‰åŽé–‹å§‹å½¢æˆéœ€æ±‚,到16å¹´å‰åŽä¹Ÿé€æ¼¸é–‹å§‹æ”¶æ–‚,到今天事實上已經被PyTorch把æŒï¼Œä»Šå¤©é€™å€‹æ™‚間點繼續在深度å¸ç¿’æ¡†æž¶ä¸Šå·æ©Ÿæœƒä¹Ÿä¸å¤šã€‚
深度å¸ç¿’æ¡†æž¶åŒæ¨£ä¸æ˜¯é‡é»žï¼Œæ·±åº¦å¸ç¿’框架之上ä»ç„¶æœ‰æ›´å¤šç”Ÿæ…‹ä½æ©Ÿæœƒã€‚這里é¢ä»»ä½•一層抓ä½äº†æ©Ÿæœƒï¼Œå¦‚果在未來這一層的é‡è¦æ€§è®Šå¾—更高了,其他層的é‡è¦æ€§ç›¸å°ä¸‹æ»‘,這里é¢å¯¦éš›ä¸Šæ˜¯å˜åœ¨éžå¸¸å¤šæ©Ÿæœƒçš„。
ä¸éŽæŒ‘戰也在é”鬼般的細節里,例如今天的深度å¸ç¿’框架實際上更多解決的是計算圖的表示和在ä¸åŒè¨å‚™ä¸Šè¨ˆç®—çš„å•é¡Œï¼Œæ–¹ä¾¿ç®—æ³•ç”¨æˆ¶èƒ½å¤ è‡ªç”±æŽ¢ç´¢æ¨¡åž‹çµæ§‹ã€‚å°äºŽç®—åç·¨å¯«é€™ä¸€å±¤å¹¶æ²’æœ‰çœŸæ£æ„ç¾©ä¸Šéš”é›¢ï¼Œåªæ˜¯é€šéŽå…§ç½®ä¸Šåƒå€‹ç®—åçš„æ–¹å¼æ»¿è¶³äº†é«˜é »éœ€æ±‚。
å› æ¤PyTorché€™ä¸€å±¤å¯¦éš›ä¸Šæ²’æœ‰è¾¦æ³•çœŸæ£æ„義上隔離掉CUDA的生態ä½ï¼Œé¡žä¼¼TensorFlow希望隔離GPUå’ŒTPU的差異這種嘗試就走得異常痛苦。當然了,Googleçš„TensorFlow還是在深度å¸ç¿’æ¡†æž¶é ˜åŸŸå æ“šéŽå¾ˆé•·ä¸€æ®µæ™‚é–“ä¸Šé¢¨çš„ï¼Œåœ¨é€™å€‹ç”Ÿæ…‹ä½æ˜¯ï¼ŒGoogle至少是有方å‘盤的,其他沒有方å‘盤的肯定就別想通éŽé€™ç¨®æ–¹å¼å€ŸåŠ›äº†ã€‚
今天è¦çœ‹ç”Ÿæ…‹çš„æ©Ÿæœƒï¼Œå¾žè»Ÿä»¶è§’度也更應當著眼于PyTorchä¹‹ä¸Šçš„ç”Ÿæ…‹ä½æ©Ÿæœƒï¼Œä¾†æ§‹æ€ä¸€æ•´å¥—打法,比如今天的大模型實際上也催生了PyTorch之上的大模型訓練/æŽ¨ç†æ¡†æž¶çš„ç”Ÿæ…‹ä½æ©Ÿæœƒï¼Œè€Œä¸”ç›®å‰å¯¦éš›ä¸Šæ£è™•于生態ä½å»ºè¨çš„æ—©æœŸï¼Œå¤§é‡çŽ©å®¶åœ¨é€™å€‹é ˜åŸŸé€ è¼ªåçˆå¥ªé€™ä¸€å¡Šçš„生態ä½ã€‚
「當然了,這種軟件生態ä½çš„æ©Ÿæœƒæ€Žä¹ˆå哺芯片生態ä½ï¼Œå…¶å¯¦è€é»ƒåœ¨12年之åŽçš„æ•´å€‹å‹•作也å¯ä»¥é«”會到NVidiaå°é€™ä¸€å¡Šçš„æŠŠæŽ§ï¼Œæ©Ÿæœƒä¾†äº†æ€Žä¹ˆæŠŠæŽ§å¥½ä¹Ÿéžå¸¸é—œéµã€ã€‚
生態的å¡ä½é çš„æ˜¯é–‹ç™¼è€…è€Œä¸æ˜¯æ¥å‹™ã€‚**生態å¡ä½æœ€çµ‚目的是è¦è®“æ¥å‹™â€œä¸å¾—ä¸ç”¨â€ï¼Œä½†å¦‚果這個組件時直接æœå‹™æœ€çµ‚æ¥å‹™çš„,**é‚£åªèƒ½å› 為單純的“好用â€è€Œç”¨ï¼Œä½†ä»»ä½•一個產å“都有ä¸å¥½ç”¨çš„åœ°æ–¹ï¼Œã€Œå¾ˆé›£çœŸæ£æ„義上長期ç¶å®šï¼Œé”ä¸åˆ°â€œä¸å¾—ä¸ç”¨â€çš„地æ¥?ï¼?/span>
實際上ä¸å¾—ä¸ç”¨éœ€è¦å…©å±¤éžé€²é—œç³»ï¼Œä¹Ÿå°±æ˜¯èªªåœ¨ä¸€å€‹çµ„件之上有大é‡â€œå¥½ç”¨â€çš„äºŒæ¬¡é–‹ç™¼çš„çµ„ä»¶ï¼Œç”¨æˆ¶å› ç‚ºå¾ˆå¤šäºŒæ¬¡é–‹ç™¼çš„çµ„ä»¶â€œå¥½ç”¨â€ï¼Œé€²è€Œæ‰èƒ½â€œä¸å¾—ä¸ç”¨â€é€™äº›çµ„ä»¶ä¾è³´çš„組件。
這個層級éžé€²è¶Šæ·±ï¼Œã€Œé€™ç¨®â€œä¸å¾—ä¸ç”¨â€æœƒè¶Šä¾†è¶Šå¼·çƒˆã€ã€‚我們看NVIDIA第三個階段,借著深度å¸ç¿’的熱潮是怎么布局自己的生態ä½çš„。
ä»–å¹¶ä¸åŽ»æ¶æ·±åº¦å¸ç¿’框架的生態ä½ï¼Œè€Œæ˜¯çµ¦å„å€‹é€ æ·±åº¦å¸ç¿’框架的開發者æä¾›ç„¡å¾®ä¸è‡³çš„æœå‹™ï¼ŒåŒ…æ‹¬ç•°å¸¸å¥å…¨çš„æ–‡æª”,甚至連debug API這種估計很少有開發者會關注的文檔都寫得éžå¸¸è©³ç´°ï¼Œä¹ŸåŒ…括給很多開發者é€é¡¯å¡ã€‚
當然最關éµçš„,還是產å“在這個生態ä½éœ€æ±‚下的絕å°ç«¶çˆåŠ›ã€‚æ›å¥è©±è¬›ï¼Œå¯«æ·±åº¦å¸ç¿’æ¡†æž¶çš„æ ¸å¿ƒéœ€æ±‚æ˜¯è®“æµ·é‡ç®—法用戶能簡單ç²å¾—極高的算力跑深度å¸ç¿’模型,AlexNetä¹Ÿè‰æ˜Žäº†GPU比CPUå¿«å¤ªå¤šï¼Œå› æ¤å°äºŽåšæ·±åº¦å¸ç¿’框架的開發者,支æŒGPUçš„æ¡†æž¶é¡¯ç„¶ä¹Ÿæ¯”åªæ”¯æŒCPU的框架更具有競çˆåŠ›ï¼Œé€™å°±çµ¦äº†ä¸Šé¢ç„¡æ•¸é–‹ç™¼è€…最基礎的動力去支æŒGPU,å†åŠ ä¸Šäº‹ç„¡å·¨ç´°çš„æ–‡æª”å’Œç„¡å¾®ä¸è‡³åœç¹žé–‹ç™¼è€…的一整套打法,自然海é‡é–‹ç™¼è€…涌入CUDA體系。
在CUDA之上寫了無數的深度å¸ç¿’框架去競çˆã€‚上é¢é–‹ç™¼è€…開發了ä¸åŒç‰¹é»žçš„æ¡†æž¶ï¼Œæ¯å€‹æœ€çµ‚用戶都會其ä¸ä¸€äº›æ¡†æž¶çš„“好用â€è€ŒåŠ å…¥æŸä¸€é™£ç‡Ÿï¼Œã€Œä½†ä¹Ÿå› 為所有框架基本都支æŒCUDAå’ŒNVidiaçš„GPU,從而使得用戶進入了“ä¸å¾—ä¸ç”¨â€œCUDAå’ŒNVidiaçš„GPU的狀態?ï¼?/span>
ã€Œé€™å¯¦éš›ä¸Šåšæ‰€æœ‰è§£æ±ºæ–¹æ¡ˆéƒ½ç¹žä¸é–‹çš„å集的æ€è·¯ã€ï¼Œè€Œå¤§å¤šæ•¸äººåšé …目「都ä¸è‡ªè¦ºæœƒé™·å…¥åšå¤§è€Œå…¨çš„超集的æ€è·¯ã€ã€‚
以NVidiaçš„è»Ÿä»¶é–‹ç™¼èƒ½åŠ›ï¼Œåœ¨é‚£å€‹éšŽæ®µåŽ»ç ”ç™¼ä¸€å€‹æ·±åº¦å¸ç¿’框架和TensorFlowã€PyTorch包括早期的Caffeã€theanoç«¶çˆæ˜¯å®Œå…¨æ²’å•題的,甚至å¯ä»¥å€ŸåŠ©è»Ÿç¡¬ä»¶å”åŒçš„能力比å„家的框架åšå¾—更有競çˆåŠ›ï¼Œç”šè‡³å€Ÿæ¤å¹²æŽ‰å…¶ä»–框架。
但NVidia實際上沒有這么åšï¼Œã€ŒNVidia是一種典型的åšå集的æ€è·¯ï¼Œåšä¸€å€‹æ‰€æœ‰äººéƒ½ç¹žä¸é–‹çš„å集ã€ã€‚
與之相å°çš„æ˜¯åšä¸€å€‹å¤§è€Œå…¨çš„超集的æ€è·¯ï¼Œé€™ç¨®æ€è·¯æ˜¯ä»Šå¤©å¾ˆå¤šé …ç›®ä¸è‡ªè¦ºå°±æœƒè½å…¥çš„æ€è·¯ï¼Œæ‰€æœ‰ç«¶çˆå°æ‰‹æœ‰çš„æ‰€æœ‰å¥½çš„特性我們也都支æŒï¼Œæˆ‘們å†åšä¸€äº›è‡ªå·±çš„特性,這樣是一個功能比所有人更全的超集。
實際上NVidia在下é¢çœ‹ä¸Šé¢æ‰€æœ‰äººå·è¶…集,å„個超集都把自己的CUDAç´å…¥å…¶ä¸ï¼Œé–“接促æˆäº†è‡ªå·±æˆç‚ºæ‰€æœ‰äººç¹žä¸é–‹çš„å集的目的。而æˆç‚ºå¾ˆå¤šè§£æ±ºæ–¹æ¡ˆçš„å集,無論æ¯å€‹æ–¹æ¡ˆæœ‰å¤šå°‘用戶覺得好用,æ¯å€‹è§£æ±ºæ–¹æ¡ˆéƒ½èƒ½çµ¦NVidiaå¸¶ä¾†è¶³å¤ å¤šâ€œä¸å¾—ä¸ç”¨â€CUDA的用戶。
而æ¯å€‹æ·±åº¦å¸ç¿’框架自己僅僅é â€œå¥½ç”¨â€æ†ç¶ç”¨æˆ¶ï¼Œé‚£è‡ªç„¶ä¹Ÿå¾ˆå®¹æ˜“å› ç‚ºâ€œä¸å¥½ç”¨â€è€Œè¢«ç”¨æˆ¶æ‹‹æ£„。
é€™å€‹å…¶å¯¦æ˜¯ä¸€å€‹æ¥µå…·ç”Ÿæ…‹ç«¶çˆæ™ºæ…§çš„æ‰“法,今天很多人說NVidia是一家軟件公å¸ï¼Œæœ‰å¤§é‡è»Ÿä»¶çš„人,于是也投海é‡çš„è»Ÿä»¶å·¥ç¨‹å¸«åŽ»æ‰“é€ ç”¢å“ç«¶çˆåŠ›ï¼Œã€Œæœ€åŽéƒ½è½å…¥äº†å¤§è€Œå…¨çš„超集æ€è·¯ï¼Œå¯¦éš›ä¸Šè·ŸNVidia這種åšå集的æ€è·¯å®Œå…¨å—轅北è½?ï¼?/span>
大家想想以NVidia的軟件能力,真的è¦åŽ»æ¶å„種軟件層é¢çš„生態ä½ï¼Œé›–說ä¸ä¸€å®šèƒ½å¹²æŽ‰å…¶ä»–ç›®å‰ä¸»æµçš„產å“,但至少分一æ¯ç¾¹å®Œå…¨ä¸åœ¨è©±ä¸‹ã€‚
NVidia真æ£ä¸‹å ´å¹²çš„軟件,è¦ä¹ˆé–‹æºè®“大家隨便抄,把自己的產å“ç¹¼çºŒæŠ„æˆæ‰€æœ‰äººçš„å集,è¦ä¹ˆæ˜¯è¦ºå¾—整個æ¥ç•Œå¯¦åœ¨æ²’在æŸå€‹å ´æ™¯ä¸‹ç”¨å¥½GPU,ä¸å¾—ä¸ä¸‹å ´å¸¶ä¸€æ³¢ç¯€å¥ã€‚
「解決方案å¼çš„æ‰“法是最åŽçš„æ”¶å‰²éšŽæ®µã€ã€‚
實際上NVidia這幾年æ‰ç®—真æ£é–‹å•Ÿäº†æ”¶å‰²æ¨¡å¼ï¼Œå¦‚æžœä½ é—œæ³¨è€é»ƒé€™å¹¾å¹´çš„æ¼”進,他會更多æåˆ°â€œé‡æ§‹è¨ˆç®—機工作方å¼â€ï¼Œå¯¦éš›ä¸Šé€™æ˜¯å‘Intel發起沖鋒了,今天的整個計算機系統實際上是åœç¹žCPU定義的,åœç¹žCPU定義了指令集ã€è»Ÿä»¶ã€ä»¥åŠç¹æ¦®çš„軟硬件生態,è€é»ƒä»Šå¤©çµ‚于拿到了整個生態ä½é‡Œé¢æœ€å¤§çš„話語權。
è€é»ƒå€Ÿè‘—三å年臥薪嘗膽打下來的生態地ä½ï¼Œé–‹å§‹çœŸæ£å°é€™å€‹äº‹å¯¦æ¨™æº–的體系進行é‡å¡‘。這種é‡å¡‘åŒæ¨£ä¸æ˜¯destructive的,無論有多大的話語權,生態的慣性ä»ç„¶éœ€è¦éµå¾žã€‚
è€é»ƒæ›´å¤šæŠŠAI作為切入點,è¦åœ¨ä»Šå¤©çš„計算機系統上支æ’一個åœç¹žAI的全新計算機系統,那么在AIé ˜åŸŸæ“æœ‰æœ€å¤§è©±èªžæ¬Šçš„è€é»ƒè‡ªç„¶ä¹Ÿå°±å¯ä»¥å°‡åº•å±¤çš„ç¶“å…¸è¨ˆç®—æ©Ÿç³»çµ±å¡‘é€ æˆä¸€å€‹æ›´é©ç”¨äºŽæ”¯æ’上層新興的AI計算機系統的底座。這種é‡å¡‘是王者的特權。
回到我們開é 說的,å¸ç¿’NVidiaä¸èƒ½å…‰çœ‹è€é»ƒé€™å¹¾å¹´åƒè‚‰çš„æ¨¡æ¨£æœ‰æ¨£å¸æ¨£ï¼Œé€™å±¬äºŽç”Ÿæ…‹ç«¶çˆæœ€åŸºæœ¬çš„é‚è¼¯éƒ½æ²’æžæ¸…楚。我們更需è¦é—œæ³¨NVidia這三åå¹´çš„è‡¥è–ªå˜—è†½ï¼Œä»¥åŠæ•´å¥—戰略æ€ç¶ï¼ŒåéŽä¾†ï¼ŒåŽ»è€ƒæ…®ä»Šå¤©åœ¨NVidia游戲è¦å‰‡ä¸‹çš„真æ£å‡ºè·¯ï¼Œç•¶ç„¶é€™ä¹Ÿæ˜¯ä»Šå¤©æœ€é›£çš„å•題了。
其實生態這個事情就是這樣,我們今天站在如æ¤è‡ªç„¶è€Œç„¶çš„計算機系統看éŽåŽ»ï¼Œä¼¼ä¹Žåˆ°äº†é‚£å€‹æ™‚é–“é»žè‡ªç„¶è€Œç„¶æœ‰é€™æ¨£é‚£æ¨£çš„ä¸€äº›æ©Ÿæœƒè¢«ä»Šå¤©çš„çŽ‹è€…æŠ“ä½äº†ï¼Œè€Œä»Šå¤©ä¼¼ä¹Žç¼ºä¹é€™æ¨£é‚£æ¨£çš„æ©Ÿæœƒã€‚
殊ä¸çŸ¥ï¼Œä»Šå¤©çš„çŽ‹è€…æ£æ˜¯ç•¶æ™‚é‚£ç¨®çµ•å¢ƒç¨®å¡‘é€ äº†é€™æ¨£é‚£æ¨£çš„æ©Ÿæœƒï¼ŒæŠŠæ•´å€‹è¨ˆç®—æ©Ÿç³»çµ±å¡‘é€ æˆäº†é€™ç¨®å½¢æ…‹ï¼Œä¹Ÿåªæœ‰é€™ç¨®ä»Šå¤©çœ‹èµ·ä¾†è¶³å¤ 自然而然的形態æ‰èƒ½é †æ‡‰ç”Ÿæ…‹çš„é‚輯å–å¾—ç«¶çˆçš„å‹åˆ©ã€‚
è¬å—長文看到這里也是ä¸å®¹æ˜“,說了這么多競çˆé‚輯,今天該怎么åšï¼Ÿ
今天åœç¹žNVidiaå»ºç«‹çš„æ¨™æº–åŒ–é«”ç³»çœ‹èµ·ä¾†ä¼¼ä¹Žå …ä¸å¯æ‘§ï¼ŒCUDA牢牢å¡ä½äº†ç®—å編程生態ä½ï¼Œç”šè‡³PyTorch都沒法å±è”½ï¼Œè€Œä»Šå¤©æµ·é‡è»Ÿä»¶åˆéƒ½å»ºç«‹åœ¨é€™å¥—體系之上。
ä½†éœ€æ±‚ä¸€ç›´éƒ½åœ¨è®Šï¼Œé€™ç¨®è®ŠåŒ–å¯¦éš›ä¸Šä¹Ÿé€ æˆäº†å¾ˆå¤šç”Ÿæ…‹ä½çš„æ¤æ¶ˆå½¼é•·ï¼Œç”Ÿæ…‹ä½çš„èŽç¸®å¹¶ä¸æ˜¯é‚£ä¹ˆç«‹ç«¿è¦‹å½±çš„,CPU的生態ä½å·²ç¶“èŽç¸®åˆ°ä»Šå¤©é€™å€‹ç•¶é‡ä¹Ÿçµ²æ¯«ä¸æœƒè®“大家覺得x86似乎沒影響力了,其實ä»ç„¶æ˜¯å¼·å¤§åˆ°åŸºæœ¬ä¸å¯å‹•æ–ã€‚åŒæ¨£ï¼Œé€™äº›ä»Šå¤©çœ‹èµ·ä¾†ç‰¢ä¸å¯ç ´çš„生態ä½å¯¦éš›ä¸Šä¹Ÿåœ¨æ‚„悄發生很多變化。
CUDAçš„ç”Ÿæ…‹ä½æœ€å¤§çš„æ™‚候實際上是2012~2018年,無數的深度å¸ç¿’框架在CUDA的基礎上çˆå¥ªç”¨æˆ¶ï¼Œä¸Šé¢é€™äº›é€šéŽè‡ªèº«çš„“好用â€å¹«åŠ©CUDA實ç¾â€œä¸å¾—ä¸ç”¨â€çš„æ±è¥¿è¶Šå¤šè¶Šç¢Žç‰‡ï¼ŒCUDA自然就越穩固。
而深度å¸ç¿’框架收斂到TensorFlowå’ŒPyTorch之åŽï¼Œå¯¦éš›ä¸ŠCUDAçš„ç”Ÿæ…‹ä½æ˜¯ä¸€å®šç¨‹åº¦ä¸‹é™çš„,但å•題在于深度å¸ç¿’框架并沒有å±è”½ç®—å編程,åªä¸éŽå…§ç½®äº†ä¸€å€‹å集消除絕大多數算å編程的需求。
所以實際上CUDA的需求實際上是穿é€äº†æ·±åº¦å¸ç¿’框架æ…上去了,今天ä»ç„¶æœ‰ç„¡æ•¸PyTorchä¹‹ä¸Šçš„é ˜åŸŸæ¡†æž¶å¯«äº†å¤§é‡PyTorchç®—å集之外的CUDAç®—å,所以實際上CUDA雖然削弱了一些,但還是極具生命力。這實際上也是很多希望通éŽPyTorch這一層解決AI芯片軟件生態å•題屢屢碰å£çš„主è¦åŽŸå› ã€‚
而深度å¸ç¿’框架最è¼ç…Œçš„階段是在2023年以å‰ï¼Œæ·±åº¦å¸ç¿’框架是æä¾›äº†ä¸€å€‹æ§‹å»ºä¸åŒæ·±åº¦å¸ç¿’æ¨¡åž‹çµæ§‹çš„å¹³è‡ºï¼Œåœ¨æ¨¡åž‹çµæ§‹æŽ¢ç´¢æœ€æ´»èºçš„年代自然也是深度å¸ç¿’框架最高光的時刻。
而隨著Transformer is all you need被大模型進一æ¥éŽ–å®šï¼Œæ¨¡åž‹çµæ§‹çš„æŽ¢ç´¢æ´»èºåº¦å¯¦éš›ä¸Šæ˜¯é™ä½Žçš„,深度å¸ç¿’框架的生態ä½é‡è¦æ€§å¯¦éš›ä¸Šé–‹å§‹é€æ¥é™ä½Žã€‚今天最活èºçš„æ˜¯å¤§æ¨¡åž‹çš„æ¡†æž¶ï¼Œå¤§é‡é–‹ç™¼è€…在PyTorchä¹‹ä¸Šç˜‹ç‹‚é€ è¼ªå,從å„å€‹è§’åº¦è§£æ±ºå¤§æ¨¡åž‹è¨“ç·´ã€æŽ¨ç†çš„å„種å•題。
ã€Œé€™é‡Œé¢æœ€æ ¸å¿ƒçš„實際上是顯å˜å’Œå¸¶å¯¬çš„利用,是大模型ä¸åŒæ•¸æ“šå¦‚何在這有é™çš„顯å˜å’Œå¸¶å¯¬ä¹‹ä¸Šèª¿åº¦ï¼Œå¹¶åˆç†åœ°ç©¿æ’相應的計算ã€ã€‚
這一塊實際上是一個全新生態ä½çš„å½¢æˆéšŽæ®µï¼Œå°äºŽå¤§æ¨¡åž‹infra開發者而言,是生態å¡ä½çš„æ™‚間窗å£ï¼Œå°äºŽèŠ¯ç‰‡å» å•†è€Œè¨€ï¼Œä¹Ÿæ˜¯å¸ç¿’CUDAå¡ä½çš„é‚輯最好的時候,當然ç¾åœ¨å¤§æ¨¡åž‹infra層é¢ï¼Œéœ€è¦è‚¯å®šä¸æ˜¯ç®—å編程,å¸ç¿’CUDAå¡ä½çš„å¾®æ“肯定æ»è·¯ä¸€æ¢ï¼Œå„種邊界æ¢ä»¶å®Œå…¨ä¸åŒï¼Œã€Œæ²’有å¯å¾©åˆ¶çš„路徑。ã€
怎么用好這樣的機會,全看å°ä¸Šé¢ç”Ÿæ…‹é‚輯的ç†è§£å’Œç´°ç¯€çš„æŠŠæŽ§äº†ã€‚
除了軟件生態上的契機,NVidia這么多年構建的è·åŸŽæ²³å¯¦éš›ä¸Šä¹Ÿåœ¨å‰Šå¼±ï¼Œæˆ‘在之å‰çš„ä¸€ç¯‡æ–‡ç« é‡Œä¹Ÿè¬›äº†å¤§æ¨¡åž‹å°NVidia的巨大沖擊,NVidia構建的è·åŸŽæ²³æ˜¯å»ºç«‹åœ¨å°ç®—力的巨大需求上,利用CUDA在硬件抽象和軟件接å£ä½ç½®çš„精準å¡ä½ï¼Œå¡ä½äº†ä¸€æ³¢åˆä¸€æ³¢DSA芯片沖擊算力高地的ä¼åœ–。
實際上å°NVidia而言最å±éšªçš„并䏿˜¯DSAèŠ¯ç‰‡çš„ç®—åŠ›æ²–å¾—æ¯”å®ƒé«˜ï¼Œåæ£ä»–æœ‰ç”Ÿæ…‹ä½è©±èªžæ¬Šï¼Œæœ€å±éšªçš„æ˜¯èŠ¯ç‰‡æœ€å¤§çš„éœ€æ±‚ä¸å†æ˜¯ç®—力了。
é‚£ä¹ˆæ¤æ™‚無論是åœç¹žç®—力建立起來的CUDAè·åŸŽæ²³é‚„是在DSA這種在算力這個賽é“的競çˆè€…都失去了最é‡è¦çš„æ±è¥¿â€”â€”éœ€æ±‚ã€‚
NVidia今年實際上éŽåŽ»å»¶çºŒäº†å幾年的產å“路線和節å¥è¢«å¾¹åº•打亂了,這個節å¥åœ¨éŽåŽ»ä¸€æ³¢åˆä¸€æ³¢AI芯片的攻勢下從未動æ–éŽï¼Œä½†ä»Šå¹´AMDçš„MI300X都足以引起è€é»ƒå·¨å¤§çš„ææ…Œã€‚å¯¦éš›ä¸Šå¹¶ä¸æ˜¯AMD有多強,而是NVidiaæœ€å¤§çš„å±æ©Ÿä¾†äº†ã€‚
ä»Šå¹´æ—©äº›æ™‚å€™ï¼Œæˆ‘ä¹Ÿå› ç‚ºé€™æ¨£çš„åŽŸå› å”±è¡°äº†DSA,DSAé€™ç¨®ç‚ºå †ç®—åŠ›è€Œç”Ÿï¼Œå¸¶è‘—ä¸€ç³»åˆ—è»Ÿä»¶å•題的形態,如果在算力需求收縮的背景下,就åªå‰©ä¸‹è»Ÿä»¶ä¸Šçš„巨大å•題了。當然å°äºŽç”Ÿæ…‹ç«¶çˆä¾†è¬›ï¼Œé€™ç¨®æ··äº‚å’Œè¡Œæ¥æ´—ç‰Œå¯¦éš›ä¸Šæ˜¯æœ€å¤§çš„ç”Ÿæ…‹ç«¶çˆæ©Ÿé‡ã€‚
「NVidiaå¦ä¸€å€‹å·¨å¤§çš„æ½›åœ¨é𱿂£åœ¨äºŽæ•´å¥—游戲è¦å‰‡æ²’有給其他人空間ã€ã€‚
相比上一代è£åˆ¤Intel而言,實際上Intelè¨è¨ˆçš„æ¸¸æˆ²è¦å‰‡æ˜¯åˆ†é…了很多蛋糕給行æ¥å…§å…¶ä»–è³½é“的,而NVidia這種幾乎åƒç¨é£Ÿçš„æ–¹å¼ï¼Œä¹Ÿçµ¦å®ƒåœ¨å„å€‹é ˜åŸŸæ¨¹ç«‹äº†ç„¡æ•¸ç«¶çˆå°æ‰‹ã€‚
這種模å¼åœ¨ç”Ÿæ…‹ç©©å®šçš„階段å¯ä»¥æ‹¿åˆ°è¶…é¡çš„åˆ©æ½¤ï¼ŒåŒæ¨£åœ¨å±å±€ä¹‹ä¸‹åŒæ¨£ä¹Ÿé¢è‡¨å…¨è¡Œæ¥ç”šè‡³å®¢æˆ¶çš„æ•µå°ã€‚這種特點減少了åƒNVidia當年在Intel劃出的蛋糕下長出一個ç¨ç«‹çŽ‹åœ‹çš„ç©ºé–“ï¼Œä½†ä¹Ÿå¸¶ä¾†äº†è¯åˆå…¨è¡Œæ¥ä¸Šä¸‹æ¸¸æ§‹æˆæ¾æ•£çš„åNVidiaè¯ç›Ÿçš„空間。
今天NVidiaä¸åƒ…在GPUé ˜åŸŸé¢è‡¨ç«¶çˆï¼Œåœ¨ç¶²çµ¡å±¤é¢ä¹ŸåŒæ¨£é¢è‡¨è«¸å¤šç«¶çˆã€‚今天的挑戰者在這樣的游戲è¦å‰‡ä¸‹æœ‰æ›´å¤šçš„勢能去è¯åˆå…¶ä»–生態ä½çš„ç«¶çˆè€…æ§‹é€ ä¸€å¥—ç™½ç›’æ¨™æº–åŒ–çš„æ–¹æ¡ˆã€‚
實際上今天有太多競çˆè€…é™·å…¥äº†æ‰“é€ å…¨æ£§å°æ¨™çš„陷阱,å³è·ŸNVidia比GPU,åˆè·ŸNVidia拼互è¯ï¼Œä¹Ÿåšæ•´æ©Ÿï¼Œé€™æ¨£å¯¦éš›ä¸Šå¾ˆé›£å€ŸåŠ›åNVidiaè¯ç›Ÿçš„力。
相å,能通éŽä¸€ç³»åˆ—技術和產å“çš„å¸ƒå±€å¡‘é€ ä¸€å¥—ä¸åŒç”Ÿæ…‹ä½éƒ½å¯ä»¥åˆ‡å…¥å¹¶å—益的體系,也能更好的在這樣的體系ä¸ç²å–更多的生態競çˆåŠ›ã€‚
當然了,這些都是今天å„種生態競çˆä¸Šæœ€å¤§çš„æ©Ÿæœƒï¼Œç”Ÿæ…‹ç«¶çˆå§‹çµ‚ä»ç„¶æ˜¯ä¸€å€‹ç„¡æ¯”艱難的挑戰,æ·å²ä¸ŠæˆåŠŸæ¡ˆä¾‹å¾ˆå¤šï¼Œå¾ˆå¤šæœ‰é‹æ°£å’Œæ©Ÿç·£å·§åˆï¼Œä½†å¤šæ¬¡æˆåŠŸçš„ææ€•ä¹Ÿåªæœ‰è€é»ƒåšåˆ°äº†ã€‚
除了å°ç”Ÿæ…‹ç«¶çˆåº•層é‚輯的ç†è§£ï¼Œé‚„需è¦ä¸€æ•´å¥—生態競çˆçš„無解陽謀來實ç¾ä»¥å°åšå¤§ï¼Œæ›´éœ€è¦æŠ€è¡“和產å“è¨è¨ˆèƒ½åŒ¹é…ï¼Œé€™é‡Œé¢æ¯å€‹é»žéƒ½æ¥µå…·æŒ‘戰性。
上一篇:人工智能技術在è»äº‹æƒ…å ±é ˜åŸŸ...
下一篇:èŠèŠAIç ”ç™¼çš„ä¸ƒå¤§æ”¯æŸ±
ä¸åœ‹å‚³å‹•網版權與å…è²¬è²æ˜Žï¼šå‡¡æœ¬ç¶²æ³¨æ˜Ž[來æºï¼šä¸åœ‹å‚³å‹•ç¶²]的所有文å—ã€åœ–片ã€éŸ³è¦–å’Œè¦–é »æ–‡ä»¶ï¼Œç‰ˆæ¬Šå‡ç‚ºä¸åœ‹å‚³å‹•ç¶²(www.hysjfh.com)ç¨å®¶æ‰€æœ‰ã€‚如需轉載請與0755-82949061è¯ç³»ã€‚任何媒體ã€ç¶²ç«™æˆ–å€‹äººè½‰è¼‰ä½¿ç”¨æ™‚é ˆæ³¨æ˜Žä¾†æºâ€œä¸åœ‹å‚³å‹•ç¶²â€ï¼Œé•å者本網將追究其法律責任。
本網轉載并注明其他來æºçš„稿件,å‡ä¾†è‡ªäº’è¯ç¶²æˆ–æ¥å…§æŠ•稿人士,版權屬于原版權人。轉載請ä¿ç•™ç¨¿ä»¶ä¾†æºåŠä½œè€…ï¼Œç¦æ¢æ“…自篡改,é•è€…è‡ªè² ç‰ˆæ¬Šæ³•å¾‹è²¬ä»»ã€‚
相關資訊