TensorCoreGPU在每一項MLPerf基準測試結果中均實現最佳表現;用戶可通過NGC使用加速堆棧。
在最新公布的業內首套人工智能基準測試中,NVIDIA創下6項人工智能性能記錄。
在谷歌、英特爾、百度、NVIDIA及其他數十家科技行業領軍企業的支持下,新型基準測試套件MLPerf可測定一系列深度學習工作負載。該套件涵蓋了計算機視覺、語言翻譯、個性化推薦以及強化學習任務等領域,旨在成為業內首個客觀的人工智能基準測試套件。
最佳性能表現
NVIDIA在其提交的6個MLPerf基準測試結果中均取得了最佳表現。這些測試涵蓋了多種工作負載和基礎架構規模–從單節點上的16顆GPU到跨80節點上的多達640顆GPU。
這些測試分為6大類別,分別為圖像分類、對象實例分割、目標檢測、臨時翻譯、復發性翻譯與推薦系統。NVIDIA并未提交第7類別,即強化學習的基準測試,原因是該類別尚未充分利用到GPU加速。
NVIDIA在語言翻譯測試類別中表現突出
NVIDIA在語言翻譯這一關鍵基準測試類別中表現尤為出色,僅需6.2分鐘即完成了Transformer神經網絡的訓練。關于NVIDIA參與的6項基準測試結果的更多信息,請訪問NVIDIA開發者新聞中心。
NVIDIA工程師利用NVIDIADGX系統實現了這些測試結果。該系統包括全球最強大的人工智能系統NVIDIADGX-2,搭載了16顆完全連接的V100TensorCoreGPU。
唯一一家參與多達6項基準測試的科技公司
NVIDIA是唯一一家參與多達6項基準測試的科技公司,充分展現出V100TensorCoreGPU在部署人工智能工作負載方面的通用性。
NVIDIA副總裁兼加速計算總經理IanBuck表示:“全新基準MLPerf展示了NVIDIATensorCoreGPU非凡的性能與通用性。我們的TensorCoreGPU擁有高性價比,且可通過各地的云服務提供商及電腦制造商實現供貨,進而幫助世界各地的開發人員在開發過程中的每一個階段推進人工智能的應用?!?/p>
一流的人工智能計算需要“全棧式”創新
要想在復雜多樣的計算工作負載中實現優異性能,不僅僅需要出色的芯片。加速計算也不單單與加速器有關,還需要實現全堆棧創新。
NVIDIA堆棧包括NVIDIATensorCores、NVLink、NVSwitch、DGX系統、CUDA、cuDNN、NCCL、經過優化的深度學習框架容器以及NVIDIA軟件開發套件。
超高易用性
NVIDIA的人工智能平臺是最便捷且高性價比的選擇。TensorCoreGPU可通過各地的云服務提供商及電腦制造商實現供貨。
高性價比的選擇
借助售價僅為2,500美元的超強桌面級GPU-NVIDIATITANRTX,用戶在桌面上也可實現相同的TensorCoreGPU強大功能。如果按照3年使用期來計算,該GPU每小時的費用僅相當于幾美分。
通過NVIDIAGPUCloud(NGC)云容器注冊,用戶可持續更新這些軟件的加速堆棧。
NVIDIA創紀錄的平臺現可通過NGC下載
用于實現NVIDIA業界領先的MLPerf性能的軟件創新與優化,現可通過我們最新的NGC深度學習容器免費獲取。如需下載,請訪問NGC容器注冊。
此容器包含經過NVIDIA優化的完整軟件堆棧及頂級人工智能框架。18.11版本NGC深度學習容器包含了用于實現我們MLPerf基準測試結果的詳細軟件。
開發人員可將這些軟件用于任意地點以及各大開發階段:
·對于桌面數據科學家:此容器支持利用NVIDIATITANRTXGPU開展前沿研究。
·對于工作組:此容器同樣可運行于NVIDIADGXStation。
·對于企業:利用來自阿里云、AWS、百度云、谷歌云、IBM云、MicrosoftAzure、OracleCloudInfrastructure以及騰訊云的NVIDIAGPU加速實例,此容器可加快將人工智能用于其云端數據。
·對于正在構建內部人工智能基礎架構的各組織:來自Atos、思科、Cray、DellEMC、HP、HPE、浪潮、聯想、中科曙光以及Supermicro的NVIDIADGX系統與NGC-Ready系統可讓人工智能投入使用。