英偉達:DeepSeek R1是最先進推理開放模型,現已搭載NIM微服務

鞭牛士報道,1月31日消息,英偉達官方公告稱,DeepSeek-R1 是一個具有最先進推理能力的開放模型。DeepSeek-R1 等推理模型不會提供直接響應,而是對查詢進行多次推理,採用思路鏈、共識和搜索方法來生成最佳答案。

執行這一系列推理過程(使用推理得出最佳答案)稱爲測試時間擴展。DeepSeek-R1 是此擴展定律的完美示例,證明了加速計算對於代理 AI推理的需求至關重要。

由於模型可以反覆思考問題,因此它們會創建更多輸出標記和更長的生成周期,因此模型質量會不斷提高。大量的測試時計算對於實現實時推理和來自 DeepSeek-R1 等推理模型的更高質量響應至關重要,這需要更大規模的推理部署。

R1 在需要邏輯推理、推理、數學、編碼和語言理解的任務中提供了領先的準確性,同時還提供了高推理效率。

爲了幫助開發人員安全地試驗這些功能並構建自己的專用代理,6710 億參數的 DeepSeek-R1 模型現已作爲 NVIDIA NIM 微服務預覽版在build.nvidia.com上提供。

DeepSeek-R1 NIM 微服務可以在單個 NVIDIA HGX H200 系統上每秒提供多達 3,872 個令牌。

開發人員可以使用應用程序編程接口 (API) 進行測試和試驗,該接口預計很快將作爲可下載的 NIM 微服務提供,是NVIDIA AI Enterprise軟件平臺的一部分。

DeepSeek-R1 NIM 微服務通過支持行業標準 API 簡化了部署。企業可以通過在其首選的加速計算基礎設施上運行 NIM 微服務來最大限度地提高安全性和數據隱私。通過使用NVIDIA AI Foundry和NVIDIA NeMo軟件,企業還可以爲專門的 AI 代理創建定製的 DeepSeek-R1 NIM 微服務。