DeepSeek“真香”?微軟之後,英偉達、AWS紛紛接入
21世紀經濟報道記者倪雨晴 深圳報道
開年的AI圈,可真是熱鬧。
DeepSeek激起千層浪。
一邊是硅谷、華爾街都在激辯DeepSeek的影響;另一邊,科技巨頭已經下場無縫連接DeepSeek-R1模型服務。
先是微軟,現在已經將DeepSeek-R1模型添加到其Azure AI Foundry,開發者可以用新模型進行測試和構建基於雲的應用程序和服務。
同時,微軟還將R1的精煉版本引入“Copilot+PC”,率先提供給搭載驍龍X芯片、英特爾酷睿Ultra 200V處理器的PC設備,然後是搭載AMD Ryzen AI 9的設備。
微軟CEO薩蒂亞·納德拉(Satya Nadella)在財報後的電話會議上稱,DeepSeek的新模型“確實有一些創新”,它將得到廣泛應用。在納德拉看來,僅僅發佈最好的新模型是不夠的,必須讓它具有成本效益。
雖然微軟是OpenAI的深度投資者且有很多合作,但在產品商業化上它依然選擇多樣性的模型。目前Azure的平臺上既有OpenAI的GPT系列、Meta的Llama系列、Mistral的模型,現在新增了DeepSeek。
緊接着,AWS(亞馬遜雲科技)也宣佈,用戶可以在Amazon Bedrock和Amazon SageMaker AI兩大AI服務平臺上部署DeepSeek-R1模型。
AWS一直強調的是“一個模型無法解決所有問題”,所以在AWS的平臺上集成了第三方和自家大模型,如今又添加了DeepSeek的模型,用戶可以根據需求選擇最合適的模型。
從微軟和AWS的選擇和動作看,都在用更多、更強大的大模型矩陣,來強化自家的雲業務。眼下雲廠商正在加大AI轉型力度,外界也最關注AI如何驅動雲增長。
微軟最新發布的四季度財報顯示,營收和利潤超預期增長,但是Azure雲業務增長低於預期,當天股價下跌6.18%至414.99美元/股。2025年,雲廠商之間的角逐更加激烈,焦點仍會是AI。
互聯網大廠之外,英偉達也同步上線了搭載DeepSeek-R1的軟件服務。英偉達的官網顯示,DeepSeek-R1模型現已作爲NVIDIA NIM微服務預覽版提供,開發者可以測試和體驗該API,未來提供可下載的NIM微服務版本。
什麼是NIM服務?這是英偉達在2024年新推出的軟件產品,主要助力AI應用開發。Forrester副總裁兼首席分析師戴鯤曾向21世紀經濟報道記者表示,NIM是個推理平臺,融合了底層的CUDA、對自身和第三方大模型的支持、對主流推理框架和雲平臺的集成,可以加速生成式人工智能模型推理全過程,是NVIDIA企業級AI平臺的最後一塊拼圖。
英偉達當然是硬件巨頭,更是軟件專家,它也有自己的B端AI服務平臺,NIM微服務主要是幫助開發者面向未來創造新的應用,不需要從零寫代碼。
所以,英偉達接入DeepSeek-R1也是豐富自家平臺上的模型選項,然後和自家硬件相結合,形成一整套軟硬件AI體系。結合NVIDIA AI Foundry和NVIDIA NeMo軟件,企業還可定製DeepSeek-R1 NIM微服務,以構建特定領域的AI智能體。
R1作爲推理模型,英偉達在介紹中着重強調了其強大的推理能力,並表示推理需要大量的算力支持。
英偉達解析道,DeepSeek-R1採用大規模專家混合(MoE)架構,參數規模高達 6710 億,是許多流行的開源大模型的10倍。其輸入上下文長度可達128000個Token,每層擁有256個專家(Experts),每個Token會被並行路由至8個不同的專家進行推理計算。
而要想實現R1的實時推理,需要大量高算力GPU,並依賴高帶寬、低延遲的通信能力,將輸入 Token高效路由至所有專家進行推理。結合NVIDIA NIM微服務的優化,一個配備8塊H200 GPU並通過NVLink和NVLink Switch互聯的服務器,即可運行完整的6710億參數 DeepSeek-R1 模型,實現高達3872 Token/秒的推理吞吐量。
對於英偉達、AWS和微軟三家巨頭而言,不論“黑貓還是白貓”,能夠上場應用的模型就是“好貓”。而大家迅速接入DeepSeek模型,一方面是認可DeepSeek的能力,另一方面大家的共識是AI成本在降低,都在爲AI普及和應用爆發做更多基礎佈局。
從去年開始,業界大佬就不斷強調成本下降這一觀點,但各有各的邏輯。比如英偉達說AI推理成本下降,主要基於算力效率提高。現在,DeepSeek從算法角度給出了新的解題思路,通過工程創新提高訓練和推理效率,進一步降低成本。
同時,DeepSeek也帶給OpenAI、Anthropic兩大閉源代表更大的競爭壓力。這兩家AI明星已經聚集了巨大資本,2024年都獲得了大額融資。近日Anthropic CEO發文要求加強出口管制;OpenAI動作頻頻,不僅突然宣佈“o3”模型要在週五公佈,還有融資傳聞流出。
據媒體報道,OpenAI正在以3000億美元估值,尋求新一輪的400億美元融資,還有報道稱,軟銀此番計劃最多向OpenAI投資250億美元。這也和不久前推出的Stargate(星際之門)計劃,有所呼應。
可以預見,AI賽場上,你追我趕的競爭態勢愈演愈烈,DeepSeek颳起的旋風還將繼續。表面上看,DeepSeek是一家小型初創企業,但它背後的幻方量化已經成長了近十年,公司招募的多是外人眼中的“天才少年”,精悍的團隊讓DeepSeek的敘事席捲全球。
人才,依然是創新的基石,AI繼續吸引着全球最聰明的腦袋、最頂尖的人才投身其中。DeepSeek的“黑神話”拉開了AI新篇章,這或許是一個新起點,在AI開源世界中,更多的DeepSeek正在孕育中。同時,也讓子彈多飛一會,讓這場圍繞着DeepSeek、成本、AI泡沫、開源閉源的探討越辯越明。