☰

硅谷手記｜DeepSeek有望激發新一波人工智能創新浪潮

新華社舊金山1月27日電　硅谷手記｜DeepSeek有望激發新一波人工智能創新浪潮　　新華社記者吳曉凌　　中國人工智能（AI）企業深度求索（DeepSeek）日前發佈其最新開源模型DeepSeek-R1，用較低的成本達到了接近於美國開放人工智能研究中心（OpenAI）開發的GPT-o1的性能。這一進展破解了全球人工智能產業長期以來“堆算力”的路徑依賴，其影響波及資本市場。業界人士認爲，DeepSeek模型有望激發一波創新浪潮，推動全球AI繼續進步。

“更大不再等於更聰明”

據深度求索公司官網介紹，DeepSeek-R1在後訓練階段大規模使用了強化學習技術，在僅有很少標註數據的情況下極大提升了模型的推理能力，在數學、代碼、自然語言推理等任務上，測評性能與GPT-o1模型正式版接近。　　國際投行摩根士丹利表示，“更大（的模型）不再等於更聰明”，DeepSeek通過顯著提高數據質量和改進模型架構，展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說，DeepSeek的模型現在低成本優勢突出，與國際知名大模型相比，其成本大約低了一個數量級。　　高盛集團也認爲，DeepSeek新模型的成本遠低於現有模型，這意味着開發利用大模型的門檻降低，互聯網巨頭將面臨初創公司的潛在競爭。　　英國《金融時報》發表的一篇評論文章指出，DeepSeek挑戰了人工智能產業在過去一段時間的核心信念，即認爲更強大的硬件纔是推動人工智能發展的關鍵。

有望激發創新浪潮

摩根士丹利認爲，DeepSeek的模型表明，前沿AI能力可能不需要大量計算資源就能實現。通過巧妙的工程設計和高效的訓練方法，高效利用資源可能比純粹的計算能力更重要。這可能會激發一波創新浪潮，各家企業會探索具有成本效益的AI開發和部署方法。　　DeepSeek的模型是開源共享的。近日，全球知名開源平臺抱抱臉公司等多個團隊已宣佈復現了DeepSeek-R1的訓練過程。美國“元”公司首席AI科學家楊立昆在社交媒體上發文說，DeepSeek-R1的面世，意味着開源模型正在超越閉源模型。　　英國《金融時報》的評論文章說，開源模型DeepSeek-R1對全球用戶產生極大吸引力，有利於推動人工智能技術的開發和應用。文章說，對於大多數商業用戶來說，擁有一款足夠可靠並且好用的模型比擁有絕對領先的模型更重要。“並不是每個司機都需要一輛法拉利。像R1這樣模型的推理能力進步，可能會爲與客戶互動或處理工作任務的‘智能體’帶來突破性變化。”如果能以更低的成本擁有這些模型，企業的盈利能力將提升。　　瑞士瑞銀集團指出，如果AI訓練和推理成本顯著降低，預計更多終端用戶將利用AI來改善他們的業務或開發新的用途。（完）

硅谷手記｜DeepSeek有望激發新一波人工智能創新浪潮

相關資訊