☰

國產大模型又有重磅！阿里發佈通義千問旗艦版模型，採用開源策略

紅星資本局1月30日消息，據“阿里雲”微信公衆號，1月29日凌晨，阿里雲通義千問旗艦版模型Qwen2.5-Max全新升級發佈。

據介紹，Qwen2.5-Max模型是阿里雲通義團隊對MoE（混合專家）模型的最新探索成果，預訓練數據超過20萬億tokens，展現出極強勁的綜合性能，在多項公開主流模型評測基準上錄得高分。這是繼DeepSeek之後又一國產AI大模型，且同樣是開源模型。

阿里雲發佈新AI大模型

阿里美股大漲

阿里雲通義團隊將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B，以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中，Qwen2.5-Max全部超越了對比模型。在測試大學水平知識的MMLU-Pro、評估編程能力的LiveCodeBench、綜合能力評估的LiveBench，以及近似人類偏好的Arena-Hard等多個權威評測中，該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩，甚至領先的性能。

1月28日，阿里還開源了全新的視覺理解模型Qwen2.5-VL，推出了3B、7B、72B三個尺寸版本。其中，旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍，全面超越GPT-4o與Claude3.5。

值得一提的是，阿里雲是今年總檯春晚雲計算AI獨家合作伙伴，主要爲春晚提供兩部分技術支持：一是阿里云云轉播技術支持全球華人云上看春晚，二是阿里雲通義大模型技術支持春晚節目創新，創造全新的視聽效果。

受新模型的影響，阿里巴巴（BABA.US）當天的股價一度漲超7%，收漲6.71%；1月29日盤中再度大漲，收漲0.71%，報96.715美元。

採用開源模型策略

不同於OpenAI等多數大模型廠商採取的閉源策略，阿里雲、Meta（臉書母公司）和DeepSeek採用的都是開源策略。

DeepSee發佈的DeepSeek-R1模型，以較低成本實現與OpenAI開發的GPT-o1相當的性能，引發市場對AI硬件需求的擔憂，英偉達等半導體板塊暴跌。DeepSeek的成功也被認爲是開源模型的勝利。

圖靈獎得主、Meta首席人工智能科學家楊立昆（Yann LeCun）此前表示，DeepSeek成功的正確解讀應是“開源模型正超越專有模型”。

“DeepSeek從開放研究和開源獲益良多，他們提出新想法，並基於其他人的工作進行創新。”楊立昆表示，“由於他們的工作是公開和開源的，所有人都能從中獲益。這就是開源研究和開源技術的力量。”

阿里集團CEO吳泳銘曾表示：“通義的開源模型在中文世界的開發者使用廣泛，當開發者使用阿里雲的開源模型，需要把應用部署到線上的時候，就會自然而然地選用阿里雲的服務。”

1月29日，MetaCEO馬克·扎克伯格在財報後電話會上表示，在開源領域，一家公司的進步最終會使其他公司都受益，Meta也將持續發佈自己的免費開源模型Llama系列。

紅星新聞記者吳丹若

編輯肖世清

國產大模型又有重磅！阿里發佈通義千問旗艦版模型，採用開源策略

相關資訊