國產大模型又有重磅!阿里發佈通義千問旗艦版模型,採用開源策略

紅星資本局1月30日消息,據“阿里雲”微信公衆號,1月29日凌晨,阿里雲通義千問旗艦版模型Qwen2.5-Max全新升級發佈。

據介紹,Qwen2.5-Max模型是阿里雲通義團隊對MoE(混合專家)模型的最新探索成果,預訓練數據超過20萬億tokens,展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分。這是繼DeepSeek之後又一國產AI大模型,且同樣是開源模型。

阿里雲發佈新AI大模型

阿里美股大漲

阿里雲通義團隊將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中,Qwen2.5-Max全部超越了對比模型。在測試大學水平知識的MMLU-Pro、評估編程能力的LiveCodeBench、綜合能力評估的LiveBench,以及近似人類偏好的Arena-Hard等多個權威評測中,該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的性能。

1月28日,阿里還開源了全新的視覺理解模型Qwen2.5-VL,推出了3B、7B、72B三個尺寸版本。其中,旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍,全面超越GPT-4o與Claude3.5。

值得一提的是,阿里雲是今年總檯春晚雲計算AI獨家合作伙伴,主要爲春晚提供兩部分技術支持:一是阿里云云轉播技術支持全球華人云上看春晚,二是阿里雲通義大模型技術支持春晚節目創新,創造全新的視聽效果。

受新模型的影響,阿里巴巴(BABA.US)當天的股價一度漲超7%,收漲6.71%;1月29日盤中再度大漲,收漲0.71%,報96.715美元。

採用開源模型策略

不同於OpenAI等多數大模型廠商採取的閉源策略,阿里雲、Meta(臉書母公司)和DeepSeek採用的都是開源策略。

DeepSee發佈的DeepSeek-R1模型,以較低成本實現與OpenAI開發的GPT-o1相當的性能,引發市場對AI硬件需求的擔憂,英偉達等半導體板塊暴跌。DeepSeek的成功也被認爲是開源模型的勝利。

圖靈獎得主、Meta首席人工智能科學家楊立昆(Yann LeCun)此前表示,DeepSeek成功的正確解讀應是“開源模型正超越專有模型”。

“DeepSeek從開放研究和開源獲益良多,他們提出新想法,並基於其他人的工作進行創新。”楊立昆表示,“由於他們的工作是公開和開源的,所有人都能從中獲益。這就是開源研究和開源技術的力量。”

阿里集團CEO吳泳銘曾表示:“通義的開源模型在中文世界的開發者使用廣泛,當開發者使用阿里雲的開源模型,需要把應用部署到線上的時候,就會自然而然地選用阿里雲的服務。”

1月29日,MetaCEO馬克·扎克伯格在財報後電話會上表示,在開源領域,一家公司的進步最終會使其他公司都受益,Meta也將持續發佈自己的免費開源模型Llama系列。

紅星新聞記者 吳丹若

編輯 肖世清