號稱「全面超越DeepSeek」 阿里巴巴新一代AI模型登場
阿里巴巴官方表示,旗下的的通義千問旗艦版模型Qwen 2.5-Max在多項測試中得分超越了DeepSeek的V3。(圖/新浪人工智慧微博)
在大陸人工智慧公司深度求索(DeepSeek)引發華爾街震盪之際,阿里巴巴旗下的「阿里雲」宣佈推出新一代AI模型「通義千問 Qwen 2.5-Max」,這項超大規模 MoE 語言模型立刻引發業界關注。阿里雲宣稱,此模型在多項權威基準測試中表現優異,甚至超越了聲名大噪的 DeepSeek V3。
據阿里雲微信公衆號消息,Qwen2.5-Max模型是阿里雲通義團隊對MoE模型的最新探索成果,預訓練數據超過20兆tokens。目前,開發者可在Qwen Chat平臺免費體驗模型,企業和機構也可透過阿里雲百鍊平臺直接調用新模型API服務。
通義模型介面。(翻攝自通義官網)
通義千問旗艦版模型Qwen 2.5-Max與其它人工智慧在各領域的表現分數比較。(圖/阿里通義官方微博)
阿里雲表示,新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。
通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能進行評估測試發現,Qwen2.5-Max在前者比肩Claude-3.5-Sonnet,並幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。而在後者11項基準測試中,Qwen2.5-Max全部超越了對比模型,包括GPT-4o、DeepSeek-V3及Llama-3.1-405B。