☰

阿里巴巴Qwen2.5-Max正式發佈超越GPT-4o和DeepSeek-V3

據通義官微，1月29日，Qwen2.5-Max正式發佈。Qwen2.5-Max在知識（測試大學水平知識的MMLU-Pro）、編程（LiveCodeBench）、全面評估綜合能力的（LiveBench）以及人類偏好對齊（Arena-Hard）等主流權威基準測試上，展現出全球領先的模型性能。通義團隊分別對Qwen2.5-Max的指令（Instruct）模型版本和基座（base）模型版本性能進行了評估測試。指令模型是所有人可直接對話體驗到的模型版本，在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準測試中，Qwen2.5-Max比肩Claude-3.5-Sonnet，並幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

本文源自：金融界AI電報

相關資訊

▣ 阿里巴巴稱其新AI模型性能全球領先超越GPT-4o、DeepSeek-V3
▣ 阿里發佈AI模型新版本：稱已超越DeepSeek和GPT-4o
阿里巴巴也發表新AI　號稱贏過DeepSeek V3
▣ 阿里發佈Qwen2-Math：數學推理全球第一，超越GPT-4o和Claude-3.5
▣ Alibaba 發佈 Qwen 2.5-Max AI 模型，稱性能超越 DeepSeek-V3
▣ AI早知道｜阿里開源全新多模態模型 Qwen2.5-VL-32B；DeepSeek-V3模型發佈
▣ 阿里巴巴：即將推出基於Qwen2.5-MAX的深度推理模型
▣ 馬斯克發佈Grok3超GPT-4o，DeepSeek慌了嗎
▣ 阿里發佈開源多模態模型Qwen2-VL，多項性能超越GPT-4o
▣ 阿里發佈通義千問旗艦版模型聲稱超越DeepSeek 阿里巴巴美股一度漲超7%
▣ 美股異動｜阿里巴巴漲近4% 公司發佈AI模型聲稱超越DeepSeek
阿里巴巴通義千問Qwen3-Max-Thinking登場！HLE評測輾壓GPT-5.2 讓AI越想越聰明
▣ 阿里巴巴發佈新一代端到端多模態旗艦模型Qwen2.5-Omni
阿里巴巴推新一代AI模型號稱超越DeepSeek
▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
▣ 最新全球模型盲測榜單：阿里Qwen2.5-Max超DeepSeek V3，以1332分位列全球第七名，非推理類中國大模型冠軍
號稱匹敵GPT-4o　陸AI模型DeepSeek-V3訓練僅花558萬美元
▣ 性能堪比GPT-4o，DeepSeek-V3刷屏了！算力行業迎來機遇期
號稱「全面超越DeepSeek」阿里巴巴新一代AI模型登場
▣ 阿里吳泳銘：近期發佈基於Qwen2.5-Max的深度推理模型
▣ 訊飛星火4.0 Turbo正式發佈！七大能力全面超GPT-4 Turbo 數學代碼能力超GPT-4o
▣ 阿里巴巴，重磅發佈“AI超級應用”！
▣ 阿里巴巴續漲2.9% 發佈新版通義千問Qwen 2.5-Max AI模型
▣ 阿里雲宣佈支持雲上一鍵部署DeepSeek-V3、DeepSeek-R1
▣ 阿里巴巴重磅發佈！
▣ 阿里巴巴集團發佈公告，正式完成香港雙重主要上市
▣ 阿里巴巴正式納入港股通
▣ 馬斯克發佈Grok3大模型，現場演示稱超越DeepSeek V3

DMCA | PRIVACY | s@bg3.co

阿里巴巴Qwen2.5-Max正式發佈 超越GPT-4o和DeepSeek-V3

相關資訊

阿里巴巴Qwen2.5-Max正式發佈超越GPT-4o和DeepSeek-V3