☰

智源最新模型評測：百度文心大模型4.0登頂閉源榜

北京商報訊（記者魏蔚）6月18日，北京商報記者獲悉，北京智源研究院打造的FlagEval天秤大模型評測平臺實現了全面升級，並公佈202406期FlagEval模型評測排行榜單。最新一期榜單顯示，百度文心大模型4.0以89.72的綜合評分在閉源對話模型中排名第一，

FlagEval天秤大模型評測平臺是智源研究院推出的科學、權威、公正、開放的大模型評測體系，自2023年發佈以來，已從主要面向語言模型擴展到視頻、語音、多模態模型，實現多領域全覆蓋，目前已評測國內外 300 餘個開源和商業閉源的語言及多模態大模型。資料顯示，FlagEval大語言模型評測體系當前包含6大評測任務，近30個評測數據集，超10萬道評測題目。

相關資訊

▣ 智源最新模型評測：百度文心大模型4.0登頂閉源榜超GPT-4o等
▣ 智源發佈大模型評測榜：語言模型字節第一百度第二
百度突宣佈文心大模型「開源」　創辦人曾說：「閉源」最能打
▣ 百度發表文心大模型4.0
▣ 百度正式開源文心大模型4.5 系列模型
▣ 百度正式開源文心大模型4.5系列模型
▣ 階躍星辰開源新圖生視頻模型，性能登頂 VBench 評測榜
▣ 百度李彥宏：開源模型是智商稅，閉源模型更強大、推理成本更低
▣ 百度李彥宏：文心大模型4.5系列將開源，是最強大的文心大模型
▣ 堅定的閉源擁躉百度文心大模型未來如何擁抱開源？
▣ 百度文心大模型4.5系列正式開源，涵蓋10款模型
▣ 基於阿里最新開源的Qwen3-32B模型 DeepSWE開源AI Agent登頂榜首
▣ 北京開源大模型Kimi K2登頂全球榜單
▣ 奮力一搏，百度開源文心大模型4.5
▣ 百度確認：下一代文心大模型開源！
▣ 百度決定開源下一代文心大模型
▣ 百度宣佈文心智能體平臺免費開放文心大模型4.0
▣ 百度文心一言免費後，還要開源下一代模型；李彥宏曾稱開源模型是智商稅
▣ 開源、閉源孰是孰非？“開源模型是工具，閉源模型是產品”
▣ 百度突然宣佈下一代文心大模型開源
▣ 百度CEO李彥宏：大模型沒有應用，光有基礎模型，不管是開源還是閉源都一文不值
對標「GPT-4」百度正式推出文心大模型4.0
▣ 李彥宏：文心大模型4.5系列將開源是最強大的文心大模型
▣ 大模型融合！最新「進化算法」全自動組合開源模型，刷榜多項基準測試
▣ 李彥宏重申文心大模型不開源：閉源模型能力會持續領先丨GAI進化論⑨
▣ 阿里通義千問大模型登頂全球開源社區榜首
▣ 百度副總裁：文心大模型4.0 Turbo面向企業開放，系列模型繼續降價
▣ 李彥宏：“百模大戰”是資源浪費，商業化的閉源模型纔是最能打的
▣ 智源公佈FlagEval“百模”評測結果

DMCA | PRIVACY | s@bg3.co