DeepSeek全方位碾壓GPT4o 一張圖看懂AI黑馬強在哪
記者蘇晟彥/綜合報導
DeepSeek(深度求索)強勢崛起,推出新AI模型DeepSeek R1在全世界引起關注,在28日更引發輝達股價歷史狂跌。對此,早在內部報告中就透露,DeepSeek跟時下最熱門的ChatGPT4o相比,在各方面數據上都碾壓,儘管還有「禁詞限制」,但無疑引起全世界關注其所有動向。
▼中國AI黑馬DeepSeek震撼晶片市場。(圖/路透)
在DeepSeek官網可查詢的公開資料中,針對DeepSeek與其他語言模型進行正確率比較,分別在MMLU-Pro(大規模多任務語言理解)、GPQA-diamond(一個測試化學、物理和生物學專業知識的高難度智能基準)、MATH 500(數學五百題)、AIME 2024(美國國際數學邀請賽2024)及Codeforces(程式設計測試)及 SWE-bench Verifled(程式碼生成評估基準)進行測試。
DeepSeek-V3與ChatGPT-4o-0513相比,在各方面幾乎都是碾壓、性能優於其他模型,從下圖可以瞭解,在各方面都沒有輸給GPT。並且官方表示,DeepSeek-V3達到了與領先的閉源模型相當的性能,此外,DeepSeek-V3這款語言模型的訓練過程非常穩定,在整個過程中沒有遇到任何不可恢復的損失高峰或執行任何回滾(rollback)。
▼DeepSeek-V3各方面碾壓ChatGPT。