☰

DeepSeek全方位碾壓GPT4o　一張圖看懂AI黑馬強在哪

記者蘇晟彥／綜合報導

DeepSeek（深度求索）強勢崛起，推出新AI模型DeepSeek R1在全世界引起關注，在28日更引發輝達股價歷史狂跌。對此，早在內部報告中就透露，DeepSeek跟時下最熱門的ChatGPT4o相比，在各方面數據上都碾壓，儘管還有「禁詞限制」，但無疑引起全世界關注其所有動向。

▼中國AI黑馬DeepSeek震撼晶片市場。（圖／路透）

在DeepSeek官網可查詢的公開資料中，針對DeepSeek與其他語言模型進行正確率比較，分別在MMLU-Pro（大規模多任務語言理解）、GPQA-diamond（一個測試化學、物理和生物學專業知識的高難度智能基準）、MATH 500（數學五百題）、AIME 2024（美國國際數學邀請賽2024）及Codeforces（程式設計測試）及 SWE-bench Verifled（程式碼生成評估基準）進行測試。

DeepSeek-V3與ChatGPT-4o-0513相比，在各方面幾乎都是碾壓、性能優於其他模型，從下圖可以瞭解，在各方面都沒有輸給GPT。並且官方表示，DeepSeek-V3達到了與領先的閉源模型相當的性能，此外，DeepSeek-V3這款語言模型的訓練過程非常穩定，在整個過程中沒有遇到任何不可恢復的損失高峰或執行任何回滾（rollback）。

▼DeepSeek-V3各方面碾壓ChatGPT。

DeepSeek全方位碾壓GPT4o 一張圖看懂AI黑馬強在哪

相關資訊

DeepSeek全方位碾壓GPT4o　一張圖看懂AI黑馬強在哪