☰

DeepSeek有多強？　《紐時》記者實測「這1點」大勝ChatGPT

▲國外記者實測DeepSeek與其他AI聊天機器人的差異。（圖／路透）

記者張方瑀／綜合報導

中國DeepSeek（深度求索）推出新AI模型DeepSeek R1在全球AI界造成轟動，甚至撼動美國股市走向。國外記者實測DeepSeek與其他AI聊天機器人的差異，結果發現，在需要從網路獲取答案的情況下，DeepSeek的回答中出現的錯誤比ChatGPT還要少，但在寫詩、規劃旅遊行程等內容時，答案就比ChatGPT略遜一籌。

《紐約時報》記者Eli Tan比較了DeepSeek與OpenAI的ChatGPT、Anthropic的Claude的差異，結果初步測試結果讓他感到相當驚豔。

Eli Tan首先指出，DeepSeek解答數學、物理和邏輯問題的速度比ChatGPT快幾乎一倍，「當我問一些與技術面試相關的程式設計問題時，它的回覆既深入又快速，與競爭對手旗鼓相當。」

Eli Tan表示，在需要從網路獲取答案的情況下，「DeepSeek的回答中出現的「幻覺」（錯誤或虛構內容）似乎比ChatGPT少。」不過他也提到，在寫詩、短篇故事、規劃旅遊行程和提供晚餐食譜的表現上，DeepSeek的答案略遜一籌。

▲中國AI新創公司DeepSeek（深度求索）推出新AI模型DeepSeek R1。（圖／路透）

至於DeepSeek的缺點，首先就是一些敏感的中國政治問題，它會給出「這超出了我的當前範圍」、「我們聊點別的吧」、「目前流量過高，無法提供回覆」等迴應。

Eli Tan指出，DeepSeek與其他AI公司一樣，會透過用戶輸入的內容來訓練其模型和聊天機器人。DeepSeek在分析文件，例如公司財務報表的PDF時，能力似乎比Claude和ChatGPT更有限。

此外，DeepSeek其最新更新並未包括天氣數據，沒有辦法實時迴應某一地點的天氣狀況，這點Claude也同樣沒有辦法做到，但ChatGPT可以從當地新聞網站和氣象網站獲取天氣報告。

當Eli Tan詢問DeepSeek爲什麼它比其他競爭對手更優秀時，DeepSeek回答，它的成本效益高且定製化選項更多，特別是在中文方面有專長，「可以把DeepSeek想像成針對特定需求（尤其是中文）而設計的專業工具，而ChatGPT則是多功能的全能助手。」

►狂輸DeepSeek！法國AI聊天機器人「露西」表現太荒謬　3天就被下線►DeepSeek橫斬矽谷！ChatGPT之父贊「表現出色」　曝OpenAI不同路徑►血洗美股！英特爾前CEO稱「市場過度反應」：對DeepSeek理解錯誤

相關資訊

DMCA | PRIVACY | s@bg3.co