DeepSeek有多強? 《紐時》記者實測「這1點」大勝ChatGPT
▲國外記者實測DeepSeek與其他AI聊天機器人的差異。(圖/路透)
記者張方瑀/綜合報導
中國DeepSeek(深度求索)推出新AI模型DeepSeek R1在全球AI界造成轟動,甚至撼動美國股市走向。國外記者實測DeepSeek與其他AI聊天機器人的差異,結果發現,在需要從網路獲取答案的情況下,DeepSeek的回答中出現的錯誤比ChatGPT還要少,但在寫詩、規劃旅遊行程等內容時,答案就比ChatGPT略遜一籌。
《紐約時報》記者Eli Tan比較了DeepSeek與OpenAI的ChatGPT、Anthropic的Claude的差異,結果初步測試結果讓他感到相當驚豔。
Eli Tan首先指出,DeepSeek解答數學、物理和邏輯問題的速度比ChatGPT快幾乎一倍,「當我問一些與技術面試相關的程式設計問題時,它的回覆既深入又快速,與競爭對手旗鼓相當。」
Eli Tan表示,在需要從網路獲取答案的情況下,「DeepSeek的回答中出現的「幻覺」(錯誤或虛構內容)似乎比ChatGPT少。」不過他也提到,在寫詩、短篇故事、規劃旅遊行程和提供晚餐食譜的表現上,DeepSeek的答案略遜一籌。
▲中國AI新創公司DeepSeek(深度求索)推出新AI模型DeepSeek R1。(圖/路透)
至於DeepSeek的缺點,首先就是一些敏感的中國政治問題,它會給出「這超出了我的當前範圍」、「我們聊點別的吧」、「目前流量過高,無法提供回覆」等迴應。
Eli Tan指出,DeepSeek與其他AI公司一樣,會透過用戶輸入的內容來訓練其模型和聊天機器人。DeepSeek在分析文件,例如公司財務報表的PDF時,能力似乎比Claude和ChatGPT更有限。
此外,DeepSeek其最新更新並未包括天氣數據,沒有辦法實時迴應某一地點的天氣狀況,這點Claude也同樣沒有辦法做到,但ChatGPT可以從當地新聞網站和氣象網站獲取天氣報告。
當Eli Tan詢問DeepSeek爲什麼它比其他競爭對手更優秀時,DeepSeek回答,它的成本效益高且定製化選項更多,特別是在中文方面有專長,「可以把DeepSeek想像成針對特定需求(尤其是中文)而設計的專業工具,而ChatGPT則是多功能的全能助手。」
►狂輸DeepSeek!法國AI聊天機器人「露西」表現太荒謬 3天就被下線►DeepSeek橫斬矽谷!ChatGPT之父贊「表現出色」 曝OpenAI不同路徑►血洗美股!英特爾前CEO稱「市場過度反應」:對DeepSeek理解錯誤