☰

針鋒相對！Kimi和DeepSeek同日發佈新模型，對標 OpenAI o1！

國產AI大模型，提前過年了。

1月20日晚間，月之暗面（Kimi）和深度求索（DeepSeek）這兩大備受矚目的AI大模型創業公司，幾乎是同時發佈了新模型，並均聲稱新模型的性能對標OpenAI的o1模型。值得注意的是，在DeepSeek發佈新模型後的兩小時後，Kimi緊隨其後也推出了新模型，頗有些“針鋒相對”的意味。

在去年年底DeepSeek爆火之後，這家來自來自杭州、低調又神秘的創業公司賺足世人眼球的同時，也極大地改變了國產大模型創業公司的競爭格局，對國產大模型“六小虎”構成了一定的衝擊。作爲行業的“鮎魚”，DeepSeek如今的一舉一動都攪動着行業的潮流。進入2025年，國產大模型之間的競爭將變得越來越激烈，一場決定存亡的“決戰”已經打槍。

同日發佈對標OpenAI o1的新模型

1月20日晚間，深度求索公司正式發佈新模型DeepSeek-R1，並同步開源模型權重。據官方介紹，DeepSeek-R1在後訓練階段大規模使用了強化學習技術，在僅有極少標註數據的情況下，極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上，性能比肩OpenAI o1正式版。

根據其發佈的模型性能評測結果，在美國數學競賽（AMC）中難度等級最高的AIME以及全球頂級編程競賽（codeforces）等權威評測中，DeepSeek-R1模型成績與OpenAI o1不相上下，甚至在某些指標小幅超越OpenAI o1模型。與此同時，除了DeepSeek-R1以外，團隊還開源了6個由R1模型蒸餾而來的小型模型，其中的32B與70B模型性能也能比肩OpenAI-o1-mini模型。

在API定價方面，DeepSeek延續了一貫的低價風格，輸入費用低至每百萬tokens 1元（緩存命中）/4元（緩存未命中），輸出費用僅爲每百萬tokens 16元，整體支出較o1節省96%，這無疑使得Deepseek-R1在成本效益上具備了壓倒性的競爭力。

就在DeepSeek-R1發佈後的短短兩個小時後，月之暗面也發佈了k1.5多模態思考模型。據介紹，從基準測試成績看，k1.5多模態思考模型實現了SOTA（state-of-the-art）級別的多模態推理和通用推理能力。（在科學研究、技術發展和各種專業領域中，“SOTA”，通常用來指代某個領域中最先進的技術或方法。）

具體來看，在short-CoT模式下，Kimi k1.5的數學、代碼、視覺多模態和通用能力，大幅超越了全球範圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平，領先達到550%；在long-CoT模式下，Kimi k1.5的數學、代碼、多模態推理能力，也達到長思考SOTA模型OpenAI o1正式版的水平。

國產大模型“六小虎”已變爲“七小強”

去年12月26日，深度求索宣佈全新系列模型DeepSeek-V3上線並同步開源。這一模型不僅以卓越的性能超越或媲美全球頂級的開源及閉源模型，更重要的是訓練成本極低，被稱爲“AI界的拼多多”，以史無前例的性價比被國內外一衆圈內大佬點贊，引發廣泛關注。

隨着DeepSeek-V3的爆火，其背後的大模型創業公司深度求索也進入了大家的視野。過去的半個多月裡，全網都在扒DeepSeek背後的團隊，並發現DeepSeek團隊最大的特點就是年輕，來自清華北大的應屆生在其中非常活躍，核心技術崗位基本以應屆和畢業一兩年的人爲主。因此，這個年輕的、由清北應屆生撐起來的公司也被稱爲“組織形態上最像OpenAI的中國AI公司”。

業內人士分析稱，DeepSeek從創立開始就是中國大模型的技術創新者，在大廠和創業公司都在遵循着Llama架構的時候，它選擇對模型架構進行了全方位創新，提出的一種嶄新的MLA（一種新的多頭潛在注意力機制）架構，把顯存佔用降到了過去最常用的MHA架構的5%—13%，同時獨創的DeepSeekMoESparse結構也把計算量降到極致，最終促成了成本的下降。而且與早期的OpenAI類似的是，Deepseek兼具高密度的人才團隊和持續創新的精神，因而能持續地給中國大模型帶來驚喜。

而事實上，月之暗面也曾被視爲“最有可能成爲中國OpenAI的公司”。去年年初，月之暗面憑藉以長文本爲核心優勢的Kimi智能助手產品火爆出圈。彼時，頭頂着“90後清華校友技術天才創業者”“最強長文本”等諸多光環，月之暗面迅速完成了鉅額的融資，吸引一衆知名投資機構加持，躋身“200億元估值俱樂部”，成爲國產大模型創業公司的“頂流”。

然而在爆火之後，Kimi因激進的流量投放策略、創始人套現傳聞、投資人仲裁風波等事件，屢屢陷入輿論的風口浪尖。與此同時，國產大模型的競賽在經歷了“百模大戰”後，尚留在牌桌中的玩家之間的競爭也更趨於激烈。Kimi不僅在流量投放上面臨着字節豆包的瘋狂進攻，而且競爭對手也紛紛發力長文本能力，Kimi的優勢逐漸變得不那麼明顯。

頭頂着“清北應屆生”光環的DeepSeek，無疑給包括Kimi在內的國產大模型創業公司帶來了壓力。業內有人認爲，DeepSeek事實上已經可以和“六小虎”（智譜AI、月之暗面、百川智能、Minimax、階躍星辰、零一萬物）並列成爲“七小強”。更重要的是，DeepSeek由國內知名量化資管巨頭幻方量化創立，未進行過任何融資，特點是“少花錢多辦事”，與依靠融資輸血、估值水漲船高的其他創業公司相比顯得格外另類。

這一低調的技術黑馬，無論是技術路線還是發展模式，都走出了一條與衆不同的道路，也改變了國產大模型的競爭格局。隨着競爭繼續向深水區挺進，誰能留在牌桌上笑到最後，或許能在2025年見分曉。

責編：李丹

校對：祝甜婷

針鋒相對！Kimi和DeepSeek同日發佈新模型，對標 OpenAI o1！

相關資訊