針鋒相對!Kimi和DeepSeek同日發佈新模型,對標 OpenAI o1!
國產AI大模型,提前過年了。
1月20日晚間,月之暗面(Kimi)和深度求索(DeepSeek)這兩大備受矚目的AI大模型創業公司,幾乎是同時發佈了新模型,並均聲稱新模型的性能對標OpenAI的o1模型。值得注意的是,在DeepSeek發佈新模型後的兩小時後,Kimi緊隨其後也推出了新模型,頗有些“針鋒相對”的意味。
在去年年底DeepSeek爆火之後,這家來自來自杭州、低調又神秘的創業公司賺足世人眼球的同時,也極大地改變了國產大模型創業公司的競爭格局,對國產大模型“六小虎”構成了一定的衝擊。作爲行業的“鮎魚”,DeepSeek如今的一舉一動都攪動着行業的潮流。進入2025年,國產大模型之間的競爭將變得越來越激烈,一場決定存亡的“決戰”已經打槍。
同日發佈對標OpenAI o1的新模型
1月20日晚間,深度求索公司正式發佈新模型DeepSeek-R1,並同步開源模型權重。據官方介紹,DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
根據其發佈的模型性能評測結果,在美國數學競賽(AMC)中難度等級最高的AIME以及全球頂級編程競賽(codeforces)等權威評測中,DeepSeek-R1模型成績與OpenAI o1不相上下,甚至在某些指標小幅超越OpenAI o1模型。與此同時,除了DeepSeek-R1以外,團隊還開源了6個由R1模型蒸餾而來的小型模型,其中的32B與70B模型性能也能比肩OpenAI-o1-mini模型。
在API定價方面,DeepSeek延續了一貫的低價風格, 輸入費用低至每百萬tokens 1元(緩存命中)/4元(緩存未命中),輸出費用僅爲每百萬tokens 16元,整體支出較o1節省96%,這無疑使得Deepseek-R1在成本效益上具備了壓倒性的競爭力。
就在DeepSeek-R1發佈後的短短兩個小時後,月之暗面也發佈了k1.5多模態思考模型。據介紹,從基準測試成績看,k1.5多模態思考模型實現了SOTA(state-of-the-art)級別的多模態推理和通用推理能力。(在科學研究、技術發展和各種專業領域中,“SOTA”,通常用來指代某個領域中最先進的技術或方法。)
具體來看,在short-CoT模式下,Kimi k1.5的數學、代碼、視覺多模態和通用能力,大幅超越了全球範圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領先達到550%;在long-CoT模式下,Kimi k1.5的數學、代碼、多模態推理能力,也達到長思考SOTA模型OpenAI o1正式版的水平。
國產大模型“六小虎”已變爲“七小強”
去年12月26日,深度求索宣佈全新系列模型DeepSeek-V3上線並同步開源。這一模型不僅以卓越的性能超越或媲美全球頂級的開源及閉源模型,更重要的是訓練成本極低,被稱爲“AI界的拼多多”,以史無前例的性價比被國內外一衆圈內大佬點贊,引發廣泛關注。
隨着DeepSeek-V3的爆火,其背後的大模型創業公司深度求索也進入了大家的視野。過去的半個多月裡,全網都在扒DeepSeek背後的團隊,並發現DeepSeek團隊最大的特點就是年輕,來自清華北大的應屆生在其中非常活躍,核心技術崗位基本以應屆和畢業一兩年的人爲主。因此,這個年輕的、由清北應屆生撐起來的公司也被稱爲“組織形態上最像OpenAI的中國AI公司”。
業內人士分析稱,DeepSeek從創立開始就是中國大模型的技術創新者,在大廠和創業公司都在遵循着Llama架構的時候,它選擇對模型架構進行了全方位創新,提出的一種嶄新的MLA(一種新的多頭潛在注意力機制)架構,把顯存佔用降到了過去最常用的MHA架構的5%—13%,同時獨創的DeepSeekMoESparse結構也把計算量降到極致,最終促成了成本的下降。而且與早期的OpenAI類似的是,Deepseek兼具高密度的人才團隊和持續創新的精神,因而能持續地給中國大模型帶來驚喜。
而事實上,月之暗面也曾被視爲“最有可能成爲中國OpenAI的公司”。去年年初,月之暗面憑藉以長文本爲核心優勢的Kimi智能助手產品火爆出圈。彼時,頭頂着“90後清華校友技術天才創業者”“最強長文本”等諸多光環,月之暗面迅速完成了鉅額的融資,吸引一衆知名投資機構加持,躋身“200億元估值俱樂部”,成爲國產大模型創業公司的“頂流”。
然而在爆火之後,Kimi因激進的流量投放策略、創始人套現傳聞、投資人仲裁風波等事件,屢屢陷入輿論的風口浪尖。與此同時,國產大模型的競賽在經歷了“百模大戰”後,尚留在牌桌中的玩家之間的競爭也更趨於激烈。Kimi不僅在流量投放上面臨着字節豆包的瘋狂進攻,而且競爭對手也紛紛發力長文本能力,Kimi的優勢逐漸變得不那麼明顯。
頭頂着“清北應屆生”光環的DeepSeek,無疑給包括Kimi在內的國產大模型創業公司帶來了壓力。業內有人認爲,DeepSeek事實上已經可以和“六小虎”(智譜AI、月之暗面、百川智能、Minimax、階躍星辰、零一萬物)並列成爲“七小強”。更重要的是,DeepSeek由國內知名量化資管巨頭幻方量化創立,未進行過任何融資,特點是“少花錢多辦事”,與依靠融資輸血、估值水漲船高的其他創業公司相比顯得格外另類。
這一低調的技術黑馬,無論是技術路線還是發展模式,都走出了一條與衆不同的道路,也改變了國產大模型的競爭格局。隨着競爭繼續向深水區挺進,誰能留在牌桌上笑到最後,或許能在2025年見分曉。
責編:李丹
校對:祝甜婷