☰

年前AI“大亂鬥”：繼豆包、Kimi之後，智譜AI和階躍星辰跟進發布新品

2025年1月，國內AI大模型賽道熱鬧非凡，豆包、Kimi、智譜AI、階躍星辰、騰訊混元等紛紛推出或更新AI模型和應用，猶如一場“大亂鬥”。

1月23日，智譜AI推出了又一個AI智能體Agent GLM-PC1.1，新增深度思考功能，可生成思維鏈來拆解任務，引入代碼機制提升推理能力，並支持Mac和Windows系統，能在社交、信息處理等場景出色完成任務。

與此同時，今日，字節跳動旗下豆包大模型1.5Pro版本正式發佈，已在豆包APP灰度上線，開發者可在火山引擎直接調用API。該版本在知識、代碼、推理、中文等多項公開測評基準上成績全球領先，採用大規模稀疏MoE架構，多模態能力也得到全面提升，視覺理解模型Doubao-1.5-vision-pro理解能力領先，實時語音模型Doubao-1.5-realtime-voice-pro 表現力出色。

同樣在今日，階躍星辰近期一口氣發佈六款新品，包括在語義等方面生成效果大幅提升的 Step-Video V2、推理能力出色的Step R-mini、升級後更能感知情緒且支持多語種的Step- 1o Audio升級版、多模態理解大模型Step-1o Vision，以及專注文字創作的Step-2文學大師版和高性價比的輕量級語言模型Step-2 mini123。

前幾日，字節跳動旗下的豆包在1月21日於豆包APP（7.2.0新春版）全量開放了豆包實時語音大模型，這是一款語音理解和生成一體化的模型，實現端到端語音對話，打破傳統級聯模式侷限，在語音表現力、控制力、情緒承接方面表現出色，還具備低時延、對話中可隨時打斷等特性。

同日，騰訊混元開源Hunyuan3D-2.0（混元3D生成大模型2.0），採用幾何、紋理解耦生成技術，在幾何結構和紋理色彩方面比1.0版本顯著提升，可生成高精度白模與高質量紋理。

另一則重磅新聞來自於DeepSeek，其1月20日發佈並開源的DeepSeek-R1模型，用強化學習訓練，推理過程包含大量反思和驗證，思維鏈長度可達數萬字。在數學、代碼、自然語言推理等任務上，性能比肩OpenAI o1正式版。

月之暗面旗下的Kimi也於1月20日推出了全新的K1.5多模態思考模型，在多模態推理和通用推理能力上達到行業領先水平。

此外，1月重要的AI新品和更新發布還包括阿里巴巴推出通義萬相2.1模型、MiniMax發佈並開源MiniMax-01系列模型等，實現了性能提升的同時，都在多模態等方面進行了拓展。

從目前的行業發展趨勢來看，AI智能體已被視爲2025年的重要發展方向，各大科技巨頭和初創企業企業在智能體賽道上積極佈局，而有一些初創企業則轉向AI應用層面尋求突破。視頻、音頻等多模態也成爲AI的一個重要發展趨勢，並向着通用人工智能的發展。

年前AI“大亂鬥”：繼豆包、Kimi之後，智譜AI和階躍星辰跟進發布新品

相關資訊