年前AI“大亂鬥”:繼豆包、Kimi之後,智譜AI和階躍星辰跟進發布新品
2025年1月,國內AI大模型賽道熱鬧非凡,豆包、Kimi、智譜AI、階躍星辰、騰訊混元等紛紛推出或更新AI模型和應用,猶如一場“大亂鬥”。
1月23日,智譜AI推出了又一個AI智能體Agent GLM-PC1.1,新增深度思考功能,可生成思維鏈來拆解任務,引入代碼機制提升推理能力,並支持Mac和Windows系統,能在社交、信息處理等場景出色完成任務。
與此同時,今日,字節跳動旗下豆包大模型1.5Pro版本正式發佈,已在豆包APP灰度上線,開發者可在火山引擎直接調用API。該版本在知識、代碼、推理、中文等多項公開測評基準上成績全球領先,採用大規模稀疏MoE架構,多模態能力也得到全面提升,視覺理解模型Doubao-1.5-vision-pro理解能力領先,實時語音模型Doubao-1.5-realtime-voice-pro 表現力出色。
同樣在今日,階躍星辰近期一口氣發佈六款新品,包括在語義等方面生成效果大幅提升的 Step-Video V2、推理能力出色的Step R-mini、升級後更能感知情緒且支持多語種的Step- 1o Audio升級版、多模態理解大模型Step-1o Vision,以及專注文字創作的Step-2文學大師版和高性價比的輕量級語言模型Step-2 mini123。
前幾日,字節跳動旗下的豆包在1月21日於豆包APP(7.2.0新春版)全量開放了豆包實時語音大模型,這是一款語音理解和生成一體化的模型,實現端到端語音對話,打破傳統級聯模式侷限,在語音表現力、控制力、情緒承接方面表現出色,還具備低時延、對話中可隨時打斷等特性。
同日,騰訊混元開源Hunyuan3D-2.0(混元3D生成大模型2.0),採用幾何、紋理解耦生成技術,在幾何結構和紋理色彩方面比1.0版本顯著提升,可生成高精度白模與高質量紋理。
另一則重磅新聞來自於DeepSeek,其1月20日發佈並開源的DeepSeek-R1模型,用強化學習訓練,推理過程包含大量反思和驗證,思維鏈長度可達數萬字。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
月之暗面旗下的Kimi也於1月20日推出了全新的K1.5多模態思考模型,在多模態推理和通用推理能力上達到行業領先水平。
此外,1月重要的AI新品和更新發布還包括阿里巴巴推出通義萬相2.1模型、MiniMax發佈並開源MiniMax-01系列模型等,實現了性能提升的同時,都在多模態等方面進行了拓展。
從目前的行業發展趨勢來看,AI智能體已被視爲2025年的重要發展方向,各大科技巨頭和初創企業企業在智能體賽道上積極佈局,而有一些初創企業則轉向AI應用層面尋求突破。視頻、音頻等多模態也成爲AI的一個重要發展趨勢,並向着通用人工智能的發展。