廣發證券:豆包實時語音大模型發佈 提升字節AI產業鏈價值

財中社1月21日電 廣發證券發佈傳媒行業報告。1月20日,豆包實時語音大模型正式推出,並在豆包APP全量開放。模型實現了語音理解和生成一體化、端到端語音對話,主要面向中文語境和場景。依託於語音和語義聯合建模。根據豆包大模型團隊公衆號,經外部衆測,模型整體滿意度較GPT-4o有明顯優勢,語音語氣自然度和情緒飽滿度高於GPT-4o。

預訓練Scaling+後訓練高質量數據和算法,帶來語音模型擬人化、智商與表現力、低延遲方面的突破。傳統語音對話任務系統具有對話自然度、有用性及安全性的侷限。根據豆包大模型團隊公衆號,豆包團隊在預訓練階段對各模態交織數據進行深入訓練,精準捕捉並高效壓縮海量語音信息,通過Scaling,最大程度實現語音與文本能力深度融合和能力涌現,後訓練階段使用了高質量數據與RL算法,提供模型高情商對話能力與安全性。豆包實時語音大模型實現了擬人化的情感承接、強大的聲音控制和豐富的情感演繹能力、智商與表現力的平衡以及絲滑的交互體驗和超低延遲。

大模型和應用佈局領先,關注字節AI產業鏈機會。目前字節旗下通用大模型及多模態能力在國內大廠中實現領先;根據AI產品榜,2024年12月,字節旗下App豆包、貓箱MAU分別達7116、688萬人,成爲國內AI對話、AI陪伴賽道月活Top1。字節正持續加大AI投入,未來預計將有更多技術及應用進展,字節AI產業鏈相關標的有望受益。

情感能力提升帶動陪伴體驗升級,關注音頻類平臺接入效果。我們預計情感陪伴類產品有望伴隨模型能力的強化,在體驗上有所提升,擁有具體應用場景的平臺有望受益。其中,豆包自身的對話類陪伴產品貓箱具備體驗升級的可能性;外部平臺而言,以音頻和對話爲主的平臺有望通過接入豆包情感模型提升平臺服務能力;此外,AI玩具作爲兼具教育與陪伴屬性的AI硬件,有望顯著受益於語音模型能力賦能。

投資建議。豆包實時語音大模型的發佈,進一步豐富了字節AI生態,看好字節AI在國內的領先地位,未來發展潛力可期。同時,情感陪伴和AI玩具產品有望伴隨語音類模型能力的強化,提升用戶交互體驗。建議關注:(1)與字節在AI領域具有合作基礎的公司,如易點天下、藍色光標等;(2)佈局AI語音相關業務的公司,如盛天網絡(音樂社交類平臺“給麥”等)、崑崙萬維(AI音樂產品Melodio和Mureka)等;佈局AI玩具的公司,如上海電影、奧飛娛樂等;(3)行業層面來看,AI大模型能力提升、成本邊際下降,持續完善的AI基礎設施有望更好地賦能AI遊戲、AI影視、AI營銷、AI情感陪伴、AI教育、AIagent等場景。

如果您有新聞線索,請聯繫我們:newsroom@caizhongshe.cn