☰

豆包實時語音大模型發佈，“雙商”表現極佳，有望加速AI算力及應用的發展

豆包實時語音大模型於1月20日正式推出，並在豆包APP全量開放。此前，業內就曾有消息稱豆包將上線最新情感語音大模型，測試效果超過GPT-4o。

豆包實時語音大模型的推出標誌着國內AI語音技術的進一步提升，並將加速國內AI應用的普及。

豆包實時語音大模型智商與情商表現出色。在外部測試者的評測中，圍繞擬人度、有用性、情商、通話穩定性、對話流暢度等維度對豆包進行測試，整體滿意度（以5分爲滿分）評分爲4.36，高於GPT-4o的3.18。

從技術架構來看，豆包大模型可能採用了更高效的訓練算法和更大規模的中文語料庫，這使其在中文語境下的情感表達優於GPT-4o。

與國際領先的GPT模型相比，豆包語音大模型的重點在於實時性與情感表達能力，這對語音交互場景具有重大意義。

在語音技術中，實時性決定了用戶體驗的流暢度，而情感表達則是推動語音AI從工具向伴侶型智能體演進的關鍵環節。情感語音大模型的核心在於其能夠更精準地捕捉用戶情緒並提供更具人性化的交互體驗，這對於AI在客服、教育、醫療等場景的落地具有重要推動作用。

從技術層面看，語音大模型需要大量算力支持，特別是在實時性和多模態結合的情境下，對AI算力基礎設施提出了更高要求。當前，國內算力市場需求高速增長，AI芯片、數據中心和算力網絡基礎設施建設持續加速，爲這類高性能模型提供堅實的底層支持。在美國一系列的出口限制措施之下，AI算力產業鏈正在加速國產替代的進程，這將直接推動國內AI算力產業鏈的發展！

同時，國內AI市場正在從模型研發向場景賦能快速過渡，實時語音技術的成熟有助於推動AI應用的大規模落地，語音大模型的場景適配能力不斷增強，包括客服、教育、健康監測（醫療）等領域應用潛力巨大。

展望後市，光大證券分析，豆包實時語音大模型的推出將進一步提升AI算力和AI應用的市場空間。落腳到A股市場，關注AI算力（AI芯片、服務器、交換機、CPO、銅纜、液冷、PCB等）與AI應用（AI陪伴、AI助理、AI玩具、AI眼鏡、AI遊戲等）細分環節的龍頭企業。

本文源自：金融界

豆包實時語音大模型發佈，“雙商”表現極佳，有望加速AI算力及應用的發展

相關資訊