☰

訊飛星火語音大模型強悍升級！支持74個語種方言“自由對話”

（原標題：訊飛星火語音大模型強悍升級！支持74個語種方言“自由對話”）

6月27日，科大訊飛在北京發佈訊飛星火大模型V4.0，七大核心能力全面提升，在8個國際主流測試集中排名第一，國內大模型全面領先。

基於星火大模型V4.0的強大性能，科大訊飛旗下包括醫療、教育、辦公、智慧汽車等在內的若干智能應用也密集落地或升級。

訊飛星火APP、桌面端新增“個人空間”，打造更懂你的AI助手；訊飛曉醫APP升級，上線個人數字健康空間，打造每個人的健康助手；業界首發星火智能批閱機，“AI助教”助力老師減負增效、因材施教；星火語音大模型支持74個語種/方言“自由對話”……

科大訊飛董事長劉慶峰在發佈會上表示，語音將成爲萬物互聯時代人機交互的主要方式，人機交互最重要的場景是遠場、噪聲、多人說話、多語言，因此萬物互聯時代的AIUI（人工智能用戶界面）要滿足遠場高噪聲、多語言多方言、全雙工、多模態等標準。

近期科大訊飛作爲第一完成單位的《多語種智能語音關鍵技術及產業化》項目，獲得國家科學技術進步獎一等獎。這是深度學習引發全球人工智能浪潮以來，過去十年我國人工智能領域的首個國家科學技術進步獎一等獎

基於科大訊飛全球領先的多語種語音技術，星火語音大模型迎來新突破。面向萬物互聯時代，新增多語種、多方言免切換語音識別能力，可支持37個語種、37種方言“自由對話”。

其中，37個語種識別效果領先OpenAI whisper-V3，37個方言識別效果平均提升30%。現場，科大訊飛演示了訊飛輸入法混合方言和外語的語音輸入效果，能讓輸入效率提高。

同時發佈軟硬件一體化訊飛同傳系統，可支持大會同傳、會議同傳、展廳同傳、旅遊同傳等多場景使用。本次參會的嘉賓座位上同樣配備訊飛同傳的收聽設備，佩戴後即可實時收聽多語種AI同聲傳譯。

針對強幹擾場景下的語音識別難題，科大訊飛突破了多人混疊場景下的極複雜場景語音轉寫，即使在三人混疊說話場景也能實現86%的語音識別準確率。

科大訊表示，未來基於多模態的聲音識別技術，將應用在訊飛聽見智慧辦公、智慧屏等會議辦公產品中。

賦能行業的同時，訊飛星火大模型也不忘助力開發者生態蓬勃發展。據公開數據顯示，自今年1月30日訊飛星火V3.5發佈以來，短短5個月，星火開發者生態加速增長，開發者數從598萬增長到702萬，新增超104萬；海外開發者數超40萬；大模型開發者達57萬。

“今天人工智能技術的發展絕不是一家公司可以把所有事情都做完的，在這個時代，做帝國註定要衰落，只有生態才能生生不息；必須是自主可控的繁榮生態，纔有中國通用人工智能大未來。”談到生態繁榮，劉慶峰表示。

相關資訊