訊飛星火語音大模型強悍升級!支持74個語種方言“自由對話”

(原標題:訊飛星火語音大模型強悍升級!支持74個語種方言“自由對話”)

6月27日,科大訊飛在北京發佈訊飛星火大模型V4.0,七大核心能力全面提升,在8個國際主流測試集中排名第一,國內大模型全面領先。

基於星火大模型V4.0的強大性能,科大訊飛旗下包括醫療、教育、辦公、智慧汽車等在內的若干智能應用也密集落地或升級。

訊飛星火APP、桌面端新增“個人空間”,打造更懂你的AI助手;訊飛曉醫APP升級,上線個人數字健康空間,打造每個人的健康助手;業界首發星火智能批閱機,“AI助教”助力老師減負增效、因材施教;星火語音大模型支持74個語種/方言“自由對話”……

科大訊飛董事長劉慶峰在發佈會上表示,語音將成爲萬物互聯時代人機交互的主要方式,人機交互最重要的場景是遠場、噪聲、多人說話、多語言,因此萬物互聯時代的AIUI(人工智能用戶界面)要滿足遠場高噪聲、多語言多方言、全雙工、多模態等標準。

近期科大訊飛作爲第一完成單位的《多語種智能語音關鍵技術及產業化》項目,獲得國家科學技術進步獎一等獎。這是深度學習引發全球人工智能浪潮以來,過去十年我國人工智能領域的首個國家科學技術進步獎一等獎

基於科大訊飛全球領先的多語種語音技術,星火語音大模型迎來新突破。面向萬物互聯時代,新增多語種、多方言免切換語音識別能力,可支持37個語種、37種方言“自由對話”。

其中,37個語種識別效果領先OpenAI whisper-V3,37個方言識別效果平均提升30%。現場,科大訊飛演示了訊飛輸入法混合方言和外語的語音輸入效果,能讓輸入效率提高。

同時發佈軟硬件一體化訊飛同傳系統,可支持大會同傳、會議同傳、展廳同傳、旅遊同傳等多場景使用。本次參會的嘉賓座位上同樣配備訊飛同傳的收聽設備,佩戴後即可實時收聽多語種AI同聲傳譯。

針對強幹擾場景下的語音識別難題,科大訊飛突破了多人混疊場景下的極複雜場景語音轉寫,即使在三人混疊說話場景也能實現86%的語音識別準確率。

科大訊表示,未來基於多模態的聲音識別技術,將應用在訊飛聽見智慧辦公、智慧屏等會議辦公產品中。

賦能行業的同時,訊飛星火大模型也不忘助力開發者生態蓬勃發展。據公開數據顯示,自今年1月30日訊飛星火V3.5發佈以來,短短5個月,星火開發者生態加速增長,開發者數從598萬增長到702萬,新增超104萬;海外開發者數超40萬;大模型開發者達57萬。

“今天人工智能技術的發展絕不是一家公司可以把所有事情都做完的,在這個時代,做帝國註定要衰落,只有生態才能生生不息;必須是自主可控的繁榮生態,纔有中國通用人工智能大未來。”談到生態繁榮,劉慶峰表示。