ElevenLabs 發佈文本轉語音 Turbo 2.5 AI 模型

IT之家 7 月 20 日消息,ElevenLabs 昨日(7 月 19 日)發佈博文,介紹推出了全新的 Turbo v2.5 文本到語音 AI 模型,支持普通話等 32 種語言,爲全球近 80% 的地區提供高質量、低延遲的 AI 對話。

Turbo v2.5 模型首次支持越南語、匈牙利語和挪威語,這些語言的使用人數分別爲 8500 萬、1300 萬和 530 萬。

本次更新還重點提高了印地語、法語、西班牙語、普通話和其他 27 種語言的響應速度,最高提升了 3 倍;英語的速度提高了 25%。IT之家附上宣傳視頻如下:

Turbo v2.5 模型結合了先進的文本到語音技術和最新的低延遲模型架構,用戶基本上不需要等待,就能提供高質量的 AI 生成音頻輸出。

Turbo 模型實現了快速語音合成,同時保持流暢和自然的高品質音質,響應時間不超過 400 毫秒。

ElevenLabs 成立於 2022 年,總部位於倫敦,專注於開發人工智能語音模型和工具,可以創建不同語言、口音和情感的合成語音。

公司首席執行官 Mati Staniszewski 表示,ElevenLabs 目前擁有約 40 名遠程辦公員工,分佈在全球各地,並計劃到年底將團隊擴大至 100 人。

ElevenLabs 非常重視人工智能內容的透明度,並開發了 AI Speech Classifier 等工具幫助識別合成音頻,同時也在開發用於電影配音的工具,並正在開發一個允許用戶生成 AI 語音並通過授權賺錢的平臺。