智譜清言上線情感語音模型GLM-4-Voice:有情緒表達、情感共鳴

IT之家 10 月 25 日消息,智譜今天宣佈上線 GLM-4-Voice 端到端情感語音模型。官方表示,其能夠理解情感,有情緒表達、情感共鳴,可自助調節語速,支持多語言和方言,並且延時更低、可隨時打斷,用戶即日起可在“智譜清言”App 上體驗。

據介紹,GLM-4-Voice 具備如下特點:

情感表達和情感共鳴:聲音有不同的情感和細膩的變化,如高興、悲傷、生氣、害怕等。

調節語速:在同一輪對話中,可以要求 TA 快點說 or 慢點說。

隨時打斷,靈活輸入指令:根據實時的用戶指令,調整語音輸出的內容和風格,支持更靈活的對話互動。

多語言、多方言支持:目前 GLM-4-Voice 支持中英文語音以及中國各地方言,尤其擅長粵語、重慶話、北京話等。

結合視頻通話,能看也能說:即將上線視頻通話功能。

此外,智譜 AutoGLM 具備 phone use 能力,只需接收簡單的文字 / 語音指令,它就可以模擬人類操作手機。其不受限於簡單的任務場景或 API 調用,也不需要用戶手動搭建複雜繁瑣的工作流,操作邏輯與人類類似。

GLM-4-Voice 同期對外開源,官方稱其爲智譜首個開源的端到端多模態模型。IT之家附地址:

代碼倉庫:

https://github.com/THUDM/GLM-4-Voice