平安科技申請語音合成專利,提高語音生成穩定性
金融界 2025 年 1 月 31 日消息,國家知識產權局信息顯示,平安科技(深圳)有限公司申請一項名爲“語音合成方法裝置設備及介質”的專利,公開號 CN 119380688 A,申請日期爲 2024 年 11 月。
專利摘要顯示,本發明涉及人工智能技術領域,公開了一種語音合成方法、裝置、設備及介質,包括:獲取待合成文本和參考音頻;採用滑動窗口算法將待合成文本劃分爲多個文本段;基於參考音頻和預訓練的語音合成模型,生成每個文本段對應的音頻波形;對每個文本段對應的音頻波形進行語音合成,得到目標語音。通過上述方式,採用滑動窗口算法對輸入文本進行分割,形成若干段更小、更易管理的文本段,將若干個文本段和參數音頻輸入語音合成模型,使得語音合成模型基於較短的文本段逐句生成音頻,使得模型能夠更加專注於每個片段的精確語音和語調細節,確保音頻輸出的準確性和自然流暢性,解決了由於文本長度超出典型長度參數引起的退化問題,提高語音生成的穩定性。
天眼查資料顯示,平安科技(深圳)有限公司,成立於2008年,位於深圳市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本531031.58萬人民幣,實繳資本531031.58萬人民幣。通過天眼查大數據分析,平安科技(深圳)有限公司共對外投資了4家企業,參與招投標項目276次,知識產權方面有商標信息75條,專利信息5000條,此外企業還擁有行政許可19個。
本文源自:金融界
作者:情報員