☰

騰訊科技申請音頻生成模型相關專利，使得訓練得到準確性更高的音頻生成模型

金融界2025年1月24日消息，國家知識產權局信息顯示，騰訊科技（深圳）有限公司申請一項名爲“音頻生成模型的訓練方法、裝置及電子設備”的專利，公開號CN 119339732 A，申請日期爲2024年12月。

專利摘要顯示，本申請公開了一種音頻生成模型的訓練方法、裝置及電子設備，屬於人工智能技術領域。方法包括：通過神經網絡模型編碼樣本音頻得到至少兩個第一樣本特徵，第i個第一樣本特徵表徵按照第i個時間尺度切分樣本音頻後得到的各個音頻段的特徵信息；通過神經網絡模型基於至少兩個第一樣本特徵，生成重構音頻；通過樣本音頻和重構音頻訓練神經網絡模型，得到音頻生成模型，音頻生成模型用於基於第一音頻生成第二音頻。由於不同的第一樣本特徵反映樣本音頻在不同時間尺度上的信息，使得各個第一樣本特徵的表徵能力更強，基於此，可以根據各個第一樣本特徵生成準確性較高的重構音頻，使得基於重構音頻可以訓練得到準確性更高的音頻生成模型。

天眼查資料顯示，騰訊科技（深圳）有限公司，成立於2000年，位於深圳市，是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本200萬美元。通過天眼查大數據分析，騰訊科技（深圳）有限公司共對外投資了16家企業，參與招投標項目258次，知識產權方面有商標信息5000條，專利信息5000條，此外企業還擁有行政許可364個。

本文源自：金融界

作者：情報員

騰訊科技申請音頻生成模型相關專利，使得訓練得到準確性更高的音頻生成模型

相關資訊