騰訊科技申請音頻生成模型相關專利,使得訓練得到準確性更高的音頻生成模型
金融界2025年1月24日消息,國家知識產權局信息顯示,騰訊科技(深圳)有限公司申請一項名爲“音頻生成模型的訓練方法、裝置及電子設備”的專利,公開號CN 119339732 A,申請日期爲2024年12月。
專利摘要顯示,本申請公開了一種音頻生成模型的訓練方法、裝置及電子設備,屬於人工智能技術領域。方法包括:通過神經網絡模型編碼樣本音頻得到至少兩個第一樣本特徵,第i個第一樣本特徵表徵按照第i個時間尺度切分樣本音頻後得到的各個音頻段的特徵信息;通過神經網絡模型基於至少兩個第一樣本特徵,生成重構音頻;通過樣本音頻和重構音頻訓練神經網絡模型,得到音頻生成模型,音頻生成模型用於基於第一音頻生成第二音頻。由於不同的第一樣本特徵反映樣本音頻在不同時間尺度上的信息,使得各個第一樣本特徵的表徵能力更強,基於此,可以根據各個第一樣本特徵生成準確性較高的重構音頻,使得基於重構音頻可以訓練得到準確性更高的音頻生成模型。
天眼查資料顯示,騰訊科技(深圳)有限公司,成立於2000年,位於深圳市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本200萬美元。通過天眼查大數據分析,騰訊科技(深圳)有限公司共對外投資了16家企業,參與招投標項目258次,知識產權方面有商標信息5000條,專利信息5000條,此外企業還擁有行政許可364個。
本文源自:金融界
作者:情報員