平安科技申請語音識別專利,提高語音識別的準確性

金融界2024年10月22日消息,國家知識產權局信息顯示,平安科技(深圳)有限公司申請一項名爲“一種語音識別方法、網絡模型、設備及存儲介質”的專利,公開號 CN 118762691 A,申請日期爲 2024年7月。

專利摘要顯示,本申請公開了一種語音識別方法、網絡模型、設備及存儲介質,通過結合UNet和高效注意力機制,更好地捕獲和利用多尺度的細節信息,從而提高語音識別的準確性,其中UNet的跳躍連接有助於保留關鍵的時頻特徵,並將其傳遞到解碼階段,使得識別結果更加精確;高效注意力機制則使網絡能夠更好地建模長範圍上下文的依賴關係,捕捉語音信號中的全局信息,提高對上下文的理解和建模能力。將UNet的U型結構嵌入到Transformer框架下,可以充分利用跳躍連接和特徵重用的優勢,減少網絡的參數量,同時加速網絡的訓練過程,提高系統的效率和實用性。

本文源自:金融界

作者:情報員