上海臨競申請基於自然語言的多風格強化學習策略控制方法及系統專利,實現智能體高度多樣化的行爲表現

金融界2025年1月24日消息,國家知識產權局信息顯示,上海臨競科技有限公司申請一項名爲“基於自然語言的多風格強化學習策略控制方法及系統”的專利,公開號CN 119337965 A,申請日期爲2024年12月。

專利摘要顯示,本發明提供了一種基於自然語言的多風格強化學習策略控制方法及系統。首先在所需的環境中訓練多風格強化學習策略,多風格強化學習策略基於元行爲集合,每個元行爲與對應的風格參數關聯,風格參數代表執行該元行爲的傾向性,每個訓練時期開始時,隨機採樣一組風格參數,將風格參數和環境狀態拼接後輸入智能體,使用強化學習算法訓練後得到有多種行爲風格的策略;在推理時解析用戶的自然語言,結合提示詞將用戶的自然語言轉換爲對應元行爲的風格參數的數值,將轉換得到的數值輸入智能體,作爲智能體的當前風格參數,即可執行用戶指定的行爲風格。使用本發明可以實現智能體高度多樣化的行爲表現,允許用戶通過文本或語音調節每種行爲風格的程度。

天眼查資料顯示,上海臨競科技有限公司,成立於2024年,位於上海市,是一家以從事科技推廣和應用服務業爲主的企業。企業註冊資本22.2222萬人民幣。通過天眼查大數據分析,上海臨競科技有限公司共對外投資了1家企業,專利信息3條。

本文源自:金融界

作者:情報員