廈門淵亭申請複雜場景的機器人智能體強化學習訓練專利,提高智能體在複雜場景中的性能表現和泛化能力

金融界2024年12月18日消息,國家知識產權局信息顯示,廈門淵亭信息科技有限公司申請一項名爲“複雜場景的機器人智能體強化學習訓練方法及系統”的專利,公開號CN 119129642 A,申請日期爲2024年11月。

專利摘要顯示,本發明公開了一種複雜場景的機器人智能體強化學習訓練方法,其通過構建包含障礙物、動態目標以及環境約束等複雜場景、適用於多智能體系統的強化學習算法環境、狀態轉移模型,並採用強化學習算法構建爲每個機器人智能體構建獨立的神經網絡;將智能體的給定狀態、時序信息、歷史狀態信息的向量作爲所述狀態轉移模型的輸入,輸出預測狀態的狀態轉移概率和獎勵信息;所述神經網絡輸出的動作策略和動作價值通過所述狀態轉移模型中執行併產生新的預測狀態和獎勵信息;通過調整神經網絡的超參數,利用大規模分佈式訓練架構對所述決策網絡和所述評估網絡進行協作訓練,實現多智能體的並行學習和協同決策,提高智能體在複雜場景中的性能表現和泛化能力。

本文源自:金融界

作者:情報員