中信證券:看好後續更高價值的Agent加速落地帶來的全產業鏈投資機會
智通財經APP獲悉,中信證券發佈研報稱,以Operator爲代表的智能體(Agent)具備面向複雜任務的自主規劃、感知、決策能力,驗證模型落地各類終端的潛力,實現從知識輔助到操作代替的價值提升。產品“感知-決策-行動”模式下,各節點技術門檻有所提高且需要針對場景進行專門訓練,預計場景內Agent產品價值和差異性將進一步提升。看好後續更高價值的Agent加速落地帶來的全產業鏈投資機會,梳理以下投資主線:1)主線一:工具軟件和其他重點行業軟件;2)主線二:通用管理軟件;3)主線三:AI基礎設施。
中信證券主要觀點如下:
產品概況:Operator自主操作終端,各行業Agent加速落地可期。
2025年1月23日,OpenAI正式發佈首款智能體Operator,具備在PC瀏覽器場景內的自主任務拆解和終端操作能力,發佈現場展示了購物、配送、餐飲、旅行等多個日常領域應用,並宣佈面向ChatGPT Pro用戶(訂閱費200美元/月)開放。能力上,Operator核心CUA模型的PC和瀏覽器的操作能力超越以往模型,例如根據OpenAI官網,在瀏覽器測試集WebArena上正確率達到58%,但較人類78.2%的水平仍有一定差距,預計後續更多用戶數據將被用於訓練,帶動場景內準確率以及場景覆蓋數量持續提升。同時,OpenAI正與DoorDash、Instacart、OpenTable、Uber等公司合作,探索各領域Agent落地機遇。參考OpenAI CEO Sam Altman在發佈會上的表述,Operator是首批智能體之一,公司將在未來幾周和幾個月內推出更多智能體。
技術解析:“感知”+“決策”構成技術核心,o1與GPT-4o實現系統協作。
參考OpenAI官網,Operator主要由CUA新模型負責推理,形成“感知-決策-行動”的循環運作模式。感知上,Operator將屏幕截圖、用戶Prompt、歷史操作步驟結合形成CUA模型的輸入上下文,結合GPT-4o多模態能力進行實時視覺理解。決策上,CUA模型利用上下文評估任務狀態、環境狀態、任務目標,綜合推理得出下一步操作直至任務完成。同時,CUA模型可以通過強化學習帶來糾偏能力,在遇到困難或錯誤時可對歷史操作和環境變化進行分析,嘗試找到解決問題的方法。結合強化學習能力的CUA模型與o1等邏輯模型同源,結合GPT-4o的多模態能力,Operator一定程度上實現了o1與GPT-4o的動態結合,驗證語言模型+邏輯模型的系統能力。
行業價值:從知識輔助到操作代替,場景內Agent產品價值提升。
從系統模式來看,智能體(Agent)具備面向複雜任務的自主規劃、感知、決策能力,同時具備實際的任務執行能力,實現用戶無需操作直接完成任務,實現從知識輔助到操作代替的價值提升。從實際應用來看,類Operator的“感知-決策-行動”模式下,各節點技術門檻有所提高且需要針對場景進行專門訓練,預計場景內Agent產品價值和差異性將進一步提升,帶動各場景AI應用加速落地。
風險因素:AI核心技術發展不及預期;AI被不當使用造成嚴重社會影響;AI應用拓展不及預期;信息安全風險;行業競爭加劇。