AI Agent酣戰:羣雄逐鹿,鹿死誰手?

導語:2025,關於AI Agent的諸多幻象和預言紛至沓來,如何撥開重重迷霧得以一窺真相?

科幻電影《太空漫遊》片頭,一羣剛學會直立行走的人猿撿起了一根獸骨,偶然揮舞了一下手裡的棒棒,發現它居然是一件趁手的工具。於是,腦容量尚且不大的原始人類被喚醒了工具意識,靠着工具勞動和狩獵,逐步站上了食物鏈頂端。

而這靈光一閃的偶然時刻,正是人類進化史上的一個關鍵節點,那根工具棒棒無疑是開啓了人類進化新徵程的魔法棒,某種意義上足以撬動地球未來,堪稱AI Agent的祖母級版本。2003年,美國宇航局將兩輛火星車勇氣號和機遇號降落在火星上,它們在沒有人類干預的情況下在火星表面航行。

如果從遙遠的光年之外俯瞰2025年,可能發現人類又來到了一個進化的關鍵節點,而AI Agent彷彿正是那根趁手的"獸骨"。AI Agent代表着一個瘋狂的未來,充滿了無限的可能性和想象力。Meta CEO扎克伯格預言,"未來的AI智能體可能比人類還多,人類將生活在一個有數億、甚至數十億AI智能體的世界中。"

2025年有望成爲AI Agent商業爆發元年,預測AI Agent的應用市場將達到數百億美元規模。中信證券發佈研報稱,AI產業的下一個大階段拉開序幕,從而帶動AI算力產業鏈從訓練端軍備競賽主導進階到推理端應用、商業循環主導的新週期,AI Agent的崛起正重塑AI產業鏈。

商業元年開啓,AI智能體落地B端

過去幾年,當大家都沉迷於ChatGPT的魔力時,OpenAI卻推出可執行復雜任務的AI Agent,其將具備博士級別的助手功能。

傳說中的AI Agent是何方神聖?OpenAI將"AI Agent"定義爲以LLM爲大腦驅動,具有自主理解、感知、規劃、記憶和使用工具的能力,能自動化執行復雜任務的系統。

如果說,LLM就像一個"超級大腦",而AI Agent(智能體)不僅有聰明的"大腦",還有靈活的"手腳",能像人一樣行動,必要的時候還會使用"工具"。它能夠讓大模型從"Chat(對話)"走向真正的"Act(操作)"。

這種神奇的AI系統,可被稱爲Auto-Pilot主駕駛,即AI Agent。它代表的是一種未來真正的人機交互方式,AI的角色有了質的蛻變,從被使用的工具躍升爲使用工具的主體。

而這種質的演變,將引發人類生產關係如海嘯般的深刻變革,人與大量AI實體之間的協同工作模式將變成司空見慣的場景。

在企業應用場景裡,許多耗時任務都交給AI Agent——比如,充當"知識過濾器":快速提煉關鍵信息,無需自己手動篩選海量數據;"生產力加速器":協助用戶安排日程、管理任務,讓人類專注於更重要的工作;"客服神助攻":幫助企業更快地處理客戶諮詢、解決問題,大幅提升團隊的響應速度。

人類如金蟬脫殼般抽身,具體業務活都被委派給AI來幹,自己只需聚焦於企業戰略,關鍵這樣做的效果是——企業運營成效還大幅倍增,好不快哉!

據悉,財富500強公司中近70%的員工,已經使用Microsoft365 Copilot中的Agents來處理大量重複性的日常工作。Gartner預測,到2028年,至少有15%的日常工作決策將由Agentic AI自主完成。德勤AI研究院稱,AI智能體將改變基礎業務模式,實現新的工作、運營和價值交付方式。

AI Agent的使命,是幫助企業構建"人機協同"的智能化運營新常態。在滿足企業智能化需求、打通業務場景的過程中,AI Agent正在承接日益複雜的提質增效需求,並強化內外部協同效能,釋放組織核心生產力,對抗組織熵增帶來的挑戰。可以說,AI Agent正是爲企業級應用而生,有望在B端落地,逐步釋放AI的核心價值。

作爲連接用戶和服務的"橋樑",AI Agent將持續進化爲通往AGI(通用人工智能)的重要入口。OpenAI描繪了AGI路線圖,並指出自己目前處於第一層,接近達到第二層;而第三層纔是AI Agent。在"AI腹地"硅谷,據統計至少有100個正經項目在將Agent商業化,近10萬名開發者正在構建Agent,幾乎每週都有新的Agent公司誕生,可謂創業盛況空前。

AI Agent如此爆火,這樣一個頗具想象空間的市場藍海有多大?

據Research and Market預估,AI智能體的市場規模將從2024年的51億美元增長到2030年的471億美元,年均複合增長率爲44.8%。如此大的一塊誘人蛋糕,讓全球大模型創業公司、互聯網大廠、軟件應用商、硬件廠商都趨之若鶩,試圖吃到新的入口紅利。

微軟在巨頭陣營裡的首領氣質,尤其體現在對企業AI智能體部署的戰略押賭中,大手筆佈局,搶佔了早期領先地位。深諳企業應用爲王之道,恰好迎合了企業降本增效的剛需,憑藉專業性的知識沉澱得以穩穩落地B端。

從另一個角度而言,AI Agent與B端市場的兩廂契合,也源自於長期以來的"數據飢渴症"。衆所周知,AI苦於數據和算力已久,當前訓練模型需要的海量數據即將枯竭,唯有尋找新的突破口才行。

但是,去哪裡尋找貨真價實的海量數據?可以說,市場B端就是一個天然的"數據池"。

B端市場沉澱的海量場景化數據集,某種程度上能夠緩解AI的"數據飢渴",並且還都是高質量活生生的真實數據。給AI Agent餵飽了數據,通過模型訓練與微調,深化場景體驗與模型的耦合程度,從而實現AI Agent嵌入企業客戶工作並承載業務邏輯。這種內在的可謂相得益彰。

巨頭瘋殺,得 AI Agent 者得天下?

2024年下半年,AI Agent爭奪戰就已經蓄勢待發。2025年開年,終於吹響了戰鬥的號角。海外市場,OpenAI、Anthropic、微軟、谷歌等科技巨頭強悍佈局,將自家Agent實力當作重要籌碼。國內市場也狼煙四起,百度、阿里、騰訊一衆大廠也使出了殺手鐗。

自大模型戰演義至今,大家心裡都憋着一股勁兒,誓要問鼎AI Agent之巔,尋求殺手級應用成爲業界共同面臨的核心命題。

這一次,究竟誰能在人機交互新時代拔得頭籌,人們拭目以待。

2025年,微軟一個里程碑式的動作,就是躊躇滿志地宣佈,建立全球規模最大的企業級AI Agent生態系統——Copilot Studio平臺。

去年11月的"Microsoft ignite2024"全球大會上,微軟發佈的Microsoft365、Dynamics365等主打產品中集成了大量商用AI Agents,都是爲今年Agents的大爆發做鋪墊。

老辣的微軟深諳企業用戶心理,稱這些產品就是爲企業而生的。M365Copilot的魅力源於更多Agent功能的加持,旨在將AI智能體與人類協作等核心模塊相結合,爲企業提供全面的客戶服務和銷售解決方案。去年10月,微軟宣佈面向 Dynamics 365業務應用平臺,開發部署10款AI Agent——服務於企業的銷售環節、會計業務以及客戶服務等關鍵領域。

微軟戰略的核心正是"智能體網格"——這是一套互聯繫統,各AI智能體間通過相互協作來解決複雜問題。各智能體並非孤立運作,而可以在整個企業之內無縫傳遞任務、消息和知識。高度關注企業級基礎設施、廣泛集成以及業務成果本身——而非原始AI功能。所以,微軟的優勢並不在於任何單一功能,而在於其全面的效能綜合發力。

據悉,現已有超過十萬家企業使用該平臺創建或編輯AI Agent。微軟智能體負責人Charles Lamanna認爲,這個增長速度和體量遠超微軟預期。微軟允許企業通過這些智能體隨意挑選Azure目錄所提供的1800種大語言模型(LLM)——這無疑也是克服對OpenAI模型全面依賴的重要舉措。

微軟的前瞻性還體現在——譬如,安全和治理功能,大多在AI部署完成之後才被納入考量,但如今這兩大要素已被內置在微軟的核心架構當中,確保智能體始終運行在企業權限與數據治理框架之內。

谷歌的步伐緊隨其後,2024年12月發佈了全新多模態大模型Gemini 2.0。在新模型的加持下,谷歌內置了三款AI Agent——"通用大模型助手"Project Astra、"瀏覽器助手"Project Mariner和"編程助手"Jules。融入智能眼鏡的Project Astra,可以流暢對話並理解音視頻;內置於Chrome瀏覽器的Project Mariner可以執行網頁端任務;嵌入GitHub的Jules則可以進行編程且整合進GitHub項目當中;還有可以閱讀屏幕畫面並給出語音提示的Agent。

OpenAI雖是基礎模型的領先者,在Agent方面的佈局略謹慎。自2024年12月6日以來,連續發佈了o1正式版、ChatGPT Pro、強化微調、Sora正式版、Canvas、GPT版Apple Intelligence/Siri;在展現出模型能力提升的同時,重點展示了AI與應用的結合,其中Sora提供了多種編輯工具,向實用視頻工具進一步靠攏;Canvas也在代碼Copilot的基礎上進化到一個完整開發環境;集成了GPT的Siri則有了Agent的雛形。

2025年1月,OpenAI醞釀推出全新AI Agent——Operator,該系統能夠自動執行各種複雜操作,包括編寫代碼、預訂旅行、自動電商購物等。Operator在Computer use的基礎上進行大幅度創新和應用簡化,擴大AI Agent的使用範圍和應用場景。

應用爲王,Agent向超級智能體進化

從應用場景看,2025年的一個趨勢是——將涌現更多的Multi-Agent模式。AI Agent部署將由"單"變"多",從單一智能體發展到"羣體協作"模式,多個Agent扮演不同角色合作完成任務。

譬如,阿里雲Mota社區推出的國內首個大型模型調用工具ModelScopeGPT。基於LLM的AI Agent開發框架ModelScope-Agent,可以通過一鍵發送指令調用Mota社區中的其他人工智能模型,從而實現大大小小的模型共同協作,進而完成複雜的任務。

此外,百度文心智能體平臺、騰訊元器、訊飛星火智能體創作中心、通義智能體、字節釦子等都面向B端企業用戶提供了智能體創建平臺,並添加AI Agent入口。支付寶旗下AI App支小寶、智譜的智能體AutoGLM,通過自主點咖啡、發紅包等操作吸引了一大波C端用戶。

阿里宣佈,未來所有產品將接入"通義千問"大模型,包括天貓、淘寶、釘釘、天貓精靈、閒魚、盒馬等產品,菜鳥中鄉村助理、站長助手等AI專家應運而生,全面推動智能化轉型。而這與微軟的"網格"戰略,似乎有異曲同工之妙。

一些硬件廠商也嚐到了些許"甜頭",比亞迪的官方智能體上線後,銷售線索轉化率提升了119%。聯想AIPC智能體的互動率提升了89%,銷售線索轉化率提升了80%。

在智能手機領域,華爲Pura70的"小藝"、小米15系列的"超級小愛",榮耀Magic的YOYO智能體上線。將服務入口整合在了一起,賦予了智能手機完成更復雜任務的可能性。例如,YOYO智能體便具備模糊理解、界面識別、自動執行、一語到位等能力,可以支持單指令系統級任務執行、第三方應用任務執行甚至多應用協調執行等多種模式。

初創公司們也爭相推出了各類Agent產品,然而這些打着Agent旗號的產品與真正的Agent相去甚遠,在這個AI暴利產業空間裡,可謂魚龍混雜。儘管AI Agent的概念炙手可熱,但也有人表示仍是"虛火"。一個毋庸置疑的事實是,AI智能體正在跨過炒作週期,進入企業IT架構的現實應用——而這段轉型期,也必然帶來各種複雜因素與嚴苛挑戰。

目前讓用戶產生足夠的粘性和堅實的依賴感的AI Agent,其實寥寥無幾。想要打造出一款真正成熟的超級智能體,並實現大規模商業化應用,似乎還需要很長一段時間的耐心等待。

關於智能體的探索仍處於初期階段,這意味着,誰能在這場智能體驅動型業務的轉型風口占得先機,誰就能在下一階段的市場競爭中建立先發優勢。隨着更多的資源從大模型轉向AI智能體,整個AI行業將有望從現在的泡沫性繁榮走向更爲穩健的成長。

臨近爆點,垂直領域或現殺手級應用?

即使當下尚未產生真正的殺手級應用,但實際上在細分領域,Agent已經有遍地開花之勢了。當前,垂直領域的專業Agent正處於爆點,並因其實用性備受資本青睞。YC合夥人、資深投資人Jared指出,垂直領域AI Agent將成爲比SaaS大10倍的新興市場,可能催生出市值超過3000億美元的科技巨頭。

儘管人類所期待的真正Agent——全能助手Jarvis尚未出現,但多個垂直領域的專業Agent暫露頭角,將讓我們不斷獲得擁有近似Jarvis的體驗,期待更多垂直領域將跑出"種子選手"。紅杉合夥人Konstantine Buhler預測,醫療和教育等"高服務成本"領域,將成爲AI技術的下一個重要戰場。

在醫療領域,Agent可以幫助診療和監測患者,IBM Watson Health是一個AI智能體,可以分析醫療數據並推薦治療方案;在製造業領域,Agent可以優化生產流程,通用電氣使用名爲Predix的AI智能體實時監控機器,以預測和防止設備故障;在運輸業領域,自主AI Agent可以協助路線規劃和交通管理,特斯拉的Autopilot有助於安全駕駛;在農業領域,AI Agent可以優化作物生產、監測土壤質量並預測天氣模式,約翰迪爾(John Deere)正在使用一種名爲See&Spray的AI智能體。

當Agent進入第一個深水區垂直領域,對專業度的要求則更高。直接套用通用模型的Prompt Agent,任務通過率往往不足50%。而專家Agent能夠將模型與垂直領域數據、專業業務流程做深度耦合,形成專業度極高的AI Agent。

對於專家Agent這個層面而言,能夠產生商業模式的關鍵取決於Agent在該垂直領域的專業度如何,能否具備顯著的降本增效功效。

以工程項目管理領域爲例,深圳知合雲數智管控平臺,將AI與傳統工程行業的專業經驗融合,實現從項目規劃到竣工的"全生命週期"數智化管理。達到成本質量管控精細化、施工進度管控可視化、安全環保管控智能化、全過程信息管理便捷化、項目各方協同協作高效化等目標,推動項目精細化管理程度提高約50%、安全環保隱患降低約90%以上、投資成本節約率約20%。

AI Agent正在深刻影響企業的數字化轉型,推動SaaS平臺從簡單的業務管理工具轉變爲驅動智能化業務的引擎,將誕生數百萬AI智能體推動企業在特定任務上實現更高效的智能化管理。

但不少領域的專業AI Agent依然不夠成熟,輸出不精確、性能差強人意、用戶不信任等問題困擾其落地。所以,短期內商業化最成功的AI Agent,不一定是看起來"Agentic化"最高的產品,而是能夠平衡性能、可靠性,以及用戶信任的產品。

從用戶體驗來說,AI Agent的應用還有很大的提升空間。一是交互界面不夠好,全自然語言交互會影響交互效果;二是在落地層面,仍需突破的關鍵點是個性化,根據用戶自身的工作模式進行精細化調整,技術層面似乎還遠遠不夠。

隨着推理能力的提升,AI Agent能夠更好地理解複雜情境和業務邏輯,做出更加合理和高效的決策。例如,在供應鏈管理中,Agents可以根據歷史數據和實時信息,預測庫存需求變化,提前調整採購和生產計劃,避免庫存積壓或短缺。

2025年,新一代AI Agents功能將進化得更強大,憑藉在記憶、推理和多模態能力方面的進步,以更好的交互方式處理更復雜的工作,提供更加個性化和精準的服務。

通往AGI的入口,諸多難點與痛點待解

AI Agent距離真正的爆發仍有不少要克服的障礙。一個關鍵的挑戰是:缺少一個能夠支撐整個生態的操作系統。初創公司/dev/agents計劃爲AI Agent開發一個類似於Android操作系統的通用平臺,試圖解決目前AI Agent碎片化的局面。

其它挑戰還包括但不限於:如何實現低延遲、帶視覺理解的實時反饋;如何構建個性化的記憶系統;如何在虛擬與物理環境都具備執行能力等等。只有當AI Agent從"工具"變成"工具使用者"時,真正的殺手級應用纔會出現。

在Agent的構建上,仍有許多懸而未決的技術難題,例如大模型幻覺、長時記憶的前後一致性問題、以及增強多模態的理解能力。爲提升大模型記憶力,波形智能研發了名爲RecurrentGPT的增強記憶技術解決方案。

AI Agent依賴LLM"黑盒",本身就存在不可預測性。至今在解決一些邏輯、推理等核心問題上,Agent的能力還偏弱。因此,Agent各模塊之間如何配合、多個Agent如何交互、人類與Agent如何互動等方面,Agent技術尚處於早期階段。

接入Agent後,所有需要處理的業務場景,都會轉化成需要底層大模型理解的數據,從而產生高昂的推理成本。斯坦福的虛擬小鎮框架開源後,每個Agent一天就需要消耗20美金的Token數,比用人成本還要高。因此,如何控制高昂的調用成本,是擺在AI Agent面前的一大難題。

現階段一個最關鍵的制約因素,還是數據質量、數據規模、應用場景不足,AI模型、AI訓練數據集、AI場景落地部署,都遠遠不夠。以AI Agent機器人爲例,由於缺乏高質量的真實數據,機器人就無從進行訓練。

通過互聯網數據,機器人的感知已經出現了相當強的泛化,能夠更好地理解物理世界。不少廠商通過真實數據和仿真數據結合的方式,將任務過程中的數據 "喂"給大模型。然而,仿真數據還是不夠真實,AI Agent在模擬世界能成功,但導入到現實世界就會有一定的失敗率。

當前,AI Agent還遠未達到數據飛輪的啓動時刻,達不到自動駕駛般的普及度,而真實數據的成本極高,需要花長時間積累。數據的匱乏,不僅會影響模型的準確性和穩定性,還制約了其在真實場景中的廣泛應用的可靠性。

如何保證用戶的數據安全和隱私,也是一大問題,數據壁壘是關鍵的一堵牆。但構建數據壁壘並不容易,高敏感的私有數據分散且難整合,業務"過程數據"往往非結構化地存儲在企業的服務器中,甚至專家的"大腦"中。這就需要給出客戶具體的方案,互相建立信任度。不少廠商先從相關業務"冷啓動",完成過程數據的原始積累。

還有,高昂的推理成本如何控制?一個典型案例是,斯坦福的虛擬小鎮框架開源後,每個Agent一天就需要消耗20美金的Token數,比用人力的成本還要高。收益是否邁過了成本的門檻仍是未知數,廠家往往最先考慮的不是盈利,而是如何把高昂的推理成本轉嫁出去。

騰訊研究院的報告指出,AI Agent面臨的問題還囊括安全性與隱私性、倫理與責任、經濟和社會就業影響等多個方面。在國內智能算力較爲短缺的現狀下,由於技術門檻高、資金投入多、商業模式不成熟,AI Agent這個賽道看似風光實則道險且阻。

因此,AI Agent想要真正實現規模化落地,只有紮實做好大模型技術和找到正確的商業化落地路徑,才能在未來不被趕下"牌桌"。