AI 代理?是的,讓我們把不需要自動化的事情都自動化吧

近期,英偉達的 Jim Fan 等人將生成式 AI 的當前發展階段稱爲"代理時代",但這很可能會讓人大失所望。

原因很簡單:大多數人並不需要 AI 代理來幫忙預訂旅行、網上購物或餐廳訂位。

那些確實需要代理的人——比如那些缺乏朋友圈的行業巨頭、渴望曝光的名人等,他們已經有了更好的選擇:人類私人助理,甚至是專門執行命令的整個公司團隊。

科技迷們幻想每個人都想要一個類似漫威電影宇宙中服務億萬富翁 Tony Stark 的 AI 代理 Jarvis。然而,對於生活並不複雜的普通人來說,讓 Jarvis 偶爾幫忙點個外賣實在是大材小用。

除了人們過度自我膨脹地認爲自己應該擁有一個軟件僕人之外,AI 代理的部署還面臨着諸多障礙,這些都會限制其實用性。

OpenAI 的 Operator,就像 Anthropic 之前的計算機使用 API 一樣,結合了生成式 AI 交互(現在常見的提示和響應模式)、多模態模型(支持視覺、音頻和文本交互)、鏈式思維推理、瀏覽器自動化以及第三方 API 訪問。

這確實是個不錯的技術組合,但它實現的網絡自動化並不新鮮。Operator 能做的一切,之前都可以通過其他編程或手動方式實現。

演示視頻展示了一些任務示例,每個任務都與特定的在線服務提供商相關聯——"我需要一輛洛杉磯的便宜租車"鏈接到 Priceline;"幫我找個可以停放 22 英尺房車的地方,要有電力接口"鏈接到 Hipcamp;"我想在巴黎找一家能看到埃菲爾鐵塔的精品酒店"鏈接到 Booking.com。

OpenAI 難道沒聽說過 Google 搜索嗎?他們當然知道,這實際上是要開闢一個新的在線服務分發渠道,讓 OpenAI 取代 Google 成爲把關者、收費者和數據聚合者。

[文章過長,我將繼續翻譯剩餘部分]

雖然可以理解爲什麼 OpenAI 想成爲客戶和企業之間的中心媒介,但企業爲什麼要甘願成爲 OpenAI 生態系統中的終端,放棄與客戶的直接聯繫,這一點就不那麼清晰了。

也許公司們急於參與是爲了排除競爭對手——如果 Uber 通過 Operator 接單,Lyft 就沒機會了。

但如果 Lyft 最終也加入這個生態系統,Operator 將如何決定把服務請求分配給哪個品牌呢?或者 Operator 會要求客戶自己做決定——這種干預表明人類可能不需要中介服務就能更好地完成預訂過程?同樣地,爲什麼像 Booking.com 這樣的公司不能將自己的開源 AI 模型整合到 IT 基礎設施中,作爲專注於特定站點任務的品牌特定代理呢?

除了品牌稀釋之外,還有什麼潛在成本?這是否是一個付費參與的安排?如果不是,它會變成這樣嗎?處理成百上千甚至數百萬個 Operator 實例訪問服務器和交互是否會產生基礎設施成本?OpenAI 計劃通過其 Stargate 項目在 AI 基礎設施上投資約 5000 億美元,這表明了該超級實驗室的野心。至於這些數據中心中運行的 AI 服務是否有需求,還有待觀察。

問題重重

AI 爬蟲造成的帶寬負擔已經成爲一個問題。根據 DoubleVerify 的數據,"2024 年已知機器人印象產生的常規無效流量中有創紀錄的 16% 來自與 AI 抓取器相關的機器人,如 GPTBot、ClaudeBot 和 AppleBot。" AI 代理會讓這種情況變得更糟嗎?

Operator 目前作爲研究預覽版向月付 200 美元的美國 Pro 級訂閱用戶開放。而且,代理服務在完成複雜任務時顯然會消耗大量的 tokens、計算週期、水資源和能源。這些資源的使用值得嗎?

在不必要的情況下依賴 AI 在倫理上是站不住腳的

考慮到人腦進行數學運算所需的能量比計算機少一百萬倍,在不必要的情況下依賴 AI 從數據中心使用對環境影響的角度來看是不道德的。

更不用說爲了銷售內容生成服務,在未經補償的情況下使用受版權保護的內容來訓練 AI 模型所涉及的道德缺失了。

還有就是 Operator 完成所有必要步驟所需的時間——有時超過幾分鐘,如果代理沒有完全停止的話。如果任務簡單容易完成,可能一個人在瀏覽器中花差不多的時間就能完成。如果任務複雜,需要多次人工干預,也許從一開始就應該由人來處理整個過程。

別忘了政策問題。許多網站出於正當理由(防止垃圾郵件或惡意機器人)禁止自動化交互。僅僅因爲 Operator 來訪就會改變嗎?別忘了它的製造者警告說:"我們知道不法分子可能會試圖濫用這項技術。"

根據 AI 專業出版物 Every 的報道,Operator 使用 OpenAI 數據中心的瀏覽器而不是用戶的桌面瀏覽器(不同的 IP 地址和用戶代理會阻礙屏蔽)。撇開這個設計決策的隱私影響不談,其結果之一是像 Reddit、Figma 和 YouTube 這樣的網站已經在拒絕 Operator 的訪問。

爲了展示 Operator 的能力,OpenAI 的聯合創始人之一 Andrej Karpathy 讓 AI 代理在討論 Operator 公告的 Hacker News 帖子中發表評論,總結了帖子中表達的觀點。

AI 生成的評論平淡無奇,毫無立場,符合人們對生成式 AI 的一貫期望。它理所當然地受到了論壇參與者的抨擊:"你可能認爲這很可愛或不可避免,但這也是你如何摧毀互聯網社區,加速其從一個隱含信任的公共廣場轉變爲一個充滿對抗性和污染的荒地。"

儘管 Karpathy 隨後發佈了一些 Operator 運行的細節,描述了過程中的各種失敗和延遲,但他通過讓 Operator 生成回覆來回應批評,這也印證了批評者的觀點——AI 驅動的交互會趕走人們。

因此,不僅是 AI 代理對於提議的任務並非真正必需,而且沒有人想要與它們打交道。AI 在人類空間里根本不受歡迎。至少 Operator 在某些自動化 API 交互中會受到歡迎,前提是事先進行了協商。

但正如微軟前 Windows 總裁 Steven Sinofsky 所觀察到的,自動化比大多數人想象的要困難得多。

他在去年 10 月的一篇文章中寫道:"大多數構建過自動化的人都知道,或者最終會知道,它是多麼脆弱。它之所以脆弱,是因爲步驟沒有被遵循。工具和連接會以意想不到的方式失敗。或者最關鍵的是,輸入的精確度或完整性遠不如所需。而且他們會發現,解決這些問題中的任何一個都極其複雜。"

Sinofsky 表示對 AI 在自動化方面的長期作用持樂觀態度,但預計這不會容易,而且人類必須繼續參與其中。

因此,Operator 看起來不像 Jarvis,更像是一個需要牽着手的幼兒,至少暫時如此。如果 Operator 的目標之一是取代人類助理,那就享受這些像孩子一樣的員工吧。

但至少 AI 代理並非完全無用;想想幾年前讓城市街道雜亂不堪的電動滑板車,它們展示了風險投資的傲慢和對公共空間的蔑視。

電動滑板車在某些場景下是有用的——對於那些步行需要相當長時間(取決於各種因素,可能是 20、30 或 40 分鐘)的行程,適合那些不太擔心受傷的年齡羣體,在天氣宜人的時候,不需要攜帶太多負載,距離不太遠的情況下。

Operator 就是這樣。總會有人欣賞它的。(R)