在智能體之年,蘋果要重塑Siri贏得未來
Apple Intelligence改變蘋果在AI競賽中的狀態了嗎?隨着1月中旬因多次出現事實錯誤、而暫停新聞類AI通知摘要功能後,答案其實就已經不言而喻了。Apple Intelligence的出現只能證明蘋果“上桌”了,但想要與谷歌Gemini、三星的Galaxy AI相提並論,顯然蘋果方面仍需努力。
近日彭博社記者Mark Gurman爆料稱,一份被泄露的內部備忘錄顯示,蘋果公司正全力加速其人工智能的研發進程,以期重回行業領先地位。爲實現這一目標,蘋果方面還進行了重要的人事調整,資深執行副總裁Kim Vorrath被調任至人工智能與機器學習部門,擔任AI主管John Giannandrea的首席副手。
據悉,Kim Vorrath在蘋果工作了36年,並以卓越的問題解決能力和推動重大項目成功的經驗而聞名。因此被外界稱爲“救火隊員”的Kim Vorrath這次工作調動,也被視爲蘋果加強AI團隊,並重塑AI賽道競爭力的舉措。
具體到如何改變Apple Intelligence的現狀,在這份內部備忘錄中表明,2025年其AI團隊的工作重點是改進Siri的底層基礎設施,以及改進現有的AI模型。
不得不說,作爲全球科技企業中的佼佼者,蘋果確實洞察到了自身AI業務中的缺陷。目前,Apple Intelligence是典型的端雲混合模型,並不存在一個所謂的Apple Intelligence大模型,它主要是由一個30億參數的端側模型Apple On-Device、一個服務器端的私有云計算模型,以及ChatGPT組成。
比如iPhone 16系列重要賣點“相機控制按鍵”所關聯的視覺智能(Visual Intelligence),實際上就是由ChatGPT來提供支持。不僅如此,在任何場景下對文本進行改寫、校對和摘要的AI寫作功能Writing Tools,以及AI圖像生成工具Image Playground也都是依靠ChatGPT來驅動。
但令人玩味的是,爲了保障用戶隱私而生的端側模型,反而拖累了Apple Intelligence。不久前在1月中旬,蘋果方面就宣佈因AI生成的新聞通知摘要出現嚴重失實信息,將在iOS 18.3暫停所有新聞和娛樂應用的通知摘要功能。而這一次惹麻煩的Summarization(摘要),就正是由蘋果的端側模型Apple On-Device提供支持。
Apple Intelligence中更奪人眼球的功能是外包的,由蘋果自己負責的輕負載任務又翻車了,這就是爲什麼蘋果要改進現有的AI模型,因爲現在這款30億參數的Apple On-Device屬實有些難堪大用。
對於一向高舉隱私保護大旗的蘋果而言,端雲混合模型其實只是權宜之計。畢竟相比於雲端的大模型,端側模型的隱私泄露和數據安全風險大幅降低,除了敏感信息不會上傳雲端之外,並且其還有個性化、定製化的潛力。
更何況蘋果從來不會將雞蛋都放在一個籃子裡,擺脫對單一外部供應商的依賴也是他們一以貫之的策略,所以持續改進自家模型以替代ChatGPT纔是最合理的路徑。至於說蘋果方面想要重塑Siri,其實也契合2025年是智能體(AI Agent)之年的共識。
“更聰明的Siri”是蘋果方面去年推出Apple Intelligence時重點宣傳的一個功能,可現階段更能夠體現Siri比以往更聰明的場景,基本都來自於它可以調用ChatGPT。其中一個典型場景,就是當用戶召喚出Siri時,後者往往會主動詢問用戶是否要調用ChatGPT來幫忙。
蘋果似乎是在經歷了上一輪智能語音助手在爆紅之後、旋即沉寂的過程,有些低估了用戶的需求。如今的現實,是用戶不再滿足於一個只能求助“場外援助”的Siri,而是希望它能夠像ChatGPT一樣,回答複雜問題或是提供更具創造性的互動能力。
原本作爲智能語音助手與用戶見面的Siri,是AI智能體在iOS生態落地的最佳載體,用戶通過語音讓Siri作爲中介來操控iPhone,這顯然是一個能夠體現智能體魅力的絕佳場景。剛剛亮相的OpenAI智能體“Operator”,主打的就是可以模擬人類在電腦上的操作,通過點擊、滾動、輸入等直接與網頁進行交互。
既然OpenAI的Operator可以通過分析屏幕、識別出網頁上的各種元素,蘋果的Siri顯然就不是沒有可能做到同樣的事情。只不過Operator可以被視爲是一個“有靈魂的鼠標”,所以重塑之後的Siri也能被視爲“有靈魂的麥克風”,畢竟後者天然就有成爲擁有自主行動和環境交互能力智能體的基礎。
要將Siri重塑爲智能體,就意味着未來的Siri能協助用戶處理日常工作,比如回覆郵件、預訂餐廳等,也有助於AI手機獲得更多的認可。要知道,當下消費者對於AI手機的認知是非常割裂的,有相當多的人雖然計劃在新的一年購買Gen AI(生成式人工智能)手機,但更多人認爲AI功能“幾乎沒有增加任何價值”,在提升使用體驗上並無實質性的幫助。
從叫座不叫好到叫好又叫座,無疑是AI手機在2025年的頭等大事,所以蘋果選擇重塑Siri的底層基礎設施、並增強模型性能也是在順應時勢。
【本文圖片來自網絡】