蘋果AI亮相後,AI端側的大規模落地還有多遠?
21世紀經濟報道記者 董靜怡 上海報道
在2024年蘋果秋季新品發佈會上,AI成爲最大的亮點之一。
此前公佈過的AI功能在iPhone 16上得到實現,它能夠在郵件、備忘錄和Pages文稿等應用中幫助用戶優化文本內容,還支持通過自然語言描述生成個性化的表情符號和圖像,以及通過簡單的描述自動創作視頻內容。
此外,Siri也得到了顯著增強,能夠更自然地理解用戶的指令,提供個性化的服務,並能在應用程序內和跨應用程序執行數百種新操作。AI Agent的屬性更加清晰。
業內對蘋果的AI關注度如此之高,不僅因爲其可能觸發新一輪的iPhone換機熱潮,也因爲蘋果的Apple Intelligence代表了AI在移動終端領域的發展,市場參與者正密切關注AI技術在移動設備上的實際應用效果。
端側爲AI提供了一個入口,這是AI技術普惠的基礎。
日前,在2024沙利文新投資大會的AI重構數字經濟分論壇上,INMO聯合創始人呂一飛在圓桌論壇上表示,產品如AR眼鏡,結合生成式AI,提供了一個直觀的交互平臺,利用其貼近視覺和解放雙手的特性,成爲獲取AI內容的有效工具。
不過,用端側完全承載大模型仍然難以實現,主要受限於處理能力、內存和電池續航等硬件瓶頸,但多種技術正在開發中,落地過程會循序漸進。
“端側落地,會從些小的場景、大模型能做到的場景開始,採取端雲協同的方式,有些內容會在端側處理,大部分內容還是要回到雲端處理。”IDC中國研究總監盧言霞向21世紀經濟報道記者表示。
一場全球競賽
事實上,各終端廠商在AI上的部署並不比蘋果慢。
手機廠商基本都在all in AI。Canalys報告顯示,2024年全球16%的智能手機出貨爲AI手機,到2028年,這一比例將激增至54%。
就在蘋果發佈會的幾天前,榮耀在德國柏林消費電子展(IFA)上發佈了行業首個跨應用開放生態智能體(AI Agent),同時宣佈榮耀Magic 7系列將首發搭載榮耀AI Agent。
其具備四大核心能力:自然語義理解和計算機視覺、用戶行爲習慣學習和場景環境感知、意圖識別及決策能力、應用內及跨應用操作。
這與蘋果的Apple Iintelligence是相似的,即深入到手機操作系統的底層架構中,實現系統級的AI重構。這些能力使得AI Agent能夠深度理解用戶需求,主動提供服務,從而簡化用戶操作流程,提升使用效率。
在此之前,也有一些廠商推出了融合AI應用的終端產品。例如,三星Galaxy S24系列手機通過採用生成式人工智能技術,實現了AI通話翻譯、智能摳圖等創新功能;華爲Pura 70系列旗艦手機則在AI攝影方面進行了創新,接入盤古大模型支持一鍵消除等功能;OPPO Find X7系列則搭載AndesGPT大模型,以AI通話摘要、圖像消除、全新AI助手爲主要賣點。
業內普遍認爲,AI手機的興起被視爲繼功能機、智能機之後手機行業的第三階段。這一趨勢不僅推動了手機行業的創新,也可能導致行業的大洗牌。
PC是另一個AI落地的熱門終端,在硬件方面,AIPC的功能擴展至計算、存儲、傳感等方面,形成了CPU-GPU-NPU的異構方案。在軟件方面,AIPC整合了輕量化AI模型,實現了各種生成式AI應用的離線穩態運行。
各大PC製造商如聯想、惠普、宏碁等都在積極探索和開發AI PC產品。以聯想爲例,在年初的CES 2024上,聯想集團展示了10餘款AI PC產品;在IFA 2024期間,聯想集團展示了其在人工智能領域的最新成果,推出了一系列革命性AI PC設備,涵蓋ThinkPad、ThinkBook、Yoga和IdeaPad等多個產品線。
根據高盛研報,聯想集團將在AI PC驅動下,實現PC產品的平均銷售價格增長,帶動其PC業務將在2024財年和2025財年分別同比增長27%和22%,而AI PC將貢獻2024財年和2025財年收入的21%和33%。
AI PC的市場還在擴大。Canalys表示,隨着目前各大處理器供應商的AI PC規劃逐步推進,預計2024年下半年及未來,AI PC供應量和用戶採用率將顯著提升,2024年出貨量將達到4400萬臺,2025年有望達到1.03億臺。
值得注意的是,AI技術的落地應用已經遠遠超出了傳統的手機和PC領域,其觸角已延伸至多種終端設備,其中包括眼鏡、耳機、智能家居設備、智能汽車等多種形態,形成了豐富的AI終端生態系統,他們爲生成式AI提供了一個入口。
而應用在端側也是AI技術更加垂直化發展的表現,業內普遍認爲,垂直是AI未來的趨勢,需要企業深入特定領域,在細分場景中應用,解決具體問題,從而推動AI技術的落地和行業的發展。
主流趨勢:端雲結合
端側AI之所以受到廣泛關注並實現了快速發展,主要基於以下幾個原因:
其一,成本效益。儘管各家廠商大模型推理成本大規模下降,但長期來看,端雲結合被認爲是控制推理成本的有效途徑。
隨着手機等設備使用更強大的芯片,端側AI的推理能力得到了顯著增強。這使得在本地設備上完成複雜的AI任務成爲可能,減少了對雲端資源的依賴。
“如果所有的手機端能操作的任務都交給雲端去操作,其實它成本是上升的。”在2024沙利文新投資大會上,商湯科技戰略研究主任劉亮向21世紀經濟報道記者表示,通過將大規模的計算任務交給雲端處理,而將小規模、對實時性要求不高的任務交給端側處理,可以優化資源分配,實現成本效益的最大化。
其二,數據的及時性。在智能汽車等實時性要求極高的應用場景中,數據傳輸速度成爲了關鍵因素。對車外環境的實時感知和快速響應需要立即執行,不能有過多的延遲。最典型的例子,在自動駕駛裡,大模型的部署必須是發生在端側。
其三,數據安全與隱私保護。端側AI模型由於在本地設備上運行,相對而言安全性更高。劉亮向記者表示,用戶的數據不需要離開個人設備,從而降低了數據泄露的風險,並更容易建立安全機制,增強用戶對設備的信任。
這也是AI手機、AI PC產品中頻繁強調的一個特點。例如,在蘋果最新發佈會上,蘋果強調使用Apple Intelligence時,用戶的數據絕不會被儲存、分享給蘋果,只會被用來執行請求。這項隱私安全保障可被獨立專家持續驗證,是AI隱私的一大進步。
其四,手機、PC等終端廠商的推動。國內外主要手機廠商,如小米、蘋果等,都在積極部署端側AI技術。作爲產品創新的亮點,有望推動用戶更新換代手機的動力。
“許多手機制造商都在原有手機基礎上進行改進,包括調整手機的整體架構,並在其中構建AI應用生態系統。這一過程可能需要一些時間,但製造商們相信這將爲用戶帶來更好的體驗,並激發新的換機需求。”日前,天風全球前瞻產業研究院聯席院長孔蓉在接受21世紀經濟報道記者採訪時表示。
不過,以業內期待已久的Apple Intelligence的表現來看,其功能在差異化和顛覆性上都還有所欠缺,由AI帶來的銷量增長不會馬上到來。
“許多人願意爲AI技術買單,但這也取決於AI技術的實際表現。如果AI表現得足夠聰明,能夠理解用戶需求,用戶就會願意爲其支付合理的價格。反之,如果AI表現不佳,用戶可能就不會使用它。目前AI可能還處於成長階段,尚未完全成熟。”孔蓉向記者表示。
落地,循序漸進中
儘管市面上已經涌現出了部分AI終端產品,但基本還是連接雲端大模型,或端側小模型和雲端大模型相結合,大模型真正落到終端還在面臨各類的硬件限制。
未來智能COO王超向21世紀經濟報道記者表示,爲了在端側運行大型AI模型,如100億參數的模型,需要相當高的算力,大約50Tops,以及至少13GB的內存。然而,目前許多手機和PC的硬件配置尚未達到這一標準,這限制了大型模型在這些設備上的應用。
同時,運行大型AI模型時,設備會消耗大量電能,導致電池續航時間大幅縮短。對於便攜設備如手機和PC,這尤其成問題,因爲它們的電池設計需要考慮便攜性和重量,無法無限擴大電池容量。
“假設我一直端側運行大模型,可能一個小時就沒電了,無法打電話或者工作。”王超向記者表示,這些最終會嚴重影響到用戶體驗。
端雲結合雖然可以克服掉部分的硬件限制,但對模型側也提出高要求,即端側的模型需要與雲端模型保持一致性。這意味着,端側模型需要在特定任務中至少達到與雲端模型相同的性能水平,確保用戶無論在雲端還是端側都能獲得一致的體驗。
通常,雲端大模型需要具備廣泛的通用能力,端側模型專注於特定的功能,會部署一組專門化的小型模型,每個模型都針對特定的任務進行優化,以實現最佳性能。
隨着技術的進步,端側模型的性能正在不斷提高,小參數的語言模型在多個評測指標上已經能夠與更大參數的模型相媲美。
這種性能提升的原因是多方面的。大模型行業業內人士向記者表示,一方面,數據清洗和處理流程的改進提高了訓練數據的質量;另一方面,雲端大模型的強大能力可以幫助生成高質量的特定領域數據,這些數據可以用來更有效地訓練端側的小模型。
當然,作爲一個產品,最終還需要看市場的接受程度,差異化和體驗感是其中關鍵。
王超認爲,目前來看,大多數產品仍然是品牌宣傳的噱頭,缺乏令消費者購買的衝動。“一些基本應用的用戶粘性不高,直接下載大模型App也能滿足這樣的需求。”
業內分析認爲,當前全球宏觀經濟狀況不佳,若缺乏促銷活動和顯著的價格優惠,AI手機或AI PC市場的增長仍將面臨重大挑戰。
不過,劉亮提出了汽車作爲AI終端的獨特之處。他認爲,汽車是算力最強大的個人用品,遠超PC和手機。同時,汽車也是電力供應最充足的個人用品,儘管也存在所謂的電量焦慮問題,但與手機或電腦相比要好一些。
而消費者在汽車領域的消費意願也通常更爲強烈。“用戶可能不會因爲某款手機增加了AI而願意額外支付一千元,但在汽車上爲了某些AI功能多支付五六千元,這對許多用戶來說是可以接受的。”劉亮向記者表示。