AI週報 | 特朗普宣佈5000億美元AI投資計劃;OpenAI發佈首個AI智能體

特朗普宣佈 “星際之門” 5000億美元投資

1月21日,在美國白宮舉行的新聞發佈會上,特朗普宣佈,OpenAI、甲骨文和軟銀將成立一家合資企業“星際之門計劃”(Stargate Project),計劃未來四年投資高達5000億美元(摺合約3.64萬億人民幣)用於建設AI相關基礎設施,並創造10萬個工作崗位,初始投資預計爲1000億美元。22日早間,OpenAI發表官方推文介紹“星際之門計劃”,這家新成立的合資公司旨在爲OpenAI在美國建設新的人工智能基礎設施。OpenAI表示,該基礎設施旨在確保美國在人工智能領域的領導地位。據悉,軟銀和OpenAI是這項計劃的主要合作伙伴,其中軟銀負責財務,OpenAI負責運營,孫正義將擔任董事長。

點評:“星際之門計劃”引起了科技圈的關注,這一項目幾乎湊齊了美國的頂尖科技企業,其初始股權投資者包括科技巨頭軟銀、甲骨文,頂尖生成式AI創企OpenAI、以及阿布扎比投資公司MGX,實際的業務佈局中有科技巨頭Arm、微軟、英偉達參與。不過,馬斯克針對此事潑冷水稱“他們其實沒有錢”,並表示軟銀擔保額遠低於100億美元。

OpenAI發佈智能體Operator

當地時間1月23日,OpenAI發佈了自主智能體Operator。Operator可以代理用戶執行基於網頁的操作,例如查看、輸入、點擊、滾用網頁,Operator是OpenAI最早的智能體之一。在20多分鐘的介紹視頻中,OpenAI演示了Operator用於訂餐廳、點外賣、購物。支撐Operator的模型是CUA模型,CUA結合了GPT-4o的視覺能力,且有高級推理能力,可與用戶的圖形界面交互,“看到”屏幕上的按鈕、菜單和文本。

點評:OpenAI已多次釋放看好智能體的信號。Operator發佈後,OpenAI總裁兼聯合創始人Greg Brockman(格雷格·布羅克曼)在社交媒體上表示,2025年是智能體之年。OpenAI CEO山姆·奧爾特曼(Sam Altman)此前在一篇博客長文中表示,相信2025年人們將會看到第一批AI智能體“加入勞動力大軍”。接下來OpenAI可能還會推出更多智能體產品。

全球手機用戶爲AI應用支出達12.7億美元

移動應用分析機構Sensor Tower的最新數據顯示,2024年全球手機用戶在AI聊天機器人和AI藝術生成工具上的支出達到12.7億美元。其中,聊天機器人應用佔據了10.7億美元,較2022年的3000萬美元和2023年的4.55億美元大幅增長。在聊天機器人平臺中,ChatGPT依然佔據主導地位,佔AIGC應用下載量的23%和AI應用消費的40%。谷歌Gemini和字節跳動的豆包分別位列下載量第二和第三。去年全球手機用戶使用AI聊天機器人的時長達到70億小時,同比增長347%。

點評:從數據來看,過去一年裡全球用戶對AI應用展現出了極大的熱情,且掏出十多億美元付費表達支持。聊天機器人只是AI進入千家萬戶的一個角度。根據統計,2024年在iOS和谷歌Play應用商店裡,應用名稱、副標題和簡介裡帶有“AI”字樣的APP,總共被下載了170億次。考慮到這個統計並不包含許多第三方應用市場,實際的數字還會更高。根據另外一份單獨的統計,中國大陸用戶除了最喜歡用豆包外,Kimi、文小言、通義的下載量位居2-4位。

國產大模型再突破,DeepSeek R1開源

1月20日,DeepSeek發佈了全新的開源推理大模型DeepSeek-R1,在數學、編程和推理等多個任務上達到了與OpenAI o1相當的表現水平,同時將AP調用成本降低了90-95%,定價爲每百萬輸入tokens 1元(緩存命中)/ 4元(緩存未命中),每百萬輸出tokens 16元。憑藉其獨特的強化學習訓練方法,DeepSeek-R1首次展現出類人的“頓悟時刻”——在解決複雜問題時,模型會突然停下思考,自主修正推理路徑,甚至用自然語言標註“等等,這一步可能有誤”。

點評:值得一提的是,DeepSeek-R1是DeepSeek旗下首款以MIT協議開源(包含權重)的模型,不限制商用,也無需申請,還明確允許通過模型蒸餾等方式將DeepSeek-R1用於訓練其他模型。這意味着DeepSeek-R1有望在全球AI領域產生廣泛影響,也能從全球開源社區中獲得正向反饋,不斷改進模型。

國內大模型春節前迎來密集發佈周

春節前,國內大模型迎來一波密集更新。1月20日上午,MiniMax海螺上線了語音功能,同日,字節豆包還上線了實時語音大模型,DeepSeek發佈了DeepSeek-R1模型,月之暗面Kimi就推出k1.5多模態思考模型。1月21日,騰訊則開源了混元3D生成大模型2.0,指向另一個方向3D生成大模型,面向遊戲、具身智能等領域的大模型應用。1月22日,豆包大模型1.5Pro版本正式推出,新模型全面提升多模態能力、推理能力。豆包稱模型訓練過程中未使用任何其他模型生成的數據,不走“捷徑”。

點評:以上更新既包括追趕OpenAI o1系列推理模型,又包括追趕OpenAI的實時語音功能,月之暗面和DeepSeek兩家都稱新模型性能對標OpenAI o1正式版。一些學術界人士認爲,新推出的模型代表了業界先進水平。加利福尼亞大學伯克利分校教授Alex Dimakis就表示,跟他交流過的多數AI研究人員都對DeepSeek-R1的性能感到有些震驚,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人選”,其他公司需要迎頭趕上。

智譜多模態智能體推出更新

智譜旗下可自主操作電腦的多模態Agent(智能體)GLM-PC2024年11月29日發佈GLM-PCv1.0版本並開放內測,近日則推出“深度思考”模式,並增加專用來做邏輯推理和代碼生成的功能。此外,智譜也提供了對Windows系統的支持。GLM-PC 基於智譜多模態大模型CogAgent,是全球首個面向公衆、回車即用的電腦智能體。

點評:智譜是國內較早入局智能體的廠商。與其他能與人類互動的普通大模型不同,智能體能更主動地幫人類做事。智譜華章總裁王紹蘭去年12月表示,2025年AI領域有兩個重要發展方向,其中一個就是智能體技術,也就是大模型使用工具,“現在手機APP還需要按照人的方式在操作,可以想象大模型能熟練使用工具對行業意味着什麼。”

具身智能公司跨維智能發佈人形機器人

又有企業入局人形機器人了。近日,具身智能公司跨維智能發佈了基於 Sim2Real 具身智能引擎定義的人形機器人DexForce W1。據介紹,W1採用仿人結構,具備34個動力單元,可做到高度靈活與多場景通用,再搭配跨維純視覺空間智能傳感器,實現了從仿真到數據、模型再部署到真機的端到端閉環。

點評:人形機器人賽道繼續火熱。業界判斷機器人將從專用轉向通用。此前跨維智能創始人賈奎判斷,隨着操作對象、環境和任務複雜性逐漸增強,通用具身智能將會經歷L1~L5五個階段,從半結構化場景和特定機器人形態處理特定任務,升級到在任意/未知場景中以自適應的通用機器人形態完成任意任務。

Meta今年資本支出將達600億~650億美元

當地時間1月24日,MetaCEO扎克伯格表示,今年將是“人工智能決定性的一年”,爲了實現公司在AI領域的目標,即2025年Meta AI成爲領先的AI助手,服務超過10億人,Llama 4成爲最先進的AI模型,公司正在建設一個2吉瓦以上的數據中心,佔地面積“能夠覆蓋紐約曼哈頓的很大一部分”。公司計劃2025年上線1吉瓦的算力,預期到年底時能夠擁有130萬塊GPU。Meta今年的資本支出將達到600億~650億美元的規模。

點評:科技巨頭對AI的投資還在繼續加碼。Meta的Llama系列模型走了開源路線,成爲開源大模型的標杆。有業內人士告訴記者,閉源大模型廠商發佈產品,一個最基本的前提就是要比Meta的開源模型更好。Meta將繼續大額投資建設數據中心,其他科技巨頭或也將跟進。