☰

AI週報 | 特朗普宣佈5000億美元AI投資計劃；OpenAI發佈首個AI智能體

特朗普宣佈 “星際之門” 5000億美元投資

1月21日，在美國白宮舉行的新聞發佈會上，特朗普宣佈，OpenAI、甲骨文和軟銀將成立一家合資企業“星際之門計劃”（Stargate Project），計劃未來四年投資高達5000億美元（摺合約3.64萬億人民幣）用於建設AI相關基礎設施，並創造10萬個工作崗位，初始投資預計爲1000億美元。22日早間，OpenAI發表官方推文介紹“星際之門計劃”，這家新成立的合資公司旨在爲OpenAI在美國建設新的人工智能基礎設施。OpenAI表示，該基礎設施旨在確保美國在人工智能領域的領導地位。據悉，軟銀和OpenAI是這項計劃的主要合作伙伴，其中軟銀負責財務，OpenAI負責運營，孫正義將擔任董事長。

點評：“星際之門計劃”引起了科技圈的關注，這一項目幾乎湊齊了美國的頂尖科技企業，其初始股權投資者包括科技巨頭軟銀、甲骨文，頂尖生成式AI創企OpenAI、以及阿布扎比投資公司MGX，實際的業務佈局中有科技巨頭Arm、微軟、英偉達參與。不過，馬斯克針對此事潑冷水稱“他們其實沒有錢”，並表示軟銀擔保額遠低於100億美元。

OpenAI發佈智能體Operator

當地時間1月23日，OpenAI發佈了自主智能體Operator。Operator可以代理用戶執行基於網頁的操作，例如查看、輸入、點擊、滾用網頁，Operator是OpenAI最早的智能體之一。在20多分鐘的介紹視頻中，OpenAI演示了Operator用於訂餐廳、點外賣、購物。支撐Operator的模型是CUA模型，CUA結合了GPT-4o的視覺能力，且有高級推理能力，可與用戶的圖形界面交互，“看到”屏幕上的按鈕、菜單和文本。

點評:OpenAI已多次釋放看好智能體的信號。Operator發佈後，OpenAI總裁兼聯合創始人Greg Brockman（格雷格·布羅克曼）在社交媒體上表示，2025年是智能體之年。OpenAI CEO山姆·奧爾特曼（Sam Altman）此前在一篇博客長文中表示，相信2025年人們將會看到第一批AI智能體“加入勞動力大軍”。接下來OpenAI可能還會推出更多智能體產品。

全球手機用戶爲AI應用支出達12.7億美元

移動應用分析機構Sensor Tower的最新數據顯示，2024年全球手機用戶在AI聊天機器人和AI藝術生成工具上的支出達到12.7億美元。其中，聊天機器人應用佔據了10.7億美元，較2022年的3000萬美元和2023年的4.55億美元大幅增長。在聊天機器人平臺中，ChatGPT依然佔據主導地位，佔AIGC應用下載量的23%和AI應用消費的40%。谷歌Gemini和字節跳動的豆包分別位列下載量第二和第三。去年全球手機用戶使用AI聊天機器人的時長達到70億小時，同比增長347%。

點評：從數據來看，過去一年裡全球用戶對AI應用展現出了極大的熱情，且掏出十多億美元付費表達支持。聊天機器人只是AI進入千家萬戶的一個角度。根據統計，2024年在iOS和谷歌Play應用商店裡，應用名稱、副標題和簡介裡帶有“AI”字樣的APP，總共被下載了170億次。考慮到這個統計並不包含許多第三方應用市場，實際的數字還會更高。根據另外一份單獨的統計，中國大陸用戶除了最喜歡用豆包外，Kimi、文小言、通義的下載量位居2-4位。

國產大模型再突破，DeepSeek R1開源

1月20日，DeepSeek發佈了全新的開源推理大模型DeepSeek-R1，在數學、編程和推理等多個任務上達到了與OpenAI o1相當的表現水平，同時將AP調用成本降低了90-95%，定價爲每百萬輸入tokens 1元（緩存命中）/ 4元（緩存未命中），每百萬輸出tokens 16元。憑藉其獨特的強化學習訓練方法，DeepSeek-R1首次展現出類人的“頓悟時刻”——在解決複雜問題時，模型會突然停下思考，自主修正推理路徑，甚至用自然語言標註“等等，這一步可能有誤”。

點評：值得一提的是，DeepSeek-R1是DeepSeek旗下首款以MIT協議開源（包含權重）的模型，不限制商用，也無需申請，還明確允許通過模型蒸餾等方式將DeepSeek-R1用於訓練其他模型。這意味着DeepSeek-R1有望在全球AI領域產生廣泛影響，也能從全球開源社區中獲得正向反饋，不斷改進模型。

國內大模型春節前迎來密集發佈周

春節前，國內大模型迎來一波密集更新。1月20日上午，MiniMax海螺上線了語音功能，同日，字節豆包還上線了實時語音大模型，DeepSeek發佈了DeepSeek-R1模型，月之暗面Kimi就推出k1.5多模態思考模型。1月21日，騰訊則開源了混元3D生成大模型2.0，指向另一個方向3D生成大模型，面向遊戲、具身智能等領域的大模型應用。1月22日，豆包大模型1.5Pro版本正式推出，新模型全面提升多模態能力、推理能力。豆包稱模型訓練過程中未使用任何其他模型生成的數據，不走“捷徑”。

點評:以上更新既包括追趕OpenAI o1系列推理模型，又包括追趕OpenAI的實時語音功能，月之暗面和DeepSeek兩家都稱新模型性能對標OpenAI o1正式版。一些學術界人士認爲，新推出的模型代表了業界先進水平。加利福尼亞大學伯克利分校教授Alex Dimakis就表示，跟他交流過的多數AI研究人員都對DeepSeek-R1的性能感到有些震驚，DeepSeek似乎是奔赴OpenAI最初使命的“最佳人選”，其他公司需要迎頭趕上。

智譜多模態智能體推出更新

智譜旗下可自主操作電腦的多模態Agent（智能體）GLM-PC2024年11月29日發佈GLM-PCv1.0版本並開放內測，近日則推出“深度思考”模式，並增加專用來做邏輯推理和代碼生成的功能。此外，智譜也提供了對Windows系統的支持。GLM-PC 基於智譜多模態大模型CogAgent，是全球首個面向公衆、回車即用的電腦智能體。

點評:智譜是國內較早入局智能體的廠商。與其他能與人類互動的普通大模型不同，智能體能更主動地幫人類做事。智譜華章總裁王紹蘭去年12月表示，2025年AI領域有兩個重要發展方向，其中一個就是智能體技術，也就是大模型使用工具，“現在手機APP還需要按照人的方式在操作，可以想象大模型能熟練使用工具對行業意味着什麼。”

具身智能公司跨維智能發佈人形機器人

又有企業入局人形機器人了。近日，具身智能公司跨維智能發佈了基於 Sim2Real 具身智能引擎定義的人形機器人DexForce W1。據介紹，W1採用仿人結構，具備34個動力單元，可做到高度靈活與多場景通用，再搭配跨維純視覺空間智能傳感器，實現了從仿真到數據、模型再部署到真機的端到端閉環。

點評:人形機器人賽道繼續火熱。業界判斷機器人將從專用轉向通用。此前跨維智能創始人賈奎判斷，隨着操作對象、環境和任務複雜性逐漸增強，通用具身智能將會經歷L1~L5五個階段，從半結構化場景和特定機器人形態處理特定任務，升級到在任意/未知場景中以自適應的通用機器人形態完成任意任務。

Meta今年資本支出將達600億~650億美元

當地時間1月24日，MetaCEO扎克伯格表示，今年將是“人工智能決定性的一年”，爲了實現公司在AI領域的目標，即2025年Meta AI成爲領先的AI助手，服務超過10億人，Llama 4成爲最先進的AI模型，公司正在建設一個2吉瓦以上的數據中心，佔地面積“能夠覆蓋紐約曼哈頓的很大一部分”。公司計劃2025年上線1吉瓦的算力，預期到年底時能夠擁有130萬塊GPU。Meta今年的資本支出將達到600億~650億美元的規模。

點評:科技巨頭對AI的投資還在繼續加碼。Meta的Llama系列模型走了開源路線，成爲開源大模型的標杆。有業內人士告訴記者，閉源大模型廠商發佈產品，一個最基本的前提就是要比Meta的開源模型更好。Meta將繼續大額投資建設數據中心，其他科技巨頭或也將跟進。

AI週報 | 特朗普宣佈5000億美元AI投資計劃；OpenAI發佈首個AI智能體

相關資訊