智能週報|大模型技術浪潮裡的機會和陷阱
撰文 | 新皮層小組
編輯 | 吳洋洋
ChatGPT發佈已整整兩年,跳入其中尋找機會的人並沒有減少。
越來越多人離開曾經穩定的大廠,加入創業浪潮。在華爲車BU前CTO陳亦倫今年7月創立了機器人公司「它石智航」後,本週,市場傳出消息稱地平線副總裁餘軼南也離職加入了具身智能創業,幾乎同時,小米汽車自動駕駛產品技術負責人劉方也傳出離職,未來方向也是機器人。機器人熱潮之外,AI原生應用的開發者們也有越來越多人不再滿足大廠的緩慢節奏和回報,開始單幹。比如Google的明星AI原生產品NotebookLM,這個AI筆記應用在推出音頻概述功能並可生成對話式播客後,應用訪問量在10月達到了創紀錄的3150萬次。本週,該產品的核心團隊宣佈集體離職,雖然只有3個人,但在PMF(產品市場匹配)能力稀缺的時代,融到資只是早晚的事。
在遍地是機會、效率和創新精神決定一切的時候,大廠的龐大身軀已經成爲一種劣勢。蘋果在本週被媒體爆出與百度的合作卡關,在測試使用文心大模型解決用戶需求時存在響應準確性的問題。這一窘境既是百度的,也是蘋果的,後者迄今沒有開發出能力比肩於OpenAI、Anthropic等獨角獸公司的大模型,甚至連同爲大公司的Google也不及。不過Google的狀況也好不到哪兒去,本週一,李飛飛創立的「空間智能」公司World Labs發佈了一個可以把2D照片變成3D視頻的系統,用戶可以像戴上VR眼鏡一樣在生成的3D場景中自由移動。這個系統相當於是一個「世界模型」(world model)。3天后,Google也發佈了可以將2D照片變成3D視頻的模型Genie 2。這項發佈的時間可能是早已規劃好的,也可能是迫於李飛飛公司的壓力緊急安排的。要知道,李飛飛的World Labs公司今年1月成立,迄今不到1年。
OpenAI似乎也沒想讓Google好過。今年5月得知Google即將在其開發者大會發布可以看人所看、聽人所聽還能與人即時口頭交流的新模型Astra後,OpenAI提前一天舉辦了一個線上發佈會,發佈了同類模型GPT-4o。繼那次惡作劇後,OpenAI本週再次施展了要搶Google風頭的技能,於Google發佈Genie 2的同一天——12月5日,宣佈了一個爲期12天的連續發佈計劃,並於當天上線了推理模型OpenAI o1的正式版及高級版o1-pro。
同樣身處大廠窘境的還有英特爾和商湯。兩家公司一個在本週把CEO趕下了臺,另一家公司把公司給拆分了,理由都是爲了更好地應對市場競爭。
不過,遍地是機會的時候,效率和創新精神其實也不完全決定一切,如果只懂技術不懂法律,創業也可能充滿陷阱。本週,中國明星初創公司月之暗面遭到了金沙江投資人朱嘯虎發起的進一步輿論攻擊,指責前者在離開原公司(循環智能)創業時沒有取得完整合法手續,而且其綁定的股東之一張予彤在接受月之暗面股份時與她自身的投資人身份存在利益衝突。目前,金沙江等投資機構已對月之暗面創始人楊植麟和聯合創始人兼CTO張宇韜,在香港國際仲裁中心提起仲裁。
以下內容由「新皮層」團隊製作,歡迎關注。
Key Points
大模型及應用
李飛飛公司發佈3D生成系統,直接把2D照片變3D視頻;
Google發佈世界模型Genie 2,可以生成3D世界並預測角色動作;
ChatGPT探索在回答中植入廣告;
OpenAI開啓12天連續發佈計劃,首日發佈推理模型o1正式版及o1-pro;
蘋果爲使用百度大模型付了100億美元,但模型效果不如意;
Copilot的「Vision」功能上線;
公司動態
地平線副總離職創業機器人;
小米自動駕駛負責人劉方離職,加入機器人創業;
效仿阿里巴巴,商湯也把公司拆了;
Google NotebookLM核心團隊集體離職創業;
有了首位CFO後,OpenAI又有了首位CMO;
英特爾新CEO可能是個華人;
月之暗面陷股權危機。
大模型及應用
李飛飛公司發佈3D生成系統,直接把2D照片變3D視頻
12月2日,李飛飛創立的空間智能公司World Labs發佈一個人工智能系統,它能夠通過單個2D圖像生成3D場景。只用上傳一張圖片,該系統就能將其變成一個3D場景,然後用戶就能像戴上VR眼鏡一樣在這個場景中自由移動、從多個角度審視場景並觀察某個物體的細節。此外,該功能還可被用於改變2D照片的景深,模擬推拉變焦或調整機位效果。此前,業內已有的3D生成模型多基於像素進行生成,存在分辨率低且視角不穩定的問題。相較而言,World Labs生成的3D環境穩定、可交互且可修改。在博客文章中,World Labs並未將這項成果稱爲模型,而是「AI系統」。官方稱,這些成果是早期預覽,目前已對公衆開放候補試用。
Google發佈世界模型Genie 2,可以生成3D世界並預測角色動作
12月5日,Google DeepMind發佈最新版基礎世界模型Genie 2。它能夠將2D圖片直接轉換爲3D視頻,並且,人類或者AI智能體可以控制這個3D世界中的角色,當用戶通過鍵盤和鼠標發出指令後,Genie 2會根據這些操作預測用戶控制的角色下一步會發生什麼。而且,DeepMind稱,Genie 2可以從同一個起始幀生成不同的軌跡,能夠記住視野外的部分,然後在它們再次可見時準確呈現它們,並可以創建不同的視角。在一致性方面,Genie 2最長可以生成一分鐘,官方的大多數示例持續10至20秒。
ChatGPT探索在回答中植入廣告
12月2日,有報道稱,OpenAI考慮在人工智能產品中引入廣告,以開闢新的收入來源。此前,主做AI搜索的Perplexity已經在產品中植入廣告。OpenAI目前在向營利性企業轉型,OpenAI首席財務官Sarah Friar表示,公司會「謹慎選擇」廣告投放的時間和場景,在推出廣告這件事上不是很着急。但今年5月,OpenAI已聘請Google廣告前負責人擔任公司副總裁。目前,OpenAI的主要收入來源是ChatGPT會員費用,以及應用程序接口(API)接入費用,其中API的收入並不理想。
OpenAI開啓12天連續發佈計劃,首日發佈推理模型o1正式版及o1-pro
當地時間12月5日,OpenAI首席執行官Sam Altman宣佈從當日開始將連續12個工作日發佈新的AI功能和產品。活動首日OpenAI推出了月付費200美元的ChatGPT Pro以及正式版的推理模型o1。ChatGPT Pro將使用o1的升級版模型o1-pro。和此前發佈的測試版推理模型o1-preview相比,o1和o1-pro在數學和代碼領域都有明顯提升,後兩者在AIME數學競賽中的得分較o1-preview提升超50%,在Codeforces代碼競賽中得分較preview版本提升超40%。在GPQA Diamond博士級別的科學問題測試中,後兩者的表現也略優於preview。
蘋果爲使用百度大模型付了100億美元,但模型效果不如意
12月4日,有報道稱,蘋果和百度正在合作爲在中國銷售的iPhone添加Apple Intelligence功能,但雙方的合作目前遇到阻礙。不過目前,蘋果和百度都沒有對此消息做出公開回應。據報道,蘋果和百度工程師們正在共同改進文心大模型,使其更適合iPhone用戶,但該模型在理解提示詞和常見場景的響應準確性上仍然存在困難。此外,報道稱兩家公司還因如何使用iPhone用戶數據來訓練和改進模型產生了分歧。百度希望保存並分析從iPhone用戶的AI相關查詢中獲得的數據,但蘋果的隱私政策則禁止收集此類數據。
Copilot的「Vision」功能上線
12月5日,微軟正式開始測試全新功能Copilot Vision。這項功能於今年10月首次發佈,旨在讓AI助手「看見」用戶在瀏覽器中瀏覽的網頁,並對頁面上的文字、圖片和內容進行分析。「當你選擇啓用Copilot Vision時,它會『看到』你所在的頁面,與你一起閱讀,並幫助你解決問題,」微軟Copilot團隊在博客中表示,「瀏覽網頁不再是孤獨的體驗,你不再只是面對滿屏的標籤頁。」Copilot Vision是一項可選功能,用戶需要明確授權後,AI助手才能讀取網頁內容。在10月的功能展示中,微軟演示了AI助手如何讀取OneDrive中的圖片,甚至能夠識別手寫的菜譜並提供烹飪建議。此外,在網上購物時,用戶還可以利用這一功能獲得商品推薦。
公司動態
地平線副總離職創業機器人
12月2日,有報道稱,地平線前副總裁、軟件平臺產品線總裁餘軼南已於近期正式離職。離開地平線之後,餘軼南將從事具身智能創業,主要做消費級產品方向,包含機器人。餘軼南2015年加入地平線,是地平線最早創始人團隊成員之一,曾任百度深度學習研究院科學家,是百度-清華聯合培養博士,其導師是地平線創始人、CEO餘凱。在地平線近10年的任職期間,餘軼南一直從事自動駕駛、計算機視覺等領域的研究。
小米自動駕駛負責人劉方離職,加入機器人創業
12月3日,有消息稱,小米汽車自動駕駛產品技術負責人劉方已離職。「新皮層」瞭解,劉方已不在小米內部通訊錄名單中。愛企查顯示,劉方於今年9月註冊成立了一家人形機器人公司「阿米奧機器人」。10月也曾有報道稱,劉方將入職安克創新,負責剛組建的具身智能團隊,直接向安克創新副總裁、智新科技總裁祝芳浩彙報。劉方是小米最早期的一批員工,離職前擔任小米汽車自動駕駛產品技術負責人和量產負責人,參與了小米自動駕駛團隊籌建、技術研發和量產落地的全過程。加入小米前,劉方在Google中國搜索業務部門任職。
效仿阿里巴巴,商湯也把公司拆了
12月3日,商湯科技董事長兼CEO徐立發佈全員信,宣佈組織調整結束,公司啓用「1+X」的新架構。其中,「1」代表以生成式AI爲核心的商湯核心業務,「X」則代表商湯集團重組拆分的生態企業,包括智能汽車「絕影」、家庭機器人「元蘿蔔」、智慧醫療、智慧零售等,各生態企業設立獨立的CEO。後續,這些生態企業可能獲得靈活的激勵機制和融資通道。目前,商湯非核心業務中只單獨披露了智能汽車「絕影」的發展狀況。根據商湯2024年上半年財務報告,「絕影」業務收入1.68億元,同比增長100.4%,在商湯公司營收中佔比提升至9.7%。
Google NotebookLM核心團隊集體離職創業
12月3日,Google旗下大模型應用NotebookLM團隊原負責人Raiza Martin在社交媒體宣佈離職創業。與她一起離職創業的,還有NotebookLM設計師Jason Spielman和核心工程師Stephen Hughes。Martin接受媒體採訪時稱,三人創辦的新公司業務將面向消費者,用最新的人工智能模型開發一些對普通人有用的產品。該公司仍處於起步階段,尚未宣佈任何融資,其網站也顯示「正在建設中」。NotebookLM是Google Labs的實驗性AI應用,由Google大模型Gemini 1.5 Pro提供支持。產品上線於2023年7月,最初只是一款能夠根據文件內容生成文字摘要的AI筆記應用,核心團隊規模不到10人。今年9月,NotebookLM推出音頻概述功能,可以生成對話式的播客,用戶數量大漲。10月,該應用的訪問量同比激增超過200%,達到了3150萬次。有報道稱,NotebookLM未來將被集成到智能手機的Gemini App中。
有了首位CFO後,OpenAI又有了首位CMO
12月3日,OpenAI宣佈引入加密貨幣交易所Coinbase前高管Kate Rouch擔任首任CMO,新的人事任命於12月10日生效。Kate Rouch稱, 她的主要工作是面向終端消費者和企業客戶推銷包括ChatGPT在內的OpenAI旗下產品套件,同時負責與外界溝通OpenAI開發AGI的使命。Kate Rouch在品牌營銷領域工作多年。自2010年離開貝恩公司的諮詢工作後,她在社交網站Meta的營銷部門工作了11年,最終成爲公司品牌和產品營銷的副總裁,工作範圍涵蓋Facebook、Instagram、WhatsApp以及Messenger等公司核心App產品。2021年8月,Kate Rouch轉而加入加密貨幣交易所Coinbase,擔任後者首任CMO,推動公司投放美國超級碗廣告。
英特爾新CEO可能是個華人
12月4日,有報道稱,在基辛格(Pat Gelsinger)於週一辭職後,英特爾正在積極考慮幾位CEO候選人,其中就包括前董事會華裔成員陳立武(Lip-Bu Tan)。週一,該公司還任命首席財務官David Zinsner和高管Michelle Johnston Holthaus爲臨時聯席首席執行官。陳立武於1959年出生於馬來西亞的華人家庭,本科畢業於南洋理工大學物理學,後又分別在麻省理工學院、舊金山大學獲得核工程碩士學位和工商管理碩士學位。2004年,陳立武加入Cadence,並在2009年至2021年期間擔任Cadence的CEO,同時還在軟銀、惠普、AMCE、偉創力等公司擔任過董事等職位。2022年9月,陳立武加入英特爾,主要負責與芯片製造相關的核心業務。
月之暗面陷股權危機
12月5日,金沙江創投主管合夥人朱嘯虎公開了月之暗面仲裁案的關鍵細節。朱嘯虎稱,月之暗面原是循環智能內部開發了兩年的項目;循環智能董事會同意拆分月之暗面的簽字或可被認爲無效,因爲循環智能時任董事、金沙江創投原主管合夥人張予彤隱瞞了自己持有14%的月之暗面免費初始股份。朱嘯虎表示:張予彤這一行爲違背了其職務責任,已被金沙江創投解僱。12月6日晚,月之暗面創始人楊植麟發文迴應稱,離開前公司(指循環智能)重新創業獲得了每一位董事的簽字同意和所有必要手續。