小米追擊智能駕駛,前圖森CTO王乃巖將加入|獨家

36氪汽車獲悉,前圖森未來中國CTO王乃巖將加入小米汽車,向小米技術委員會主席、小米汽車自動駕駛負責人葉航軍彙報。

就此消息,36氪汽車向小米相關人士進行了確認。

此前,王乃巖主導圖森未來中國的研發與管理工作,同時負責L2級輔助駕駛、L4級自動駕駛方案的開發落地。

更早之前,王乃巖博士畢業於香港科技大學,擅長深度學習,是深度學習開源框架MXNet的核心開發者,在計算機視覺與機器學習頂級會議與期刊上曾發表論文40餘篇。

王乃巖的加入,是小米智駕技術提速的標誌性信號。

日前,雷軍公開表示,開啓交付後的43天,小米SU7交付量已突破1萬輛,其年產能也相應提升至10萬輛。達成這個交付量,小鵬與理想用了7個月,問界用時87天。

小米在銷售與整車製造上的成績刷新了記錄,雷軍的工作重點開始轉移至智能駕駛。

5月18日,雷軍駕駛小米SU7 Pro版進行了高速、城市NOA(智能導航輔助駕駛)的直播首秀。直播中,雷軍闢謠了小米將與第三方合作視覺方案的傳言,重申了小米自研智駕的決心。

雷軍在直播中兩次喊話招人,公開詢問是否有智駕大牛願意加入小米。

目前,小米在智能駕駛上的投入已超47億元,團隊規模超千人,其測試里程也已超過1000萬公里,城市NOA功能也將在5月陸續推送給10城用戶。

衝擊第一陣營,小米需要更多人才

這不是小米第一次收攬智駕人才。

早在雷軍宣佈造車的2021年,小米集團便以7737萬美元收購了自動駕駛技術公司深動科技。20餘名深動科技核心研發人員的加入,幫助小米快速補齊了各模塊技術負責人陣容,奠定研發人才基礎。

而王乃巖的加入,有望助力小米取得智駕前沿技術進展。

有圖森未來研發人員告訴36氪汽車,王乃巖既懂感知,又懂規劃控制,對智駕全鏈條的理解都較充分。包括時下火熱的端到端技術方案,王乃巖都有獨到見解。

“端到端”是深度學習中的概念,指AI模型中只要輸入原始數據就可以輸出最終結果。

特斯拉率先引領了智能駕駛端到端風潮,馬斯克表示,其FSD Beta v12(全自動駕駛軟件)可以實現輸入圖像,輸出轉向/剎車/加速等車輛控制信號。

王乃巖曾公開呼籲不要陷入特斯拉的狹義“端到端”理解。他表示端到端是較有希望解決高階自動駕駛難題的技術路線之一,但方案落地仍有許多待解決的問題,特斯拉的方案並不代表正確答案。

他認爲,端到端的重點是信息的無損傳遞,執意固定信號的輸入與輸出點只會給系統帶來不必要的負擔。

對技術與市場有獨立思考的王乃巖,或將給小米智駕帶來彎道超車的可能。

在2024小米投資者日上,雷軍表示,將進一步加大在智駕的投入。今年小米智駕團隊將擴充至1500人,2025年增加到2000人,每年投入資金約爲15億元。

而行業對人才的態度出現了分水嶺。在剛結束的小鵬科技日上,何小鵬宣佈智駕團隊今年將擴招4000人;而理想汽車卻在日前啓動了智駕團隊的裁員工作。

人才快速流動,前圖森CTO王乃巖的加入只是小米智駕序曲,具備決心與號召力的雷軍,很有可能快速補齊智駕功課。

智駕進入決勝局,AI與數據成爲關鍵

智能駕駛的顛覆性變化,始於AI大模型的加入。

傳統模式下,感知、決策、規劃控制等模塊,均依賴工程師手寫代碼來制定規則,智駕效果取決於規則覆蓋度,有限的人類腦力侷限了智駕可用場景。

2021年,特斯拉開始將基於Transformer的BEV(鳥瞰圖)技術引入感知領域,使得攝像頭從2D圖像轉化爲3D圖景。智能駕駛得以擺脫對高精地圖的依賴,國內智駕進入輕圖時代。

隨後,繼續推出的Occupancy(佔據網絡)等技術,不僅彌補了純視覺感知路面物體縱深不足的短板,同時改變了神經網絡先“認識”後“識別”的短板,大大拓展了純視覺方案的邊界。

Transformer+BEV+Occupancy的技術路線,成爲行業主流視覺感知方案,能否快速落地相同技術,成爲國內廠商爭搶智駕技術高地的證明。

2024年,完成感知模塊進化的特斯拉帶來了新的突破,在決策及規劃控制領域引入AI神經網絡,帶來了“端到端”大模型。

在更新的使用說明,特斯拉寫道:FSD將城市道路駕駛堆棧升級爲單個端到端神經網絡,該神經網絡由數百萬個視頻片段訓練而成,取代了超過 30 萬行的C++代碼。

“端到端”神經網絡的應用,讓FSD得以從Beta(測試版)轉向Supervised(即受監督的),可以向北美數百萬名用戶推送使用。“端到端”在城市NOA的拓展速度、使用範圍及用戶體驗等方面的天花板更高,這也是當下智駕行業的最熱賽點。

與特斯拉路線完全相同的小鵬,於2024年5月發佈了天璣系統XOS 5.1,其中,由神經網絡XNet、規控大模型XPlanner、大語言模型XBrain組成的端到端大模型,將幫助小鵬在2024年三季度實現全國每條道路都能開,並在2025年實現城區智駕體驗的飛躍。

堅持激光雷達路線的華爲,在ADS 3.0中則進一步去掉了BEV網絡,採用GOD網絡負責感知,PDP網絡負責預決策規劃。加入激光雷達的華爲,在AEB主動安全功能上的確擁有更加亮眼的成績。

目標進入第一陣營的小米,則在3月28日的發佈會上展示了端到端神經網絡在泊車領域的應用,目前已能實現5cm精度的極窄庫位泊入,及23km/h巡航的代客泊車。

然而,模型研發只是開始,海量數據訓練纔是端到端神經網絡發揮作用的關鍵。熱賣的問界車型正爲華爲提供源源不斷的數據糧草,技術雄厚的小鵬卻面臨銷量的連連下跌。

雖然在端到端上研發進度不早,但首款車上市33天便突破8.8萬銷量的成績、82.39%的智駕激活率,將讓小米成爲無法忽視的數據對手。