特斯拉領銜,華爲、理想跟進,端對端成智駕新賽點

在AI大模型興起以前,車企談智能駕駛,一般都將重點放在算法或者芯片算力上。但是隨着AI大模型的迅速鋪開,自動駕駛的技術路徑開始飛速,從CNN、RNN、GAN到Transformer大模型轉變,曾經主流的輕高精地圖城區智駕,逐漸被“端對端”所取代。

從搶先吃螃蟹的特斯拉,到跟隨而至的問界、理想、小鵬,端對端智駕正在像雨後春筍一般,迅速在智能車江湖迅速展開。

端對端成智駕新風口

據公開信息透露,小米端到端全場景智能駕駛,於不久前開啓定向內測;零跑B系列和C系列將於2025年實現自研端到端大模型智駕系統上車;蔚來計劃明年1月推送用於智能駕駛的端到端大模型架構。在此之前,理想、問界、小鵬、比亞迪等諸多車企,都紛紛公佈了自家的端對端解決方案。不難看出,在當下這個時點,端對端智駕解決方案,早已經成爲了車企必選的智駕路徑。

首先,從技術上來看,端對端技術迭代較快、路徑短、信息損耗小,對加速L4級智能駕駛到來非常有幫助。“端到端”模型將感知、規劃與控制三大模塊整合在一起,消除了模塊間的界限,簡化了系統架構,提高了運行效率。整合後的模型能夠更快地處理數據,提高系統的響應速度,加速智駕的去高精地圖化。

基於這一點,特斯拉首先將端對端技術應用在了FSD V12上,並取得了顯著的成績,讓行業內外的從業者和用戶,前所未有地感受到了這種技術的魅力。比如,小鵬汽車董事長何小鵬認爲,端到端大模型將讓自動輔助駕駛過渡,到完全自動駕駛的時間大幅縮短,2025年小鵬汽車就能在中國實現類L4智駕體驗。輕舟智航CEO於騫認爲,端到端技術逐漸把非機器學習的部分擠得越來越小,整個系統完全通過數據驅動來實現智能駕駛能力……

雖然從當前來看,端對端或許並非最優解,但它能夠處理傳統路徑難以解決的極端案例,並且代表了一種減少人工編碼依賴更高效的思路。或許正是基於此,行業內外前所未有地在端對端技術方案上,達成了空前一致。

其次,從成本上來考慮,端對端技術在成本上比感知模型更省錢。其實,早前國內只有30萬以上的車型纔會匹配智駕模式,而在更低的價格段則幾乎沒有。說到底主要還是之前的技術不成熟,導致智駕的成本過高所致。但在行業去高精地圖和硬件之後,相關的智駕方案變得越來越親民。

比如,大疆表示7000元就能解決城市NOA,且電車油車都能用;行業第一批AI+雙目方案,4000元就能實現領航輔助功能。模塊化智駕上,元戎啓行已經將整套智駕解決方案成本下探到2000美元,同樣是激光雷達+攝像頭,硬件成本已經下探至7000美元。

相比以上方案,端對端方案的成本更省,依靠純視覺方案其去掉了所有激光雷達,變成了純軟件驅動的技術,技術可以不斷迭代、成本可以無限下探,這正是特斯拉可以不斷降價的原因所在。在技術與成本疊加之下,端對端的技術方案,自然就成了國內智駕路線的核心趨勢。

華爲、小鵬們較量的新戰場

事實上,與前幾年消費者普遍對國內智駕方案存疑不同,隨着近兩年國內智駕水平的上升,特別是端到端帶來的新的算法和模型的應用,正在給消費者帶來前所未有的全新體驗,這就使得市面上汽車是否標配智駕,越來越成爲消費者選擇電動車的重要標誌。在此背景下,端對端技術方案日益成爲華爲、小鵬等車企角逐的新焦點。

一方面,通過升級端對端智駕方案,可以從價格與用戶體驗上吸引消費者,從而幫助車企賣更多的車。根據乘聯會聯合科瑞諮詢發佈的數據,2024年1~8月,中國新能源乘用車L2級及以上的ADAS功能裝車率達到66.6%,同比大幅提升21.0個百分點。另據蓋世汽車研究院配置數據,今年1~8月,國內市場高速NOA累計配套量已超93萬套,對應滲透率達7%,城市NOA也開始規模化上車,滲透率已達1.3%。

按照業內人士估計,明年將是自動駕駛的決勝年,NOA等高級智能駕駛功能,將普及至10萬元左右的車型,預計明年NOA的市場滲透率將超過40%。不難預見,隨着更具成本優勢的智駕方案落地,城市NOA下沉到10萬元級的車型越來越近,並逐漸呈現出一個普及化的趨勢。對於車企來說,誰的智駕方案好、體驗佳、車型性價比高,誰就可以大量賣車,誰就能夠贏得市場。

從這個角度上來看,無論是小鵬MONA M03等新智駕車型的爆發,還是蔚來、理想等車企新規劃的大衆車型,都在朝着這一方向去努力。於車企而言,在電動化、性能、續航差不多的情況下,智駕已經成爲車企影響消費者心智的關鍵變量。低成本的智駕方案,則能夠兼顧大衆需求與車企賣車的需求,極大增強車企的市佔率,並且通過走量的“智能車”,幫助車企快速積累高質量、有價值的專業數據,爲更高級的智駕方案打下堅實的基礎。

另一方面,通過升級端對端技術,加快整個車企智駕能力的升級,倒逼車企升級汽車的底層算力能力。從行業經驗來看,端對端技術的落地,不僅面臨技術路線和數據的考驗,還面臨龐大的算力需求考驗。以端對端做的最成功的特斯拉爲例,在2024Q1財報電話會上,特斯拉表示,公司已經有35000張H100 GPU,並計劃在2024年內增加到85000張H100以上,達到和谷歌、亞馬遜同一梯隊。

在這一規模預期之下,馬斯克近期表示特斯拉已經不再算力緊張。國內,小鵬“ 扶搖 ”自動駕駛智算中心,算力可達600PFLOPS(以英偉達A100 GPU的FP32算力推算,約等於3萬張A100 GPU),並宣佈今年投入1億美元用於算力建設,未來每年將進一步加大投資。商湯大裝置已經佈局全國一體化的智算網絡,擁有4.5萬塊GPU,總體算力規模達12000PFLOPS,2024年底將達到18000PFLOPS。而從目前國內的情況來看,大多數研發端對端的自動駕駛公司的訓練算力,仍停留在千卡級別。

不難預見,隨着端對端智駕技術的逐步深入,數據、算力的競賽,將成爲接下來所有車企競爭的重點。

新階段的現實考驗

隨着端對端技術路線逐漸發展成主流趨勢,車企的競爭焦點也發生了轉變,已經不再單純地比拼城區NOA功能的開城數量,而是更加註重爲用戶提供優質的駕駛體驗。在次背景下,從“車位到車位”日益成爲車企競爭的新焦點,與此同時數據激增、商業化挑戰、新技術風險等也正在成爲新的挑戰,考驗着每一個車企。

首先,隨着圍繞用戶體驗展開的VLA模型升級,汽車所用的算力在快速飆升,其對硬件算力和數據資源閉環的要求也越來越高。前文提到隨着技術的不斷髮展,端對端2.0逐步進入圍繞用戶體驗而展開的新階段,在該階段此前備受矚目的“端到端+VLM(視覺語言模型)”,開始向“VLA模型”迭代。

作爲一個融合視覺、語言和動作的多模態模型,旨在提高模型的泛化能力和判斷推理能力,可以簡單看作是端到端+VLM系統的一個全面融合體。相比以前的VLM系統,它背後對資源的消耗更大、對數據閉環的要求也更高。有觀點認爲,部署VLA模型對芯片算力的要求,提升到英偉達DRIVE Thor級別,算力達750 TOPS。相比之下,當前高階智駕的算力硬件通常配備的是2顆英偉達OrinX芯片,總算力爲508 TOPS,差的可不是一星半點。

除了算力挑戰之外,數據問題帶來的挑戰遠超外界想象。小馬智行的CTO樓天城曾表示,想要訓練出高性能的端到端模型,數據質量的要求比一般性能模型高出幾個數量級。單論數據而言,目前國內車企的數據儲備基本均落後於特斯拉,還處於初期階段。加之對數據質量的要求,國內車企離數據積累的“長跑終點”仍“遙遙無期”。

其次,隨着端對端技術的持續升級,在堆數據、堆算力等諸多高門檻操作之下,車企的試錯成本在逐步升高,商業化也面臨市場檢驗。前文提到,隨着端對端技術的升級,車企端對端對算力、數據的閉環考驗越來越高,車企爲此付出的代價也越來越大,車企入場需要考慮效率與成本的平衡問題。

另外,即便是完成了開發交付,端對端的驗證落地也面臨諸多考驗。車企直接實車驗證顯然成本過於高昂,基於雲端測試可能與實際情況並不匹配。在市場層面,消費者也存在着一種矛盾心理:一方面,消費者對於汽車“智能化”和自動駕駛的興趣與期望在上升;另一方面,它們的支付意願卻在普遍下降。所以,即便完成了端對端智駕的量產,倘若市場不買單,一切願望也將化爲烏有。

從這個角度上來說,端對端智駕的進階,不單單是技術、數據的比拼,更需要市場對其商業化的實際認可。