人形機器人,自動駕駛“老炮”創業第二站
造一臺人形機器人,或許正在成爲2025年最炙手可熱的事情。
從去年第四季度開始,伴隨着大模型應用的深入,具身智能概念被點燃,其中最鮮明的一個特點是,大量自動駕駛大佬的轉行加入。
隨便說幾個比較有分量的,智駕芯片上市公司地平線創始成員、副總裁、前軟件平臺產品線總裁餘軼南(博士)聯手理想汽車前智能駕駛產品總監趙哲倫成立具身智能領域初創公司維他動力;
百度集團資深副總裁、CEO助理、原百度智能駕駛事業羣組(IDG)負責人李震宇加盟具身智能賽道初創公司它石智航;
前小米其次自動駕駛產品技術負責人和量產負責人劉方成立具身智能概念公司阿米奧機器人……
左手造車,右手造人,自動駕駛"老炮"們的創業沒有止境。
01車企也來分羹
事實上,除了上文提到了幾位近期涉足具身智能行業的前自動駕駛從業者之外,還有不少自動駕駛行業重量級大佬在很早之前就已經入局。
原文遠知行COO張力2023年6月離職後不到半年即加入人形機器人公司逐際動力,擔任聯合創始人兼COO,全面負責公司在全球範圍內的戰略規劃、渠道拓展、項目實施、市場營銷以及政府關係事務。
曾在Waymo和Momenta擔任重要技術職位的高繼揚2023年5月創立了具身智能公司星海圖(StarSeer AI),並擔任CEO。公司成立後不就即獲得了由IDG資本、BV百度風投等在內的頂級投資機構千萬級美元的投資。
2023年4月,曾在小鵬汽車和OPPO擔任首席科學家的郭彥東創立智平方(Shenzhen AI Square)科技有限公司,擔任創始人兼首席執行官,如今公司自研的多模態大模型——AI2R Brain,能夠驅動Alpha Bot機器人在多樣化的場景中實現高精度感知與自然交互。
此外,還有其他一些轉行到具身智能賽道的自動駕駛精英。
孫兆治:
珞博智能高管,曾任小鵬機器人產品設計負責人,滴滴出行的造車項目中擔任產品負責人。
王凡:
原縱目科技CTO,後加入北斗智聯科技有限公司,出任CTO。
王榮興:
Momenta負責產品工程研發的副總裁,離職後進行大模型創業,2023年6月創立萬仞AI。
陳俊波:
菜鳥網絡"E.T.物流實驗室"無人車算法負責人,離開阿里之後,與前阿里機器人CEO谷祖林等人共同創辦了"有鹿機器人",進軍戶外清潔機器人領域。
肖軍:
前京東集團副總裁、京東物流X事業部總裁,選擇了倉儲機器人領域進行創業,創辦天下先智創機器人,並獲得了來自零一創投、經緯創投、紅點中國的2億元投資。
一個有意思的現象,自動駕駛"老炮"們轉入具身智能賽道扎堆創業,車企們也不甘落後,也集體佈局具身智能。
去年12月26日,廣汽集團發佈自主研發的第三代具身智能人形機器人——GoMate是車企佈局具身智能賽道的最新動態。
GoMate是一款全尺寸的輪足人形機器人,全身擁有38個自由度。廣汽集團機器人研發團隊負責人張愛民博士表示,廣汽集團計劃2025年實現自研零部件批量生產,並率先在廣汽傳祺、埃安等主機廠車間生產線和產業園區開展整機示範應用;2026年實現整機小批量生產,並逐步擴展至大規模量產。
稍早前的2024理想AI Talk中,理想汽車CEO李想回應是否會做人形機器人時表示,概率上肯定是100%,李想還強調,理想是一家人工智能企業,要做的不是汽車的智能化,而是人工智能的汽車化,並將推動人工智能普惠到每一個家庭。
11月6日的小鵬汽車"AI科技日"上,小鵬汽車也亮相了全新一代人形機器人"Iron艾倫",該款人形機器人已經進入小鵬汽車廣州工廠進行了小鵬P7+車型的生產實訓,未來將會聚焦在工廠和線下門店等場景。
除了親自下場之外,還有車企通過聯合合作伙伴或者投資的形式來佈局具身智能。
奇瑞汽車就聯手AI公司Aimoga共同研發了人形機器人Mornine,進軍人形機器人賽道;上汽創投則參與了人形機器人本體企業智元機器人的A3輪戰略融資,上汽集團以投資機器人企業的形式切入人形機器人領域。
02相同的技術內核
造車和造人兩條賽道之所以能夠隨意融合,很大程度還是源於技術的同源,即都是基於對環境的感知和交互,對外界信息進行計算後,指導機器進行運動的過程,從本質來看,兩者都需要具有智慧的大腦,只是外在表現的物理形體的不同。
原特斯拉自動駕駛部門的負責人Andrej Karpathy近期接受訪談時也表示:汽車也是機器人,在從汽車到人形機器人Optimus的技術轉移中,工作量其實不大,而且工具都是現成的,只是從汽車轉移到機器人上,系統被重新配置,但本質上還是相同的。
雖然技術同源,然而在實際應用層面,自動駕駛和具身智能還是要面對不同類型、不同等級的數據處理需求和計算能力。
從計算規模來看,自動駕駛的高速場景較多,並且和安全關係緊密,所以需要較高算力的芯片支持實時計算;而智能機器人,在現階段通常在相對低速環境中工作,相應的計算需求會降低。
地平線聯合創始人&CTO黃暢曾對自動駕駛領域行業的基礎算力進行過說明,L2級需10 TOPS左右;L2+則需要幾十TOPS;L3需要100 TOPS以上;L4需要1000 TOPS,要充分滿足L4級要求,甚至需要幾千個TOPS。
然而對機器人大模型來說,以能夠推理7B大模型的單張NVIDIA A100舉例,其TOPS峰值達1248,因而,建立雲邊端協同的數字算力環境,對保障各類機器人的感知、計算和處理能力至關重要。
在運動控制的維度上,自動駕駛只需要控制2D維度的運動,而人形機器人僅手部的抓取這一項,就需要模仿生物體多達20個以上的關節運動,這對計算和控制提出了更高的挑戰。
此外,自動駕駛面對的數據相對"標準化",大多是車道線、信號燈等在一定規則內運行的內容,機器人不同,它們工作的場景複雜多變,這就導致數據種類也會相應變多且發散,這同樣對計算能力提出了一定的要求。
以當前已經有規模應用的酒店服務機器人爲例,雖然工程師們通過強化機器人的地圖構建能力,應用VSLAM技術進行機器識別並標定禁行線,強化避障算法和傳感等方式,已經能夠讓機器人極可能的避免與行人發生衝突,並能更好、更靈敏地識別地面上障礙物。
現在,酒店場景下至少有三種環境的變化會對機器人的運行產生影響。
物理環境方面,因清洗地毯、會議設備設施、裝飾品擺放等地面環境的改變,或造成機器人識別故障,使得機器人路徑識別錯誤;
社會環境方面,在電梯中與人或其他發生優先乘坐電梯的糾紛;
數字環境方面,酒店組網方式讓機器人在電梯或角落位置出現的通信失敗等等。
馬斯克曾表示,特斯拉現有的 FSD 技術,可以在未來和機器人模塊進行一定程度的算法複用,但仍然只是在"底層模塊"中進行,"更高階的計算和場景還是需要針對機器人平臺進行專項開發。"
李想也說,如果我們連L4級跟自動駕駛的汽車都解決不了,怎麼去解決更復雜的?因爲車是個無接觸機器人,而且道路是標準化的,包括道路上的提示和參與者都是標準化的,而且每個人都受交通規則的 訓練,我覺得這已經是最簡單的機器人了,如果車沒法實現,其實其他人工智能機器人,還是非常有限的。
03把價格打下來
在具身智能的競爭中,商業化是創業者們面對的共同難題,特斯拉去年的股東大會上,馬斯克首次談到人形機器人初創公司,"原型很容易,批量生產很難,甚至不可能",其中的原因不光在於軟件算法和硬件傳感器等,更在於生產和工程能力,說的直白一些,就是生產出來的產品有合適的價格,能夠被用戶所接受。
我們先來看軟件算法。
從底層算法模型來看,具身智能的軟件可以分爲大腦和小腦。
大腦負責感知並模擬人類的思維決策過程,小腦則是模仿生物進行復雜的運動控制。
大腦算法中的環境感知和理解和自動駕駛一樣,都主要基於機器視覺,發展已經比較成熟了,目前很多具身智能創業公司多依託科技大廠的多模態大模型賦能。
比如,Figure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大語言-視覺(VLM)模型;
樂聚機器人旗下"夸父"接入華爲盤古具身智能大模型;
優必選旗下walker S接入百度文心一言大模型;
星動紀元旗下"小星"系列接入阿里通義千問和智譜清言兩家大模型;
智元機器人多模態通用大模型用的是訊飛星火大模型(操作大模型自研)等。
這些大廠的大模型在基礎能力上都有不錯的表現,也各有自己擅長的長板,在這方面,創業公司們的起點大致相同,差異不大。
可是在運動控制的小腦算法方面,各家就顯示出不同的技術路徑。
最典型的案例,人形機器人的控制算法發展,已經經歷了基於模型的控制算法(LIPM+ZMP)、動態模型控制和最優控制算法(MPC+WBC)、模擬學習+強化學習(IL+RL)等幾個階段。
目前的主流是MPC+WBC方案,但IL+RL路線被行業普遍認爲是未來主流的控制方式,但由於該方案經過創業公司們的無數次嘗試後,進入到技術瓶頸期,且在短期內難以突破,這也是諸多人形機器人本體公司推出輪式仿生機器人而不是雙足人形機器人的主要原因。
硬件方面則主要包括芯片、傳感器、執行運動控制操作的"手""腳"等。
目前算力芯片在人形機器人身上的成本佔比大概是幾十分之一,地平線分拆出來的芯片及解決方案廠商地瓜機器人開發者生態負責人胡春旭在接受媒體採訪時表示,在不同類型的機器人中,芯片成本佔比差別不大,大約在7%~10%之間,一臺人形機器人均價50萬的情況下,芯片這一層的成本不超過1萬元。不過,未來在人形機器人電機等部件成本下行的情況下,芯片部分成本佔比預計有所增加。
相比之下,運動控制與執行部分的"手"就要貴很多。
由於手需要執行抓取、放置、推拉等動作,對操作精度的要求也很高,上肢操作的自由度自然就相應增加了。
有專業人士表示,人形機器人不算上"手",全身自由度可能在27個左右,然而去年11月底,特斯拉展示的Optimus人形機器人能用手接住網球並放下,動作靈活,其採用的靈巧手自由度比前一代增加了11個,達到22個。
在行業對高自由度形成共識的大背景下,做靈巧的手相當於再造一個機器人,這也是"手"的價格居高不下的原因之一。
星動紀元聯合創始人席悅曾介紹過自家產品,"手占人形機器人全身成本大概1/5到1/4",其中的主要原因在於現在的觸覺傳感器還很貴,甚至比整隻不帶觸覺傳感器的"手"更貴,"一隻手用到的觸覺傳感器可能要大幾千元,一隻手上的觸覺傳感器只有在佔手的成本10%左右的時候纔可能大規模應用",有專業人士如是表示。
從上文的分析中不難看出,就像無人車一樣,從最開始的幾十、上百萬一輛,到逐漸下降到20萬左右的Robotaxi,甚至10萬以下的無人配送車,自動駕駛的普及與滲透這才加快了速度。
對於具身智能創業企業們來說,如何將機器人的價格打下來,將是他們在未來競爭中能夠佔據主動的關鍵。