具身智能工業機器人,何必是人形?|甲子光年

一個柔性生產切線引發的難題與機會。

作者|趙健

2023年,微億智造CEO張志琦在走訪工廠的時候,經常看到這樣令人困惑的一幕:一羣工人在生產線上忙碌地工作,而工人不遠處就是一臺或者幾臺閒置的機械臂,在工廠的角落裡安靜地“吃灰”。

作爲工廠自動化產線的重要一環,機械臂在焊接噴塗、裝配搬運、機牀上下料等環節發揮着重要的應用,理應在工廠有非常成熟的落地場景。爲什麼工廠不用這些花重金購買的機械臂上崗幹活呢?

在與廠長交流後,張志琦恍然大悟,他將這一問題總結爲“柔性生產的切線難題”。

柔性生產是指多品種、小批量的按需生產方式,以此適應多變市的場需求和激烈的市場競爭。在柔性生產模式下,長則幾周,短則幾天,工廠就會接到新產品的生產需求。當產品的大小、規格總是在變,工廠的生產線就需要重新排布——這一過程稱之爲“切線”。

如果採用機器人幹活,每一次切線都需要重新將產線與機器人系統做適配。更要命的是,這周剛剛調試好的機械臂,很可能在下個月的切線中就不再適用了。對於工廠,尤其是中小型工廠來說,這是一筆不可承受之成本。

一來二去,這些工廠就乾脆放棄機械臂,不如用人工來得靈活方便,很多機械臂也就落得個在工廠吃灰的下場。

張志琦看到的不是一家工廠的個例,而是大部分中小規模工廠正在經歷的普遍狀態。張志琦告訴「甲子光年」,直到今天,柔性生產的切線都是一個普遍的難題,沒有通用的解決方案。

放眼全球,機器人裝備的滲透率仍然較低。截止2022年,中國雖然已經是全球第一大的機器人市場,但每萬名工人的工業機器人數量爲392臺,低於韓國(1012臺)、新加坡(730臺)、德國(415臺)、日本(397臺)等工業強國之後,還有很大的提升空間。

有市場需求的地方就會有市場機會。柔性生產的切線難題,正是微億智造捕捉到的進入工業製造大市場的機會。

1.解決2000人工廠的生產力問題

江蘇省常州市是重要的工業城市。在常州有一家“果鏈”公司,專門生產手機充電頭。2017年時,這家果鏈公司一個3000多人的工廠裡,有2000人專門做外觀缺陷檢測。

產品外觀缺陷質檢是3C、汽車等工業產品在出廠前必不可少的一道工序。在過去幾十年,質檢用到的工業視覺是今天看來非常簡單的傳統機器視覺算法,只能識別簡單的長寬高、有或無等基本要素,如果涉及更多維度的外觀檢測,比如手機屏幕的表面缺陷檢測,是碰傷、劃傷還是裂紋,就只能依靠人類經驗來識別了。

隨着2015年後深度學習崛起,深度學習算法作爲機器視覺領域中的主要算法,成爲工業視覺技術迭代的的一大趨勢。2018年,微億智造正是抓住了深度學習算法在工業質檢場景的落地機會而成立。

當時,常州這家“果鏈”公司的工廠每天出貨200萬件,每個質檢員每天檢測約10000片。長時間的工作往往給質檢員的眼睛帶來不可逆的損害,人員的流動性也非常高。因此,他們在市場上尋找能夠用AI質檢來替代人工的方式。微億智造團隊憑藉更高效的混合視覺算法贏得了客戶的青睞,雙方就此展開了長時間的合作。

這家“果鏈“公司也是微億智造的第一個種子客戶,微億智造爲此定下了一個小目標:先用AI技術解放這個工廠2000人的生產力。

雖然微億智造有很強的算法團隊,但產品外觀缺陷質檢需要的不僅僅是一個算法,而是一整套包含了算法與硬件設備在內的完整解決方案。爲此,微億智造需要根據產品特質與質檢需求,定製智能質檢設備,完成不同場景的開發和應用。

這套複雜的解決方案在一開始的確解決了實際問題,一臺機器最多能夠代替16個人力。

但新的需求很快接踵而至。以最常見的消費電子產品手機爲例,手機廠商每年會推出多款機型,尺寸、結構都有變化。如果產品型號要更換,生產線也需要重新切線,其中的光學設備、AI算法以及整臺機器設備,都需要重新適配。

尤其是考慮到工廠越來越多的柔性生產需求,很多工廠可能長則幾個星期,短則幾天就要更換一次產線。如果每一次切線都要重新適配質檢設備,成本將會無法控制。

在這樣折騰過幾次之後,張志琦意識到質檢的方案亟需升級迭代了。

2.當算法公司開始玩機械臂

如何解決切線的問題?

第一個思路是,與自動化設備集成商合作,讓這羣“能工巧匠”研發一款更加靈活、適應性更強的設備,能夠兼容更多的產品型號,來應對每一次切線帶來的調試過程。但是,這不僅有很大的技術挑戰,長期來看也只能是一個過渡方案。

思來想去,回到第一性原理,有什麼自動化產品既可以滿足質檢場景的檢測需求,又可以通過軟件程序來靈活控制?在與一些機器人行業交流後,微億智造團隊把目光放在了機械臂上。

機械臂已經發展了近四十年的歷史,是工廠自動化的重要一環,並且孕育了知名的工業機器人“四大家族”——ABB、庫卡、發那科、安川。然而,在工業質檢領域,卻很少用到機械臂。

在傳統3C產品或汽車行業中,機械臂被用於裝配搬運、機牀上下料等重複性強、但是運動並不複雜的場景,所以機械臂需要設定調整的點位並不多。然而,對於質檢來說,即使是最簡單的產品,各個邊角拍下來也需要數十張照片,稍微複雜一點的產品可能要拍攝數百張照片,這些點位的數量與精細度可能是汽車、3C等產品的幾十上百倍。

工廠對於生產效率有要求,如果要用機械臂,爲了在更短時間內更快完成產品各個點位的檢測,只有兩個辦法,要麼就增加機械臂的數量並行處理,要麼就提高單臺機械臂的運動速度。

那時候機械臂的價格還沒有現在這麼低,當時一臺工業機械臂可能要20萬元。增加機械臂數量意味着成本的翻倍,對於工廠而言很難接受這一方案;如果想要提高機械臂的運動速度,就需要對於機械臂的進行更精細化的運動控制,告訴機械臂什麼時候應該快,什麼時候應該慢,什麼時候飛行通過沿途點。這就需要進一步觸及機械臂底層的運控算法,但傳統的自動化設備廠商一般只會通過機械臂廠商提供的編程界面進行程序設定,而機械臂廠商也很少開放如此底層接口。

基於這兩點原因,機械臂在工業質檢領域的應用非常少。張志琦告訴「甲子光年」:“我們也是一頭跳進這個坑裡之後,才明白過來爲什麼過去沒有人用機械臂。”

爲了從定製化的陷阱走到標準化的交付,微億智造決定把這些難點一一攻克。從技術視角來看,既然質檢的難點在於機械臂自身的運動控制範圍、精度無法匹配質檢多點位的要求,那麼能不能優化這套控制體系?

微億智造想到了繞過機械臂的控制器,直接通過底層算法來精準控制機械臂的軸,形成微億智造自主可控的機械臂體系。這件事的難度在於,控制器關乎機械臂核心的運動規控的核心算法,這些都是機械臂廠商的核心技術壁壘,怎麼會輕易將核心算法對外開放呢?

張志琦半開玩笑地說:“運動控制背後的算法,都是四大家族的機密所在,不知道鎖了多少層保險箱。”

最開始爲了跨越機械臂預設的運動控制的算法限制,微億智造找了很多家機械臂廠商談算法的開放合作。經過很長時間的努力,發那科終於答應了。發那科向微億智造授權了J519實時高速通訊協議,通過微億運動規劃算法,機械臂的各軸伺服機構能夠精準、高速執行軌跡時序及IO信號觸發。

微億智造是發那科在國內最早獲得該協議授權的公司之一。張志琦表示,很少會像微億智造這樣把機械臂用到了極致的狀態。

在玩轉機械臂之後,張志琦常被問到一個問題:“微億智造到底是一家機器人公司還是AI公司?”張志琦一般會如此總結:“我們比AI公司更懂機器人,比機器人公司更懂AI。”

就這樣,微億智造的算法團隊通過對機械臂的苦心鑽研,最終解決了工業之間場景的定製化難題,進入了標準化產品的階段。

3. 從“瞎子揹着瘸子”,到具身智能

2021年,微億智造將其技術棧沉澱、總結,逐漸形成了一套比較完整的技術方法論,微億智造稱之爲“眼手腦”技術戰略。

在這套解決方案中,微億智造以視覺AI爲技術基底,跨領域融合多種技術,從感知(眼)切入場景、沉澱數據,機器人智能控制(手)、AI算法和訓練模型(腦),通過雲端靈活算力的調用,實現對質檢的統一工程化改造,以滿足工廠現場應用點上的需求。

從這一年開始,微億智造開始按照“眼手腦”的技術方向進行技術團隊研發,有的專注於機器人控制,有的專注於光學系統,有的專注於AI算法,還有的專注於數據運營等平臺化能力。

微億智造的初衷,是看到了這套技術組合從單點的工業質檢進入更廣泛的工業製造場景的機會。比如,把工業質檢的“手”(機械臂)上增加一個工具,類似磨刀,就可以用來打磨;換成用於抓取和組裝零件的機械手,就可以用來裝配。

微億智造最開始提出“眼手腦”戰略的時候,具身智能還沒有作爲一個正式的術語被工業界研究。但今天看來,“眼手腦”技術組合已經構成了具身智能的核心要素。

但是,早期的“眼手腦”彼此之間還是相對獨立的系統。舉個例子,假如把在質檢中的工件拿掉,整套設備仍然還是會按照既定的路線去執行質檢流程,只是拍出來的照片都是廢片,因爲這套系統本身是不知道檢測對象被拿走的。

張志琦告訴「甲子光年」:“當時的視覺系統好比是眼睛,機械臂的運動機構像是一個人的手和腿腳。但兩者的組合之間仍然存在隔閡,就好比是一個瞎子揹着一個瘸子,瘸子在指揮瞎子前進和後退。但一個真正的具身智能系統,不應該是這樣的,它應該是一個完整的體系,把感知、認知、規劃、驅動、控制能力相融合。只有這樣,才能真正在流程化的場景中落地。”

張志琦認爲當時的微億智造距離這樣的目標還差一點。於是,在2023年底,微億智造成立了專門的具身智能項目組,開始研發真正將感知、理解、規劃和執行能力相融合的具身智能工業機器人EIIR(Embodied Intelligent Industrial Robots,EIIR)。

一個複雜的項目需要不同部門的協同,而將不同技術部門融合成一個項目是一件非常困難的事情,因爲硬件的迭代的速度和軟件的迭代速度有很多差異,決定項目進度的往往是最短的“木板”。爲了解決團隊協同問題,微億智造不同於很多公司由CTO單獨決策技術問題,而是摸索出了技術委員會的模式,通過科學化的決策機制來綜合討論與決策。

經過近一年的研發,微億智造與國產機器人廠商捷勃特聯合推出的新一代具身智能工業機器人——“創TRON”在工博會上首次亮相。這次與捷勃特戰略級的合作比發那科的合作還要深入,直接深入到機械臂的驅動與控制層,得益於單芯片驅控一體的系統架構,控制延遲幾近於0,從而使電機性能能得到最大限度的發揮。在考慮電機速度、加速和機動率限制情況下,軌跡速度再次提升了20%。

“創TRON”專爲應對工業柔性智造場景而設計,具備抓取、放置、搬運、裝配等多種能力,能夠靈活應對各種生產需求。同時,結合不斷積累的工業現場數據及工業垂類大模型,該機器人能夠更好地理解複雜的工業環境,並快速調整動態變化的任務,有效解決了產線的靈活性和適應性問題。

以一個完整的柔性裝備流程爲例,用戶只需要進行一次裝配演示,該具身智能工業機器人就能在非常短的時間內自主理解任務並快速學會執行。

第一步是任務演示。用戶在示範區向具身智能工業機器人演示一遍裝配流程,具身智能工業機器人通過圖像、視頻對人體動作及裝配體進行精準捕捉識別。

第二步是任務學習。具身智能工業機器人結合工業垂類大模型進行流程拆解和仿真環境模擬裝配,將剛纔的示範流程像人一樣“消化學習”,這一步無需傳統示教或編程。

第三步是產品試裝。經過上一步的學習,學習區的具身智能工業機器人已經學會裝配流程並開始試裝產品。這一過程中,無序抓取精度達到1mm,雙臂動態高精度2mm,即使人員在過程中進行環境干擾,機器人可以很好地完成實時避障並繼續完成任務。在學習完成後,便可將任務實時下發給真正在產線上的執行區機器人。

第四步是量產執行。執行區的具身智能工業機器人接到任務,開始進行高速實時量產執行,並能快速實現柔性切線。

這款通用的具身智能工業機器人將在明年投入批量生產,有望開啓一個新的千億市場。

4.具身智能,何必是人形?

2024年,在微億智造埋頭研發具身智能工業機器人的同時,一股具身智能之風也已經吹遍了資本市場。無數機器人公司看到了這一新興的潛力巨大的市場,並紛紛入局。

但是,業內對於具身智能的技術路線、產品形態的看法各有不同,每個企業都在按照自己的思考去實踐。比如,具身智能是否要做成人形機器人,仍然是一個巨大的非共識。

人形機器人公司的觀點是,具身智能的終極形態就是人形機器人,因爲整個人類社會環境都是以人類爲參照物去設計與構建的,人形機器人的概念也是由此產生,它可以無縫融合到人類環境中,替代人類完成具體的任務。因此,常見的人形機器人會被設計仿人的“雙足+靈巧手”的形態。

但張志琦認爲,機器人落地在工業場景可能是一個完全不同的思路。

工業生產的設計思路是,按照SOP(Standard of Procedure)——標準化流程來培訓工人。無論是10人、20人還是30人,他們都需要以相同的方式完成同一項工作,把工作流程分割成多個部分形成生產流水線,以便更高效地銜接。可以說,工廠生產流程的設計原則,實際上是在有意削弱工人的個性。因此,如果今天有一個重複能力很強、同時也十分柔性化的機器來替代人工完成這些工作,這個機器是不是設計成“人形”其實是無所謂的。

比如,絕大多數工廠的地面環境都很平整,有階梯的情況都很少,雙足的人形機器人不一定是最優解,輪式機器人的效率反而效率更高,因爲輪式比雙足有更高的穩定性;人類只有一雙手,但機器人卻可以設計爲1隻手,或者4隻手、8隻手,來適應不同的生產節奏。

有一個企業案例可以佐證這一點,那就是波士頓動力。波士頓動力是人形機器人的鼻祖,早在2016年就發佈了人形機器人Atlas,但是Atlas在商業化落地方面進展緩慢。2021年,波士頓動力公司專門推出Stretch,一款用於在倉庫中移動箱子的新型機器人,進軍物流領域。

波士頓動力推出的物流機器人Stretch,圖片來自波士頓動力

Stretch並沒有做成雙足的人形,而是在方形移動底座上裝上了一組輪子,上面是一個巨大的擁有7個自由度的機械臂,吸盤、以及攝像頭和其他傳感器。

張志琦表示,波士頓動力的案例表明,在工業環境中,應該根據效率來選擇合適的工具,而不是憑藉它的外觀。

除了機器人的生產效率,工業場景最關注的另一大要素是成本。

當前階段,人形機器人的成本仍然是限制其大規模普及的主要因素之一。比如,波士頓動力用於特種作業的人形機器人Atlas製造成本約200萬美元;本田公司經過14年探索研發的人形機器人ASIMO,單臺價值250萬美元,在歷經多次迭代後,不得不在2022年宣佈“退役”。國內公司的人形機器人產品,單臺售價也高達幾十萬到上百萬元。

人形機器人的成本之所以高,首先是因爲它需要較高的運動能力、環境感知能力、決策能力,導致其硬件成本居高不下,比如,工業機器人往往只需要六七個自由度的關節,而人形機器人動輒就是40多個關節。其次,由於處在行業發展早期,供應鏈也不夠成熟,沒有足夠的出貨量,供應鏈成本短期內很難打下來。

英偉達CEO黃仁勳就認爲,人形機器人成爲大衆化設備的前提是售價與當前廉價汽車售價相當,A級車的價格大概就在1萬到2萬美元之間。

作爲對比,今天一臺工業機械臂的價格僅有五六萬元左右,四軸的機械臂甚至只有兩三萬元。在人形機器人將成本打下來之前,它很難在工業這一價格敏感的場景替代價格低廉的機械臂,即使機械臂的靈活性要更差。

今天,隨着微億智造具身智能工業機器人的發佈,工業場景有了一個新的選擇。具身智能工業機器人不僅成本更低,而且還能快速實現柔性切線,滿足工廠靈活多變的生產需求。

回到一年前張志琦在工廠看到的一幕。現在,微億智造有一個小小的目標,就是通過最新發布的具身智能工業機器人,讓工廠重新認識機械臂,真正將其用於更多的柔性環境,實現比以前機械臂更爲廣泛的應用價值。

2018年,微億智造曾用智能質檢設備解放了工廠2000多人的生產力。這一次,微億智造的目標是解放其十倍、百倍甚至更多倍的生產力。

(封面圖來 源:微億智造)