王田苗黃鐵軍巔峰對話:AI+具身智能,產業未來將走向何處

11月25日,由創業黑馬主辦的“第15屆創業家年會”在北京舉辦,年會主題爲“AI給世界一個確定性”。

會上,北京大學信息科學技術學院教授、北京智源人工智能研究院院長黃鐵軍和北航機器人所名譽所長、中關村智友研究院院長王田苗就《AI+具身智能,重塑產業未來新格局》這一前沿話題,進行巔峰對話。

黃鐵軍在對話中表示,以大模型爲代表的時代是確定的,企業要在產業生態中找到自己的位置。他認爲:“這麼多企業在創造一個智力時代,就像今天電力時代一樣,電力系統背後有千千萬萬的企業,大型智力時代背後也有千千萬萬的企業。”

王田苗在對話中表示,AI賦能製造產業有很多突破,但核心技術上還有很長的路。他認爲:“‘機器換人’是一個不可替代的趨勢,對人形機器人需要理性看待,要更多關注於核心技術突破。”

以下爲創業家&i黑馬編輯過的對話節選:

王田苗:感謝創業黑馬的邀請,今天有機會能跟北大科學家黃鐵軍進行對話學習。我簡要介紹一下鐵軍,他在人工智能方面設計發明了脈衝視覺,目前該技術正應用於人工智能感知大模型。而且他和宏江(張宏江 北京智源人工智能研究院理事長)老師創立了北京智源人工智能研究院,被譽爲中國AI大模型的“黃埔軍校”。

黃鐵軍:謝謝王老師,過獎。我和王老師是多年的好朋友,今天很高興一起討論AI具身智能話題。邀請我的話,我覺得特別合適,我做AI,王老師做機器人,我們倆加在一起,就是智能的未來。

王田苗:最近科技圈在講“AI宮鬥”,其背後的原因是什麼?

黃鐵軍:確實關注度非常高,我的看法很清晰,這就是一個AI風險和AI紅利之間的爭論。從科學家研究者角度來說,AI確實到了一個危險的邊緣,通用人工智能有兩種理解,一種叫GAI(通用人工智能,即具有通用性的人工智能),一個叫AGI(人工通用智能,即全面超越人類的超級人工智能),這兩者有着根本不同。通用人工智能希望能賦能千行百業,帶來巨大的商業利益。AGI是全面超越人類智商,這件事不能隨便追求。這次鬥爭,就是從“通用智能商業加速”和“AGI要來了,對人類造成顛覆性、毀滅性影響的擔心” 兩種觀念的交鋒。

王田苗:這次OpenAI它的首席科學家Ilya Sutskever與創始人Altman之間的“鬥爭”,能不能理解爲創新型企業發展到一定程度,會自然上升到企業發展的哲學層面來思考,比如創立這家企業的哲學理念是什麼,這其中有聯繫嗎?

黃鐵軍:確實是。當然我們在商言商,企業是社會的一部分、是人類的一部分、是未來的一部分。哲學和商業因素都要考慮,尤其是AI發展這麼快的情況下,商業利益和風險要同時重視。

王田苗:一般來說大模型該怎麼定義?或者說參數到達多少才能稱之爲大模型?現在統計中國有200多個大模型,美國有60多個,請給我們科普一下。

黃鐵軍:這個沒有絕對的數字,一般認爲幾百億,比如五六百億之後就是具有涌現能力的新階段,我們稱作大模型。

王田苗:達到500億以上的中國大模型,有多少家呢?

黃鐵軍:我們測試了一部分,也不全面,能做到千億參數不會超過10家。

王田苗:美國呢?

黃鐵軍:美國比我們少,美國的集中度要高,幾千億、上萬億參數的大模型,有三四家。

王田苗:從AI基礎性大模型再跑三五年,您覺得中國這10家都會存活嗎?

黃鐵軍:我2021年就說過,全部存活不太可能。基礎性大模型企業全球就三五家,中國2家--3家就不得了了。

王田苗:按你所說從200家存活到50家,50家到10家,10家到3家,假如要你給中國大模型的企業家兩個最重要的忠告,讓他們跑贏這種競賽,會是什麼?

黃鐵軍:首先這不是說哪兩家活下來,哪兩家成功,別人就失敗了,不是這個邏輯。這麼多企業在創造一個智力時代,就像今天電力時代一樣,電力系統背後有千千萬萬的企業,大型智力時代背後也有千千萬萬的企業,只是說像“國家電網”這種公司不會有很多家,而不是說這個產業鏈上的企業不會有很多家。現在是百模大戰,我相信大部分企業都會在未來的生態中找到自己的恰當位置,只不過不是“國家電網”。

王田苗:你的意思是說,最後會分化,在一個生態鏈上,找到自己的恰當位置。

黃鐵軍:是的。

王田苗:假如創業者的初衷還是希望成爲“國家電網”,你能給我們想成爲基礎型大模型“國家電網”的建議嗎?

黃鐵軍:還在形成過程中,今天講的大模型都是造發電機,“國家電網”還沒有出現。我們要跳出商業角度看這個問題,自古以來,鹽、鐵、水、電,以及未來的智力,都是公共資源和社會基礎性服務,不會讓一家企業壟斷謀取超額利益。這次OpenAI+微軟試圖想佔據這個位置,但這會帶來很多問題,所有行業大大小小的企業把數據交一個企業去壟斷,讓它獲取利益,已經不是一個純粹的商業問題。

王田苗:AI革命讓我們經常睡不着覺。我聽說,誰能把握客戶的流量,誰就擁有了第一張入場券。第二,誰能跟算力公司形成戰略合作伙伴,這是第二個入場券。第三,深刻理解國家政策,拿到合規資源,這是第三個入場券。第四是商業運營,用AI能打透某一個高頻場景,獲得現金流,這是第四個入場券。你同意這種觀點嗎?

黃鐵軍:王老師說得很清楚,這些入場券都是提高自己競爭能力和佔據更好地位的重要臺階,但這些都不一定是決定未來產業生態的因素。即便這些入場券你都拿到了,你也不一定能成爲AI的產業頭部。

王田苗:明白,所以這裡有很多的不確定性。

黃鐵軍:有很多不確定性,但最確定的是,以大模型爲代表的時代一定會到來。未來十年紅利期和經濟社會的大幅提升,這是最確定的。這就像互聯網一定會對社會產生影響力,重要的是,你要在裡面找到自己恰當的位置。

王田苗:我是做機器人的,偏重於製造,對通用AI基礎大模型,我夠不上,但我很關心垂直大模型。我的問題是,像李院士(中國工程院院士、前華中科技大學校長李培根,下同)講的AI爲智能製造帶來了革命性變化,就你理解AI在工業界,垂直大模型在哪幾個環節需要我們發力,給我們做製造的人一些建議?

黃鐵軍:今天講的基礎大模型和垂類大模型,基礎大模型是個基礎設施,肯定是存在的。垂類大模型會發生很大的變化,如果基礎大模型足夠強,垂類大模型是不是一個產業形態,都要進行思考。我也想請教王老師,王老師做機器人,確定的一定是有很多實體、具有智能的機器人,比如自動駕駛,這個會大量體現。今年特別火的詞是“具身智能”,您怎麼看待“具身智能”和機器人之間的關係?

王田苗:具身智能先從狹義理解,Embodied AI,就像具有智能行爲的Agent,廣義理解爲Embedded AI或Internet AI。所以說具身智能好像AI完成了大模型以後,能夠作爲一個工具幫助人,或者能夠作爲人代理使用工具,改變世界,這可能就是通用機器人,人們自然而然就對具身智能和未來的發展產生了特別大的興趣。

黃鐵軍:大家夢想機器人進入家庭,進入工廠和製造業,已經有四五十年了,爲什麼今天就可能了呢?故事講了30-50年沒講成,爲什麼今天有可能了呢?

王田苗:現在全球機器人的規模在600-1000億美元,中國正好在1000-1500億人民幣。爲什麼最近這麼火呢?主要有三個原因:

第一是機器人未來人機交互十分重要,所以腦機接口、軟體操作靈巧手和可穿戴式人工肌肉、人工皮膚等,這讓人們感覺機器人未來的交互可能會帶來革命性變化。

第二個原因就是人工智能,特別是機器學習與大模型。機器人分大腦與小腦,大腦是推理、認知和分析,這塊大模型即將做到了,這對機器人來說是革命性的。但機器人又是在一個特定任務、高速、高精度、高效操作或移動環境中,必須有一個小腦。小腦需要平衡、速度、精準控制,而且容錯率要非常低,不像咱倆對話,我說錯了,它可以允許,但機器人操作往往是不允許的。小腦不僅需要人工智能還需要基於感知的智能控制。

第三原因是馬斯克說,特斯拉要在5年以內,把現在的人形機器人從100萬到200萬美元的成本降到2萬美元成本。2萬美元的成本,讓人感覺只要量大,只要讓電機、電控、電池、減速器、傳感器等核心部件實現批量生產,加上大腦、小腦的突破,具身智能的時代就要到了。

黃鐵軍:第一,爲什麼非要做成人形?第二,你爲什麼相信人形機器人的聰明程度,可以進入家庭代替一些家務工作,這個靠譜嗎?

王田苗:這個問題很尖銳,從技術和社會商業兩個層面來看。先說技術,以人形爲代表的平臺去探索材料、認知、推理、控制、操作、運動以及帶動相關的製造,是具有重要的意義。正因爲有這個重要意義,所以國家把它作爲未來戰略性產業來培育,這是我的理解。

第二個是商業。從目前來看,人形機器人在許多效率方面,並不一定合適,比如充電維護方面,很多環境用到通用機器人,2-3個小時就要充一次電,因爲機器人站着不動就要耗電,更何況還有高速或靈巧的動作;另外在很多事情上,機器人很難像人一樣,需要大量工程師的安全維護,這是商業化需要去考量的問題。

但AI帶來了一個機會,就是通過人機交互,來提醒機器人做什麼。這樣的話,在非實時性、非結構化環境下,會讓機器人按照人的意圖去完成人不願或危險的任務,比如在傳染病環境中作業,比如核工業危險物品的搬運和操作等,這些痛點往往需要機器人。

另外,我們的世界、我們的工具、我們的工作與生活環境,一切都是爲人設計的。自然人們想象人形機器人在這個環境下替代人,就有它的意義和價值。

我還想再補充兩點。第一點,做機器人科學家與工程師還在加班加點熬夜攻克核心技術難題,但是資本市場好像有點過熱,有點泡沫。也就是人形機器人還沒有成功研製落地應用,還沒有在產業化驗證,還有成本、效率、安全等等卡點,可是二級市場對具有人形機器人概念上市企業或核心部件企業,它們股價卻已經上來了。另外人形機器人在一定程度上會涉及到倫理,比如我想讓人形機器人到家裡陪護、聊天、生活,這在倫理上還有爭論。

黃鐵軍:我不做機器人,我有點不同意你說的資本市場有泡沫。現在的人形機器人要加大投入,而且咱倆加在一起,這件事就佐證了這點。AI實際上是爲機器人裝一個大腦,提高它的認知能力。大模型已經對家裡各個物件的物理性質、危不危險、杯子抓得緊一點還是鬆一點、液體不能倒在地上等有了認知,機器人裝上大模型以後,就會解決之前多年不能解決的問題。當然機器人的身體是必不可少的,所以往機器人關鍵部件去投入,是沒問題的,當然也不作爲投資依據,我認爲這是一個很好的時機。身體做好了,現在大腦也快準備好了,加在一起,機器人真的能進入千家萬戶。

王田苗:你的觀點我非常認同,機器人在中國正在以20%-25%的複合增長率加速發展,全世界增速是8%-12%。所以“機器換人”是一個不可替代的趨勢,只是對人形機器人的發展要更加理性,要更多關注於核心技術突破。我是指人形機器人在有些地方,想象得過於樂觀。跟現實的人,無論從情感溫度、靈巧、安全性來說,還是有相當的距離。我把它看成未來前沿技術和產業的重要方向。

黃鐵軍:我也理解,因爲做AI的人站着說話不腰疼,只要有數據就能訓練。真要做身體,真不容易,所以難題交給王老師們,做硬件、做高精度傳感器、做電機驅動......

王田苗:說到AI對機器人的變革,我最近也看了很多AI文章,也聽了李院士對AI在製造業變革的報告,有一些思考。

我們把製造業分成三段,第一段稱爲設計端,第二段是規劃和操作端,第三段是物流和客戶端。我發現AI在產品規劃、設計端、仿真端,它的貢獻率將超過30%以上,在物流和客戶服務端,也會超過了30%。在車間規劃端和協調資源端,貢獻率大概是25%。而對我們的機器人在焊接、拋光、上下料、噴塗等,這個方面的貢獻率是百分之十幾。

爲什麼在高速、高精度的操作端貢獻沒有這麼高呢?

我個人覺得李院士的報告非常深刻。機器人操作,有一定的挑戰,這裡面主要有三個問題。一個問題是,它要求容錯率非常低。第二,實時性要求特別高。有時候一個動作要在10毫秒或20毫秒有反應,如果把算力放在雲上,都對實時性提出了更高的要求。

李院士說非結構化環境裡增加視覺3D建模,這會比過去,只有工程師才能編程的拋光打磨,效率提高了5-10倍,也就是過去需要3天到4天的工作量,比如說換一個輪轂,之前的工作任務是拋光、打磨,是固定化的。如果換一個不同車型,通過人工智能和3D實時視覺識別,它能夠由3-5天變成半小時-1小時,極大提高了效率。

黃鐵軍:這確實是我們應該做的,就是AI跟製造過程、生產過程、產業過程緊密結合。我現在真的很擔心,如果AI大模型更大、認知能力更強,會帶來巨大的風險。大家開玩笑,之前希望機器人端茶送水掃地,現在它吟詩作賦繪畫了。如果衝着提高認知這個方向,讓它的數學能力、推理能力、對金融市場的操控能力、對國家決策支持能力這個方向走,真的會很危險。不如好好去做些實實在在的工作,到工廠去提高效率、提高質量,到家庭去做家務、照顧老人,這確實是應該做的,基於中國有這麼一個巨大的產業基礎,應該去推進。

王田苗:最後一個問題,創業從對社會的價值貢獻和成功率角度來理解,你覺得學院派(來自於研究院、高校)和企業派,甚至是投資派,這幾個角色之間,誰領導誰更有效?

黃鐵軍:這個問題王老師更有經驗,我自己的感受,還是各自發揮所長。比如在美國,有大家都知道的政策或實踐經驗,就是學院派做好學院派的事,產業派做好產業派的事,分工合作。在中國的環境裡,當然還在發展過程中,就是有點完全商業主導。當然最終要商業主導,但把研究人員和科學家變成精明的商人,這是不現實的。我期望讓他們發揮好作用,但今天還不容易做到。

王田苗:我非常認同,如果認爲這個時代對某些行業變化太快,需要很多資源,往往一定是商業主導,成功率大,比如電商裡的亞馬遜,因爲要整合很多資源,而且變化很快。第二,對於硬科技商業化,往往需要長時間,基本上是要有工程師或高管組合專注打磨,這方面企業高管出來創業,成功率大。而科學家要不然做好橋樑作用,要不然做細分賽道,比如新材料、新試劑、核心算法等,這些重要依賴於科技的成果,原因是在實驗室完成的東西,直接進入到社會工業界比較短,不需要中間的採購、商業資源整合等等環節,成功率比較大。

黃鐵軍:王老師說得對。不同產業界的情況不太一樣。因爲中國科技這麼多年的發展,真的是不同於以前了。以前電商做商業模式創新可以很成功,但今天確實要競爭創新,AI時代、機器人、具身智能,創新是特別核心的要素。而且中國的大學、研究機構積累了很多創新,甚至是國際頂尖創新,但這些創新的轉化率還不高。我從學校、從科研機構來講,期望投資界能更多關注這些點。這些點可能不是那麼成熟,但它是企業長期發展的核心競爭力,我們要有硬科技,要有核心競爭力,這是將來在國際上長期立得住的重要支撐。期望投資界和產業界支持,特別感謝!

王田苗:我聽懂了,在硬科技時代,科技創新與產業需要科學家和工程師積極參與,有責任、有期待、有使命,只是還要思考怎麼和社會更好地合作。謝謝黃老師,謝謝大家!