☰

黃鐵軍：做全球頂尖的AI研發機構丨AI·20人

經濟觀察報記者任曉寧北京報道

OpenAI創始人山姆·奧特曼出現在大屏幕上，當他回答“我準備好了”時，全場都沸騰了。

這是6月10日 “AI春晚”北京智源大會上的一幕，那是山姆·奧特曼首次亮相中國。那個夏天，所有人都在爲AI即將改變世界而興奮。

在那一天，一衆全球知名的AI科學家，比如圖靈獎得主、Meta首席AI科學家楊立昆、深度學習之父傑弗裡·辛頓等，全部出現在大會上。楊立昆因爲總統會見不能來京，堅持半夜4點起牀，只爲和中國觀衆實時交流。

北京智源人工智能研究院（以下簡稱“智源研究院”）院長黃鐵軍當時坐在臺下，這些大咖很多由他邀請而來。在大衆層面，知道黃鐵軍和他身後的智源研究院的人並不多，但在全球AI圈，他是一個響噹噹的人物；這個成立於2018年的研究院，早已在AI圈聲名遠播。

黃鐵軍研究AI超過30年，擅長智能視覺信息處理技術，對我國數字視頻編碼國家標準制定和大規模產業化做出過突出貢獻，終結了國外向我國視頻行業索取高額專利費的歷史。他與國外AI大咖們私交甚篤，楊立昆的個人自傳《科學之路》中文版，也邀請黃鐵軍寫了序言。

近30年時間裡，黃鐵軍的身份是科學家、北大教授，現在，智源研究院是他花費精力最多的地方。今年4月，微軟總裁布拉德·史密斯接受外媒採訪時說，他認爲有全球三家機構處於AI絕對的前沿，一是與微軟合作的Open AI，二是谷歌，另一個就是北京智源人工智能研究院。

今年大火的大模型，智源研究院早在2019年開始佈局。2020年，在大多數人對大模型還一無所知的時候，黃鐵軍掌舵的智源，將主要精力和資金放在研發大模型上，並在2021年上半年推出了開創“中國首個”、“世界最大”的大模型悟道1.0和悟道2.0。

“很多說中國大模型熱，是因爲ChatGPT火了之後才爆發的，其實並非如此。早在ChatGPT出現之前一年半，我們就已經開始系統化佈局。那邊爆發的時候，這邊的艦隊已經起航。”8月28日，黃鐵軍對經濟觀察報記者說。

目前，智源已經培養了一批大模型人才，當前大模型創業公司、大廠，從事研發的CTO或首席科學家中，甚至是創始人本人，參加過悟道項目的人爲數不少，智源也因此被人稱爲大模型“黃埔軍校”。對於人才被挖角，黃鐵軍並不排斥，“肉都在一個鍋裡”，“只要他們還在這個行業，還在爲大模型發揮作用，都是可以的”。他覺得，智源作爲非營利機構，能爲行業培養人才，就是促進AI生態發展的有意義的事。

闖過無人區

智源人工智能研究院在2020年選擇做大模型時，國內鮮有機構或公司從事這項研究，這彷彿就是一個無人區，智源一腳踏入，並不是偶然。

8月29日，北京五道口智源大廈5層，黃鐵軍向記者講述了這段往事。

故事的開始其實比2020年還要更早一些，2018年11月，智源人工智能研究院成立，由科技部和北京市共同支持，聯合北京人工智能領域優勢單位共建。黃鐵軍擔任首任院長。

他本人非常樂意做這件事。當時他的職務是北京大學計算機科學技術系主任，從2015年開始全程參與我國新一代人工智能發展規劃建議、起草和實施。他願意來智源的原因是，這裡與企業、學校都不一樣，是一種世界範圍內都很新的新型研究機構，在這裡，可以更高效的探索AI。

擔任院長頭兩年，黃鐵軍在智源的工作重心是凝練方向，“智源學者計劃”匯聚了中國頂尖人工智能學者，開啓了“自由探索+目標導向”科研機制探索。2020年，智源研究院決定把大模型作爲攻堅目標，70%的預算投入到大模型研發和大模型基礎軟硬件生態建設。當年3月，黃鐵軍在悟道1.0發佈會上提出，“人工智能正在從‘大煉模型’到‘煉大模型’的新階段”，這是“大模型”這個概念首次登上歷史舞臺。

黃鐵軍告訴記者，做研究久了，會有一種直覺式的預感。而且，大模型這個方向，雖然外界很少有認知，但在AI科研圈已經有一個比較清晰的趨勢判斷，即：大模型將成爲AI未來平臺的起點。

從有想法到最終落實，並不容易。2020年10月，黃鐵軍在一次會議上與時任北京市市長陳吉寧彙報中提到，智源計劃集中資源開展大模型研究。陳市長當機立斷，明確提出大模型會是人工智能的下一個核爆點。

智源投入幾乎全部科研力量。研發進展很快，第二年，2021年3月，“悟道1.0”大模型項目問世，2021年6月，間隔3個月後，“悟道2.0”亮相。當時的“悟道2.0”，創造了“世界最大”紀錄，達到1.75萬億參數；是GPT-3採用的1750億參數量的10倍，也超過了谷歌發佈的Switch Transformer（1.6萬億參數量）。

“悟道2.0”面世後，繼續突破需要更多的算力和資源。然而，當時正值AI低谷期，前一代AI四小龍備受質疑，新一代AI公司融資無門，即使智源，也資源受限。

2023年8月，記者問他，如果當時繼續做“悟道3.0”“悟道4.0”，會不會推出ChatGPT的就是智源，而不是OpenAI？會不會覺得可惜。

他也覺得有點兒可惜，不過他想的很透徹：即使繼續做，後來能引發全球爆火的，依舊會是OpenAI，因爲雙方投入的資源完全不是一個量級，而大模型這個方向，缺乏算力資源，無異於紙上談兵。

“2022年下半年，我們的算力資源在國內已經是領先的了，但不足OpenAI的十分之一。如果只差一兩倍，我們還有可能領先，如果差10倍以上還想領先，可能性就很小了。”

AI黃埔軍校

今年2月，王慧文成立光年之外，廣發英雄帖，之後大模型公司風起雲涌。現在回顧會發現，大模型創業公司的技術帶頭人，很多來自智源。

智譜AI創始人唐傑曾擔任過智源人工智能研究院副院長，目前智譜AI被美團投資，與360合作；即將完成10億元融資的月之暗面創始人楊植麟，也參與過悟道的研發。除了創業公司，字節跳動等互聯網大廠的大模型帶隊者，也或多或少參與過智源項目。

一些國家項目的技術骨幹，也同樣來自智源。有些智源學者參與國家項目做研發，也會把算法結果放到智源的開源論壇中，供所有研究者共同探討，黃鐵軍告訴記者，他對此覺得很欣慰。

擔任智源研究院院長前，黃鐵軍當了十幾年北大老師，習慣了教書育人。現在，他依舊把發掘人才作爲基本工作。

黃鐵軍本人其實是一個“天馬行空”的科學家，記者問他，從業AI這麼多年，有沒有最得意的二三事？他並沒有把十多年前確立的標準和專利積累當做值得講述的事，反而覺得，2015年的一天，他突然靈光一現，豁然開朗，推翻了圖像視頻概念，推翻了計算機視覺的基本範式，當然也推翻了自己此前20多年的研究，開創了脈衝視覺原理和技術新體系，一切從零再出發，是更有意思的事。

“我個人的看法是，重大創新一定是首先在一個人腦子裡出現，否則它就不會發生。”他和年輕學者們交流，也更熱衷於談論天馬行動的想象，即使當下不可能發生，但未來，有可能突然有一天就能實現了。擔任院長後事務繁瑣，黃鐵軍不再有精力一行一行敲代碼，和年輕學者一起腦暴，培養、發掘年輕人，是他最開心的事情之一。

從成功率上講，未知的想象有很大風險，但是一旦成功，影響會是巨大的。

2018年，智源成立之初，就定下目標：支持科學家勇闖AI科技前沿“無人區”。他們給智源學者提供經費，希望支持學者們自由探索，挖掘面向未來的AI研究方向。

2023年，智源曾經耗費絕大部分資源和精力投入的大模型方向，已經從“無人”變得熱鬧非凡，但也意味着更多未解之謎，有更多需要探索的新無人區。黃鐵軍說，智源要與企業錯位發展，開展更冒險、更開放、更前瞻、更創新地的工作，這是智源作爲研究機構應該做的事。

5年時間，智源已經嶄露頭角，現在，黃鐵軍提到，更重要是實現當年立下的十年目標：2028年智源研究院成爲全世界公認的頂尖人工智能研發機構。

他還在繼續證明自己。

黃鐵軍（受訪者供圖）

【對話】

艦隊啓航

我們既不以論文爲最終的評價指標，也不以產品作爲評價指標；我們想做的，是一個創新性強、性能領先的系統，建立一套技術體系，一個技術生態。

經濟觀察報：如何定位智源？

黃鐵軍：智源的性質是介於大學和企業之間的一種新型研發機構。我們既不以論文爲最終的評價指標，也不以產品作爲評價指標，而是要做有創新性的系統。這種機構在國外也是很新的形態。從我個人來說，我2015年就開始參與我國新一代人工智能發展規劃，這種科技創新組織方式的改革，是這幾年國家很關注的一個方向，我願意到智源來做這樣的嘗試。

原有體制下開展AI研究，大學受制於資源有限，企業受制於產品收入壓力，都約束了創新突破的可能性。智源這種機構有探索出新可能性的很大機會，這是吸引我的最重要的原因。

經濟觀察報：智源是國內第一個提出大模型概念的機構，也早在2020年就投入大部分資源做大模型。爲什麼是智源？

黃鐵軍：其實早在2018年、智源研究院成立時，我們從科研的角度對於AI已經看到一個比較清晰的趨勢，大模型已經是一個比較明確的方向了。當時大模型還不叫大模型，我們看到的方向是：用大數據訓練一個規模很大的模型，有望產生更強的智能。

2020年10月份，我們和時任北京市市長陳吉寧彙報中提到，智源計劃集中資源開展大模型研究。陳市長當機立斷，明確提出大模型會是人工智能的下一個核爆點。我們就開始買算力做事，當時買到了300P的算力，但是300P肯定是遠遠不夠的，就申請再追加單獨的經費來做更大的算力。最後定下的是1000P的算力，大約是3億元人民幣的一個專項支出。這種規模的智算平臺在當時中國是絕對領先的。

經濟觀察報：智源2021年6月就推出了兩個大模型產品，直到2023年6月，才又推出了悟道3.0。中間爲何間隔這麼久？

黃鐵軍：悟道2.0推出後，我們中間發生了一個重大的變化。當時從我們科研角度來看，新的AI時代已經開始了，雖然那時候沒有多少人相信，但在我們這些人眼中，門已經打開了。

我們於是開始考慮，既然它是一個時代的事，就絕對不會是智源一家機構在做，它應該是一個全社會、全世界的事情。

當時我們的分歧點是，繼續做一個悟道3.0版，把它做得更大更強？還是在全國範圍內進行佈局，讓不僅是北京中關村地區，而是全中國範圍都可以做這件事？最終我們選擇了後者，在國家新一代人工智能重大科技項目中提出了一個旗艦項目建議，從國家的科技佈局角度，做系統化的佈局和支持。

國家項目立項是需要時間的。從2021年6月份提出建議，到2022年12月份項目批准，花了一年半時間，在傳統項目體制下已經是特別快了。這個旗艦項目2023年1月開始執行，計劃通過滾動方式，一直持續到2030年，目標不是把一個模型做多大，或者性能做多高，而是要通過數據共建、算法競爭、開放評測、開源協同的創新機制，建立一套大模型開源開放技術體系，一個支撐大模型持續發展的技術生態。

所以，很多時候大家說中國大模型熱是因爲ChatGPT火了之後才爆發的，並非如此，早在ChatGPT出現之前一年半，我國就已經開始系統佈局，那邊爆發的時候，這邊艦隊已經起航。

AI新時代

新技術變革如果發生在中國，大家當然會更高興，沒首先爆發在中國，也不意味着我們就失去了機會。

經濟觀察報：會不會覺得遺憾？比如說，如果去年6月你們就發了悟道3.0，說不定年底的時候火的就不是ChatGPT，而是你們？

黃鐵軍：即使我當時發佈了，也不一定會火。這與大模型的屬性是有密切關係的。

大模型的數據量與投入直接相關，我們的算力、數據投入都與OpenAI差的很遠。而且差的不是一點半點，我們是1000P的算力，不到2000塊卡，ChatGPT大概是3萬塊卡，它是你15倍的算力，迭代速度會快很多。

科技體制改革的不容易就體現在這裡，我們能調動的資源是幾億元人民幣的體量，OpenAI是用10億美元、100億美元力量在做。如果只差一兩倍，我們就有可能領先，如果差10倍以上你還想領先，這種事可能性就很小了。

但是反過來說，我們也不必糾結一城一池的得失。新技術變革如果發生在中國，大家當然會更高興，沒首先爆發在中國，也不意味着我們就失去了機會。

所以一方面確實是有點兒可惜，但另一方面，我們也不會被打亂節奏，我們從2021年想做的就是建立一個體系，希望在技術體系上保持在前沿的位置，做一個讓大家一起參與的旗艦項目，讓所有人都能發揮自己的聰明才智，共同塑造AI新時代。

經濟觀察報：現在悟道已經推出3.0了，也已經開源了，接下來你們還想做什麼？還有哪些可做的事情嗎？

黃鐵軍：我們作爲一個科研機構，和企業和高校所做的事不一樣，我們會做更前瞻的一些探索。僅就大模型來說，現在是剛剛揭開大幕，可做的東西非常多。

打個比方，大模型在當下，就相當於法拉第轉動電磁線圈，能夠產生電流了。發電機剛面世，能產生電流，大家很興奮，但是如何讓電流在全社會流通和應用，還有大量的創新性探索要做。

比如在大模型領域，有沒有一種技術手段，能讓現在訓練的成本降低一個數量級？這種風險很大的創新，是我們應該做的。還有在理論領域，爲什麼大模型能這麼強？尋找這種理論上的解釋，也是我們應該做的。另外會不會有一些架構上的創新，能把一些新技術要素結合在一起，訓練出更高水平的智能？甚至再往大了說，會不會有顛覆大模型的創新出現？這些探索我們也應該嘗試。我們要比企業更冒險、更開放、更前瞻、更創新地做一些工作。

挑戰與想象

在20年之後，AGI有很大可能實現。那時信息表達和流轉的方式，神經元和神經網絡結構及信號加工機理，都會有巨大變革，這些變革預計會在2045年之前會出現

經濟觀察報：您曾在2015年時預判2045年會有AI超級大腦出現，經過幾年探索後，您的想法變化了嗎？這個時間點會提前或延後嗎？

黃鐵軍：現在的想法會比2015年更樂觀一些，因爲經過近10年的進展，發現AI比原來預想的進展更快了。

現在有些人認爲，再過2至5年就能實現AGI（通用人工智能），我覺得可能還得再等20年。因爲真正的實現AGI，和只在某些方面實現AGI，是有本質區別的。

真正的AGI一定是有自主意識的，人類擁有的智能它全部具備，而且它一定會從多個維度全面超越人類，說的通俗點就是超人，比你在科幻電影裡看到的那種超人還要超人。它不一定以實體方式出現，可能不一定是我們目前能想象到的形態，但它肯定會有物理載體。

經濟觀察報：這些挑戰具體是什麼？我們能解決嗎？

黃鐵軍：做了30多年AI，我一直說AI首先是一門技術，我們要尋找一種可行的技術途徑和方法，再通過工程方法把智能做出來，這裡面有很多不確定因素。

在技術這條路上，突破偶爾會發生，絕大多數時間是在黑暗中探索，這是常態。像我自己，一二十年反反覆覆這種狀態，沒有大突破，這是很正常的，一點都不奇怪。

但沒有重大進展並不意味着人不聰明、不努力，只是因爲重大突破沒有標準答案，沒有一個規律性的路徑讓你照着做。

然而，正是因爲“面壁十年”，破壁而出、豁然開朗才彌足珍貴，一次突破，足慰平生。2015年我發明脈衝攝影原理時就是這樣的感覺。這個原理顛覆了1839年發明的曝光成像原理，把普通光電傳感器“點石成金”，賦予AI一雙追光逐電的慧眼。

AlphaGo表明AI決策能力可以超越人類，大模型正在塑造的則是AGI無所不知的認知大腦。未來10年到20年，這樣的創新還會紛沓至來，信息表達和流轉的方式，神經元和神經網絡結構及信號加工機理，將會發生巨大變革，未來的AI將採用類似生物大腦的脈衝神經網絡系。我現在仍然認爲，2045年左右，將出現真正的AGI。

在此之前，人類社會將享受20年的科技革命紅利，同時也將積累從未面對的巨大風險。現在就應該投入充足資源開展風險研究，並開發相應的技術支持工具。

任曉寧經濟觀察報記者

TMT新聞部資深記者關注並報道TMT（科技、傳媒、通信）領域重大事件，擅長行業分析、深度報道。聯繫郵箱：renxiaoning@eeo.com.cn微信號：tangtangxiaomo

黃鐵軍：做全球頂尖的AI研發機構丨AI·20人

相關資訊