清華大學人工智能研究院名譽院長張鈸院士:GPT時代的人工智能產業

8月15日,在中國人工智能學會、清華人工智能研究院、中關村企業家顧問委員會、中關村100企業傢俱樂部的大力支持下,由清湛人工智能研究院發起並主辦,由盛景網聯承辦的《大模型時代,AI賦能產業升級與引領》系列論壇於北京中關村全球科創路演中心成功舉辦。

本次論壇,我們非常榮幸請到了中國科學院院士、清華大學人工智能研究院名譽院長張鈸院士,蒞臨並發表主題演講。

張鈸院士發表了中國第一篇人工智能領域的學術論文、獲得中國在人工智能領域的第一個國際重要獎項、領銜成 立國內首個智能機器人實驗室、培養了本土第一位人工智能領域博士畢業生,組建中國第一個人工智能國家重點實驗室……這些“第一”樹立了中國人工智能發展的一個個里程碑,推動中國在此領域大踏步前進。

以下爲張鈸院士分享全文,enjoy~

01

人工智能產業的發展範式

人工智能產業發展的範式跟信息產業的發展範式非常不一樣。

信息產業的發展範式是先建立理論(計算機理論、通訊理論、控制理論等),再把信息技術產業化,以計算機爲例,即計算機硬件、計算機軟件。最後把這些硬件和軟件在各行各業推廣應用,實現各行業的信息化。

信息產業之所以發展非常順利,一是因爲有理論支撐,二是因爲由信息技術產業化形成的硬件或軟件是通用的,市場非常大,可以推廣到各行各業去,因此很快就誕生了信息產業的IBM、英特爾、微軟。

但是,人工智能沒有理論,發展初期先有了兩個模型和與模型相關的算法。

第一個模型是大家非常熟悉的知識驅動模型,第二個模型是數據驅動模型。知識驅動模型必須和應用領域緊密結合,應用領域非常窄。像醫療診斷-看病,只能看病,只能看一種病,不能用來做別的。

數據驅動模型也是如此,應用的範圍必須與訓練數據有關係,訓練數據沒有涉獵的範圍就無法使用。

因此,根據這個模型和算法建立起來的硬件或軟件,一定是專用的。在人工智能領域,如果目前有人宣稱是普遍“通用”的,肯定是不靠譜的。專用性導致的後果是市場很小,廣泛推廣應用很困難。這也是迄今爲止六十多年,我們沒見到人工智能領域的IBM、英特爾和微軟出現的原因。

比如,通用智能芯片,目前不具備可行性。只有結合自動駕駛、智慧家居、智慧城市,這樣的硬件才能夠有市場。

現在,人工智能發展起來的產業,覆蓋的範圍非常寬。雖然是“專用”的,但是“專用”的都可以在各自不同的領域裡發展出來。

斯坦福大學在《一百年人工智能研究》中稱, 2015年到2030年人工智能的領域應用前八名依次是,交通、家庭/服務機器人、健康、教育、低資源羣體、安全、僱員與工作場所、娛樂。

考慮到中國的特殊情況,我把金融和智能製造加進去。今後人工智能產業從應用領域來講,分佈基本上是這樣。

02

大模型時代的人工智能產業

正是由於發展模式的不同,信息科技(包括產業)跟人工智能科技的發展非常不一樣。用四個字來形容,信息科技發展可以說是“持續高速”,而人工智能的產業或者科技發展則是“緩慢曲折”。

那麼,ChatGPT出現以後,對產業會有什麼變化?

首先從人工智能的角度來看,ChatGPT從哪些方面實現了突破。

第一個突破,從信息處理真正轉變爲人工智能處理。過去處理文本,實際上只處理了文本里所代表的信息形式。通訊也好,控制也好,計算機計算也好,都是對信息的形式加以處理,是把文本當成數據來處理的。

ChatGPT實現了一個轉變,對信息裡包含的內容進行處理。 現在,ChatGPT處理文本不再是處理數據,而是處理數據裡所表示的內容和知識。這主要是因爲文本的表示方式從符號變成了語義空間的向量。

人工智能要從信息處理的階段走向人工智能處理,對文本來講一定要從處理形式變成處理內容。這是一個重大突破,是真正進入人工智能的標誌。

第二,在人工智能領域,大家一直夢寐以求的是通用人工智能的出現。ChatGPT在聊天或者對話的領域裡實現了通用性,也就是說你跟ChatGPT聊天的時候,不受領域限制,什麼都能談。這個重大突破,讓人工智能向通用人工智能邁出關鍵一步。

值得注意的是,ChatGPT不是OpenAI通過三、四年時間做出來的,是全世界的科學家、特別是人工智能領域的科學家和工程師經過六七十年努力取得的成果。

這裡有兩個技術突破,一個就是前述所說的,花了56年時間,使得機器能夠處理文本的語義,而不限於只處理文本的形式。

第二個突破,我們經過七十多年的努力發現了一種神經網絡,也叫轉換器。它的最大特點是可以把很長的文本同時輸進去。

過去神經網絡文本的輸入是一個字一個字的輸入,導致只能考慮相鄰兩個字之間的關係,根本無法理解文本的內容。有了轉換器以後,我們可以把整個文本同時輸入,GPT-4能夠把3.2萬個TOKEN(粗略地講,相當於3萬個左右的漢字)同時輸入。

這兩個技術結合,使得它能夠對文本的內容加以處理,這是最關鍵的。

2018年,OpenAI把兩個技術結合起來,花了兩年的時間做出來GPT-3,又經過兩年時間調整,推出來ChatGPT。

ChatGPT利用大模型實現對文本的生成,我們用同樣的辦法,即如法炮製去生成圖像、語音、視頻等。這就是AIGC——人工智能生成內容。換句話說,現在對文本的處理能處理到它的內容,如果有辦法把圖像跟文本掛鉤,語音跟文本掛鉤,視頻跟文本掛鉤,那就等於計算機也可以處理圖像、語音、視頻的內容。

所以,當圖像生成的時候,輸進去一定的文本,它就可以按照文本的意思生成出相應的圖像,我們就能夠控制圖像、語音和視頻的內容。這就是AIGC的重要性,可以把多種模態集成起來。

簡言之,基礎模型的特點一是可以處理文本、圖像、語音、視頻的內容,二是具有一定的通用性,至少在文本處理、圖像處理、多模態處理具有一定的通用性,不受領域的限制。這兩點我們可以充分利用。

那麼根據這兩個技術,人類進入了GPT的時代,GPT時代的產業又會如何?

先來看基礎模型在醫療健康上的應用。我們輸入的信息不限於文本,還包括醫學圖像等等,通過大模型適應下游的任務應用。這是一個重要的模式,可以在一個模型下做很多任務,往通用化方向發展。過去只能做醫療診斷,只能看某一種病。有這個模型以後,既可以做診斷,又可以做生物醫藥,往通用化方向發展。

如果我們把應用、把某一個軟件置於大模型之上,會發現一個重要的變化就是質量提高了。

原來軟件也好,翻譯系統也好,醫療診斷系統也好,是教一個白癡去幹活。因爲計算機原來什麼知識都沒有,是空的。那麼這個軟件就有很多缺陷,會犯很多低級錯誤。

現在,我們放到基礎模型之上,相當於讓一位高中生來完成任務。因爲基礎模型有很多基礎知識,是受過通識教育的模型。這也是爲什麼現在好多人去做基礎模型的原因,把應用放上去,質量立即就會有很大的提高。

具體怎麼放呢?大體是三種方式。

第一種,在原來的通用模型基礎上經過遷移,做成垂直領域的模型。第二種,在原來的模型上加一層,去適應、去微調、去應用。

最後一種,帶上專業的知識庫、專業的檢索系統等直接應用,包括緊耦合,鬆耦合和直接應用。

03

允許ChatGPT犯錯誤 開放治理同行

大模型畢竟是語言模型,是個軟件。具體要幹活肯定需要有個執行機構,因此提出了通用機器人的想法,也叫作具身智能——具有身體的智能(Embedded Intelligence, Intelligence with body)。原來的Intelligence,只有腦袋,沒有身體,具體的活幹不了,所以現在要with Body。

具身智能有兩個問題需要解決,這也是基礎模型目前還解決不好的。

第一,環境的多模態感知。沒有反饋就幹不了活,所以必須有反饋。但是多模態感知如何跟基礎模型結合?還有很多研究要做。

第二,通用硬件。做一個萬能的通用硬件可能是一條路,但肯定不會是唯一的路。我認爲,將來的發展方向是要有一定範圍的通用性,做一個完全通用、到處都能用、什麼活都能幹的機器人,重活輕活都由一樣的機器來做,性價比並不合適。

ChatGPT並不能解決人工智能裡所有的問題,特別是面對不確定性、多變、關鍵、複雜環境的問題。

而且,ChatGPT的優勢是一種輸入,多種輸出。有創新性的可能,必然也會帶來犯錯誤的可能性。但是既然給了它創新的可能性,讓它去暢想,那麼就應該允許它有錯誤。

因此,在做任何人工智能產業的時候,特別是利用ChatGPT這樣帶有一定通用性人工智能模型的時候,一定會帶來第二個問題——治理。

治理包含兩個方面,一是對模型本身的治理,一是對人類自己的治理。這裡我們主要談對模型本身的治理。

我們希望人工智能能生成的各種各樣的內容,包括文本、語音、圖像、視頻,符合道德標準、倫理標準和政治標準。但是它一定會輸出不符合道德標準、倫理標準、政治標準的內容,這是我們希望它輸出多樣性所必然會帶來的結果。

我們希望它有創造性,就必須允許它有錯誤。如果不允許它犯任何錯誤,它就沒有任何創新,也就沒有任何用處。

因此,對AIGC,開放跟治理必須同時進行,不能治理完再開放,或者開放後再治理。只有邊開放邊治理,才能夠更新地更快。

大家已經看到我們跟國外的差距。雖然中國現在做的系統和GPT-3比實際上差距不大,但跟GPT-4比差距就很大了。

GPT-3到GPT-4只花了幾個月的時間,我們就跟不上了。一個本質的問題在於人家是邊開放邊治理,這一點值得我們學習。

治理的辦法,現在看起來我們掌握地不好,因爲我們經驗少。其實治理就是靠後臺,靠人類來做對齊處理。現在很多人有一個誤解,認爲做標註的人不用高水平。這是錯誤的觀點。做標註的人水平要求很高,因爲用什麼樣的問題做標註,是個大問題。OpenAI公司招募了40多個人,經過嚴格考試合格後,才能勝任標註的工作 。

這方面我們有所忽視,跟國際有差距。我認爲,如果這個問題不解決,也會妨礙大模型的建設。

總結來講,我認爲大模型會給人工智能產業可能帶來的變化,有四個方面:產品質量的提高、產業向領域通用性邁出一步、由單任務向多任務方向發展、發展與治理同時並進。