AI史上的第一個成功的商業產品是怎樣誕生的?
參考文獻:(上下滑動可瀏覽)
4.18
知識分子
The Intellectual
圖源:pixabay
撰文丨張天蓉
2024年初,自然雜誌公佈了2024年重要的七項科技,其中一項是“蛋白質序列的深度學習模型”。這起源於近來幾年谷歌公司旗下DeepMind的AlphaFold在識別蛋白質結構方面的重大進展,也例證了人工智能在解決複雜科學問題方面的傑出能力。
儘管AlphaFold識別蛋白質使用的是深度學習技術,但正如一條英語諺語所言:“羅馬不是一天建成的”,AI技術在幾十年的發展過程中,經歷了一場又一場的變革之旅。從最初的“專家系統”的出現,到現在複雜的“機器學習”模型時代,有一段長長的歷史進程。反思變革過程,回溯早期歷史,可以爲充分利用人工智能的潛力來解決複雜的現實問題鋪平道路。因此,今天我們回顧用專家系統解決化學領域複雜問題的第一個AI模型,即1965年的DENDRAL。
圖1:自然雜誌公佈2024年重要的七項科技
專家系統是什麼?
在上世紀的 60 年代初,計算機科學家埃德·費根鮑姆(Ed Feigenbaum,1936-)受到科學家思維過程的啓發,開始創建模型來模擬專家的經驗歸納法,這一歷程導致了第一個專家系統的誕生。費根鮑姆與1958年的生理醫學諾獎得主萊德伯格(Lederberg,1925-2008)合作,率先開發了化學領域開創性的專家系統 DENDRAL,同時也開啓了一段專家系統引領人工智能的時代。
專家系統在上世紀80 年代,曾經引領AI,佔據AI的主導地位。第一個專家系統DENDRAL,是研究有機分子識別的工具。繼DENDRAL 之後,又有 MYCIN和CADUCEUS等醫療診斷的專家系統被開發出來,用戶向這些計算機系統描述他們的症狀,就像向醫生描述症狀一樣,然後,計算機返回醫療診斷。
這些專家系統成爲改進決策的催化劑,徹底改變了行業。它們可以幫助化學家鑑定化合物,或者協助醫生診斷感染。隨着他們的成功,專家系統在80 年代獲得了廣泛的應用,滲透到財富 500 強公司中並展示了一定的用處和優越性。
之後,還有用於評估多種殘疾學生的專家系統;澳大利亞醫學研究所開發的,可對病理實驗室的內分泌報告提供自動臨牀診斷評論的醫學專家系統;意大利於 20 世紀 90 年代開發的監測大壩安全的專家系統,第一個版本於 1992 年安裝在 意大利Ridracoli 大壩上,至今仍在繼續運行。
後來,由於當年沒有高速的計算機,沒有先進的互聯網,當然也沒有大數據的支撐。然而,儘管時機尚未成熟,人們對人工智能的期望卻過高,最終導致了上世紀 80 年代末被稱爲“人工智能冬天”的衰退時期。專家系統也未能倖免於難。
不過,瞭解一下當年熱門的專家系統,對深一步理解如今的AI會有所啓發和幫助。
專家系統(expert system)的意思與其名稱一致,是人類社會的“專家”在機器系統中的對應物。
我們通常所說的人類中的專家,指的是那些擅長解決特定問題的專門人才。專家爲什麼能解決專門的問題呢?有3個條件:一是具有某個領域的專業知識,二是具有利用這些知識來進行邏輯推理的能力,最後第三條,是根據推理結果和他們的經驗,具有作出正確決策的能力。
於是,計算機科學家便自然地想到:如果讓機器也擁有了這三種能力,不也就成爲專家了嗎?有實幹家們將此想法變成了現實,給計算機編程序,真正實現了這種具備“專家”功能的機器系統!於是,便取其名曰“專家系統”。
具體而言,專家系統是一個包括了某個領域的大量專門知識與經驗的程序系統,它應用人工智能技術和計算機技術,對這些知識和經驗進行推理和判斷,並模擬人類專家的決策過程,模仿人類來解決所面臨的問題。
所以,專家系統,不過是“知識就是力量”在機器智能上的具體體現,它是早期人工智能的一個重要分支,是人工智能應用研究中比較活躍和廣泛的課題之一。
一般來說,專家系統必須具備三要素:領域專家級知識(知識庫);模擬專家思維,作出專家級水準的決策(推理機);問題輸入(界面);如圖2所示。
圖2:專家系統結構示意圖
費根鮑姆其人
美國科學家費根鮑姆於1936年出生於新澤西州。他的父親是從波蘭移民的猶太人,但當費根鮑姆不到一歲時父親就去世了。年輕的費根鮑姆從他的繼父那兒,接觸到早期機電式計算器。繼父是一名會計,擁有一臺重型機械計算器,配有可轉動數字輪的電機,以及一個非常大的數字鍵盤。那個年代的中學生中,很少人喜歡這種龐大的計算器,但卻令費根鮑姆着迷。他曾經吃力地將這個笨重機器搬上校車,展示給同學們看。但多數人都對此不感興趣,唯有費根鮑姆引以爲傲自得其樂。之後,費根鮑姆由於對計算技術的極大好奇和癡迷,進入了卡內基梅隆大學學習電氣工程
。在那裡他遇到了著名的諾貝爾經濟學獎獲得者赫伯特·西蒙(Herbert Simon,1916—2001)教授,後來又在西蒙的指導下於1960年獲得了博士學位。
在西蒙的指導下,費根鮑姆在讀博期間,實現了一個模擬人在刺激反應環境中記憶單詞時的反應的程序,叫做EPAM。這是第一個模仿人類學習能力的電腦系統,費根鮑姆發明了動態增長的決策樹,以EPAM爲題完成了他的博士論文。EPAM 通過一個簡單的模型實現了許多固定目標。之後,由它改進的模型結構持續了許多年,在心理學領域一直活躍且富有成果。
獲得博士學位之後,費根鮑姆到英國國立物理實驗室NPL工作了一段時間,這段經歷對他的影響很大。圖靈曾經是NPL的研究員,在那裡設計和製造了最早的計算機之一。遺憾的是圖靈早在1954年便已經去世,費根鮑姆無緣見到圖靈,卻仍然感受到圖靈在NPL的巨大影響力。
在人工智能初創的第一個10年中,人們着重的是問題求解和推理的過程。費根鮑姆的重大貢獻是最早倡導了"知識工程",並使知識工程成爲人工智能領域中取得實際成果最豐富、影響也最大的一個分支。
1994年,費根鮑姆因其在人工智能和智能系統上的顯著貢獻榮獲圖靈獎。
費根鮑姆本人,不僅是知識工程的倡導者,也是實踐者。他對此的早期實踐便是考慮開發一種知識密集型的,基於知識的計算機系統。這種程序適合於人類專家短缺或專門知識十分昂貴的的情況,可以模仿人類的專家,用比較經濟、易於複製推廣的運行計算機程序的方法,由“專家系統”來完成專家才能完成的任務。如此一來,企業就不需要聘請很多有經驗的專家,所以可以極大地減少勞務開支和培養費用,爲用戶帶來經濟效益。
因此,費根鮑姆如此定義專家系統:“專家系統是一種智能的計算機程序,其內部含有大量某個領域專家水平的知識與經驗,能夠模擬人類專家的思維過程,求解該領域內需要專家才能解決的困難問題。”
第一個專家系統
費根鮑姆十分欣賞他在卡內基梅隆大學讀博的美好時光:活躍的學術氣氛,充滿創新和挑戰的環境。在那兒,費根鮑姆還有幾位良師益友:博士導師西蒙是AI先驅,又是經濟學諾獎得主,西蒙的學生中,還有另一位人工智能的先驅人物:紐厄爾,1975年和西蒙一起榮獲圖靈獎。博士畢業後,費根鮑姆在加州大學伯克利分校的商學院任教五年,但他對當年的伯克利缺乏計算機科學項目感到十分不滿,於是,在 1965 年,費根鮑姆穿過舊金山灣來到了斯坦福大學。
事實證明,斯坦福的環境更適合費根鮑姆的人工智能興趣,他的經歷也說明了環境對科研的重要性,適合的環境、志同道合的合作者,會使科學家如魚得水。你別看如今AI很熱門,在60年前不是這個樣子。即使是硅谷,那年頭是晶體管和半導體等等公司爭奪天下的年代,此外還有處於萌芽狀態卻頗具商業潛力的集成電路。而研究人工智能的人卻沒幾個,所謂“思考機器”,實際上還只能算是少數幾位科學家深藏心中的夢。
不過,斯坦福大學別出一格,真正研究AI的人數雖然不多,但願意朝此方向思考的人物卻不少。在約翰·麥卡錫等的帶頭倡議下,從1964 年開始,舊金山灣區少數幾個對機器智能感興趣的人,開始每月在斯坦福舉行一次聚會。
費根鮑姆十分強調“知識”對思考的重要性,到斯坦福大學後,他改變了研究方向,從計算機的認知模擬轉向工程,即對計算機進行編程,使其不僅能與人一樣聰明,而且還有可能比人聰明得多。費根鮑姆在斯坦福聚會上討論他的想法時,有幸認識了斯坦福大學遺傳學系主任萊德伯格。
圖3:費根鮑姆在卡內基梅隆大學和斯坦福大學
約書亞·萊德伯格(Joshua Lederberg,1925-2008)是美國分子生物學家,主要研究方向爲遺傳學、人工智能和太空探索。他因爲發現細菌遺傳物質及基因重組現象而獲得1958年諾貝爾生理醫學獎,那年他才33歲。
萊德伯格比費根鮑姆年長11歲,同是出生於新澤西的猶太人。他的專業是遺傳學,卻曾經對符號計算以及類似人工智能的目標有過濃厚的興趣。費根鮑姆談到他對建造人工智能系統的一些想法,重新燃起了萊德伯格長期以來對計算的興趣。當時費根鮑姆想選擇一個領域來研究科學家對知識和經驗的推理行爲,萊德伯格立即給出了一個具體建議:從質譜中推導出分子拓撲結構的任務。因爲萊德伯格正在指導一個項目,其目標是探索火星上的生命,爲此萊德伯格的實驗室正在測量氨基酸的質譜,他認爲質譜分析是一項可以產生實際影響的有用的任務,經驗豐富的化學家,利用他們關於化合物的質譜分析知識來猜測化合物的結構。並且,萊德伯格告訴費根鮑姆,他最近開發的一種“樹突”算法,也許可以派上用場。
於是,兩人一拍即合,1965年,他們開始聚集一支出色的團隊,招募科學家及研究生參與該項目,開始了長達10年左右的DENDRAL專家系統開發的長期旅途。
剛得博士學位的布魯斯·布坎南(Bruce Buchanan)以及兩位碩士生首先加入其中,他們後來都在人工智能領域留下了自己的印記。
名爲“專家系統”,專家的知識及經驗積累舉足輕重,費根鮑姆認爲“知識蘊含力量”,這一主題很快浮出水面,成爲DENDRAL及後來的專家系統項目的旗幟。對DENDRAL來說,重要的是有機化學、拓撲學和質譜方面的知識,而萊德伯格的質譜知識還不夠,必須另請專家!
其實,需要的專家近在眼前,他們看中了萊德伯格的朋友卡爾·傑拉西。
卡爾·傑拉西(Carl Djerassi,1923—2015),是保加利亞與奧地利裔美國化學家。他最出名的貢獻是開發了口服避孕藥,但他也是一位頗有聲名的作家,是幾本科幻小說的作者。他於1978年獲得第一屆沃爾夫化學獎。傑拉西是斯坦福大學質譜實驗室的負責人,那當然是質譜分析領域專家中的專家。
爲此兩人設計了一個“圈套”:向傑拉西演示他們構建的DENDRAL的雛形:DENDRAL這位機器“專家”,能夠對付簡單的氨基酸,但是,對其他的化合物,例如酮和醇的族類,卻表現得無能爲力。原因是顯而易見的,因爲它沒有“獲取”這方面的有機化學家已經瞭解的化學知識,當時的DENDRAL對這些族的質譜幾乎一無所知。這個演示對傑拉西太有誘惑力了,他不就是這方面的專家麼,於是,傑拉西欣然同意參與到項目中,使得該程序在酮和醇方面的性能顯着提高。
DENDRAL的四人團隊中,布坎南的貢獻也不容小覷,他是LISP程序專家,並且有他的特殊興趣:他希望系統能夠“自己做出發現,而不僅僅是幫助人類做出發現”。因此,DENDRAL被設計爲由兩部分組成:“Meta-Dendral”和“Heuristic Dendral“,前者是一個“假設製造者”,後者將作爲知識豐富的學習系統的模型,可作爲模板用於其他領域。
專家系統的意義
第一個專家系統DENDRAL誕生了,在不斷完善的過程中,該計劃處理了數百甚至數千數萬個案例
。DENDRAL是一個化學分析專家系統,保存着化學家的知識和質譜儀的知識,可以根據給定的有機化合物的分子式和質譜圖,從幾千種可能的分子結構中挑選出一個正確的分子結構。不過,專家就是專家,僅僅擁有某一特定領域專家的方法和知識。DENDRAL程序,對於某些分子家族,即使與人類的最佳表現相比,它也是該領域的專家。但是,專家不能通吃,某個領域的專家很難轉移到其它專業。例如,國際象棋大師不太可能是專業的代數學家或專業的質譜分析師。
DENDRAL的經驗爲下一個專家系統的創建提供了信息,MYCIN,幫助醫生診斷血液感染。因此,DENDRAL的研究成功被認爲是人工智能研究的一個歷史性突破。
上世紀70-80年代,專家系統從實驗室出現並進入市場,“專家系統”這個短語開始流行,很快地在各個地方使用。專家系統成爲最早真正成功的人工智能軟件形式之一,是第一個成功的商業人工智能產品,在許多製造業和軍隊中都發揮了作用。專家系統的成功不僅驗證了費根鮑姆關於知識工程的理論的正確性,還爲專家系統軟件的發展和應用開闢了道路,逐漸形成具有相當規模的市場,其應用遍及各個領域、各個部門。
正如人工智能歷史上一次又一次的新突破一樣,專家系統這個“新事物”,在20世紀80年代產生了大量的炒作,得到一些令人興奮但卻是錯誤的預測,對其發展起了反作用。在20世紀90年代以後,“專家系統”一詞逐漸從IT詞典中消失,原因有多種,有人認爲因爲專家系統沒有兌現其過度炒作的承諾,因而成爲其成功的受害者。但是實際上,早在1983年
,費根鮑姆就發現了導致它們最終消亡的“關鍵瓶頸”,是因爲“擴大知識獲取的過程非常艱苦,我們必須擁有更自動化的手段來取代目前非常繁瑣、耗時且昂貴的程序。知識獲取問題是人工智能的關鍵瓶頸問題。”
不過,正是專家系統的侷限性,促使研究人員開發新型方法。他們開發了更高效、靈活和強大的方法來模擬人類決策過程,特別是具有反饋機制的機器學習和數據挖掘方法。
現代AI系統可以更容易地處理大量複雜數據(大數據)而吸收新知識,從而進行自我更新,這些類型的專家系統,後來被稱爲“智能系統”。
如今,費根鮑姆期待的“知識獲取的自動化”最終實現了,但並不是通過他當時設想的方法,而是要歸結於“機器學習”方法的使用,尤其是在網絡出現之後,知識變成了可以通過互聯網及其他方式訪問的數字化實體,再通過機器學習以及近十年發展的“深度學習”方法,來挖掘和分析這些知識。所以,儘管專家系統這個名詞現在不常用,但當年發展出來的若干概念和思想,已經融入到AI的血液裡。
[1]“Interview of Edward Feigenbaum“,2012 Fellow,Interviewed by:Jon Plutte,CHM Reference number: X6409.2012
https://archive.computerhistory.org/resources/access/text/2012/06/102746203-05-01-acc.pdf
[2]Feigenbaum, E., & Lederberg, J. (1987). On Generality and Problem Solving: A Case Study Using the DENDRAL Program.
[3]Feigenbaum, E. (1983). Knowledge Engineering: The Applied Side of Artificial Intelligence.