好讀周報/AI數學推理能力大進展!奧數難題6道對4道 等同「銀牌」水準

各種AI工具可解更多複雜難題。(圖/取自網路)

文/陳韻涵輯

人工智慧公司「Google DeepMind」(昔稱DeepMind科技)7月利用結合數學推理系統「AlphaProof」與幾何解題系統「AlphaGeometry 2」的工具,解出今年第65屆「國際數學奧林匹亞競賽」6道數學難題中的4題,達到與銀牌得主相同的水準,展現Google DeepMind在數學領域推理能力的人工智慧重大進展。

Google DeepMind在奧數競賽傳出佳績,倫敦總部敲鑼祝賀。(圖/紐約時報)

英國《衛報》報導,儘管電腦的數學計算速度快過任何人類,但「形式數學」(formal mathematics)的最高殿堂仍是人類獨佔的領域。

國際數學奧林匹亞競賽(International Mathematical Olympiad)是歷史最悠久且規模最盛大的全球中學生數學競賽,1959年以來每年舉辦一次。本屆國際數學奧林匹亞競賽除了人類應試者,還有Google DeepMind的突破性人工智慧雙系統來挑戰。

Google DeepMind的AlphaProof是旨在強化學習的「形式數學」新型推理系統,透過數百萬次驗證自主訓練,逐步解決艱澀難題。

Google DeepMind今年初在《自然》(Nature)期刊發表能解決數學難題的人工智慧模型「AlphaGeometry」,它以聊天機器人(Chatbot)語言模型「Gemini」當作基礎的混合式神經符號(neuro-symbolic)人工智慧系統,結合神經網路和符號推理的人工智慧技術,解決複雜的幾何等數學題目。此次挑戰國際數學奧林匹亞競賽的「AlphaGeometry 2」,則爲比「AlphaGeometry」更快速的改良升級版本。

每年的國際數學奧林匹亞競賽考題都有6道深奧的題目,出題範圍涵蓋代數(algebra)、幾何(geometry)和數論(number theory)等領域,贏得金牌的應試者將躋身全球最優秀的年輕數學家之列。

國際數學奧林匹亞競賽參賽學生分兩階段解答題目,每個階段的時間限制爲4小時30分鐘。Google DeepMind團隊豁免時間限制,國際數學奧林匹亞競賽的題目被翻譯成正式的數學語言,讓兩套人工智慧系統能夠理解,該系統僅用16秒就解決一道幾何問題,卻花了72小時解決其他問題。

負責評分的英國數學家高爾斯表示,AlphaGeometry 2透過語言模型和更類似數學的方法配對,並在此次國際數學奧林匹亞競賽解題中,凸顯其幾何領域的重大進展。他解釋,AlphaGeometry 2選擇了一條出乎意料的「捷徑」,「曾有些電腦輔助的經典例證比維基百科(Wikipedia)還要長,結果事實並非如此」。

Google DeepMind團隊表示,AlphaProof成功解答兩道代數題和一道數論題,其中包括今年最難、只有5名參賽學生答對的難題;另外,AlphaGeometry 2解出一道幾何問題,另有兩題解不出來。衛報指出,人工智慧系統與人類不同,要麼完美解答題目,要麼絕望當機。

Google DeepMind系統團隊獲得28分,相當於銀牌的水準。高爾斯賽後透過昔稱「推特」(Twitter)的「X平臺」發文寫道,「(Google DeepMind)系統需要比人類應試者更多的時間處理問題,有些問題的解題時間甚至超過60小時,其處理速度固然比可憐的老人腦快上許多,但若人類參賽者也有這麼多時間處理每一道問題,他們無疑會獲得更高分。」

Google DeepMind著名的戰役還有8年前打敗南韓圍棋好手李世乭。(圖/歐新社)

●閱報秘書/逾600學生參賽 臺灣2金2銀2銅

國際數學奧林匹亞競賽官網顯示,今年國際數學奧林匹亞競賽的6道題目中,每解出一題可獲得7分,總分最高42分。本屆賽事7月11日到22日在英國巴斯登場,共吸引來自108個國家的609名選考生應試,其中包括81名女性。今年的金牌最低門檻爲29分,共有58人獲得;銀牌最低門檻爲22分,共有123人獲得;銅牌最低門檻爲16分,共有145人獲得,其中共有6名臺灣學生得獎,締造2金、2銀、2銅牌的佳績。另外,榮譽獎項頒給170人。

負責評斷Google DeepMind團隊分數的評審團,包括曾獲菲爾茲獎(Fields Medal,被譽爲數學界諾貝爾獎)殊榮的英國數學家高爾斯(Timothy Gowers)、國際數學奧林匹亞競賽本屆試題委員會主席邁爾斯(Joseph Myers),兩人都是國際數學奧林匹亞競賽金牌得主。

●新對手/SearchGPT挑戰Google 衝擊搜尋網路流量

SearchGPT可在短時間內搜尋並明確回答使用者的問題,直接挑戰搜尋引擎龍頭Google。(圖/YouTube)

人工智慧新創公司「OpenAI」7月25日表示,已開放部分使用者及發行商測試由聊天機器人「ChatGPT」驅動的搜尋引擎「SearchGPT」。SearchGPT可在短時間內搜尋並明確回答使用者的問題,直接挑戰搜尋引擎龍頭Google,且可能影響使用者找新聞及其他資訊的網路流量。

科技新聞「The Verge」報導,SearchGPT測試官網首波開放1萬名測試者,試用以GPT-4打造的人工智慧生成式搜尋服務原型,並針對相關錯誤改善並優化系統。

網友實測顯示,SearchGPT的搜尋速度不僅飛快,且資訊展示非常直觀,沒有廣告干擾,甚至可以直接播放YouTube的影片;如此一來,SearchGPT可能成爲一個多媒體的入口網站,而當使用者不需要點擊其他網頁的連結,可能影響其他網站的流量及其潛在營收。

隨着生成式人工智慧的出現與普及,微軟(Microsoft)已使用OpenAI工具將人工智慧驅動的功能加入Bing搜尋引擎;Google也在今年5月改良其搜尋引擎,利用人工智慧生成的摘要現在經常出現在搜尋結果的最上方。這些摘要的目的是快速回答使用者的搜尋查詢,以便他們不用點選連結或造訪其他網站,就能獲取資料。

如今OpenAI的SearchGPT可能挑戰Google和微軟的Bing等傳統搜尋霸主地位,並對人工智慧聊天機器人驅動的對話式搜尋引擎「Perplexity」構成威脅。