☰

好讀周報／AI數學推理能力大進展！奧數難題6道對4道等同「銀牌」水準

各種AI工具可解更多複雜難題。（圖／取自網路）

文／陳韻涵輯

人工智慧公司「Google DeepMind」（昔稱DeepMind科技）7月利用結合數學推理系統「AlphaProof」與幾何解題系統「AlphaGeometry 2」的工具，解出今年第65屆「國際數學奧林匹亞競賽」6道數學難題中的4題，達到與銀牌得主相同的水準，展現Google DeepMind在數學領域推理能力的人工智慧重大進展。

Google DeepMind在奧數競賽傳出佳績，倫敦總部敲鑼祝賀。（圖／紐約時報）

英國《衛報》報導，儘管電腦的數學計算速度快過任何人類，但「形式數學」（formal mathematics）的最高殿堂仍是人類獨佔的領域。

國際數學奧林匹亞競賽（International Mathematical Olympiad）是歷史最悠久且規模最盛大的全球中學生數學競賽，1959年以來每年舉辦一次。本屆國際數學奧林匹亞競賽除了人類應試者，還有Google DeepMind的突破性人工智慧雙系統來挑戰。

Google DeepMind的AlphaProof是旨在強化學習的「形式數學」新型推理系統，透過數百萬次驗證自主訓練，逐步解決艱澀難題。

Google DeepMind今年初在《自然》（Nature）期刊發表能解決數學難題的人工智慧模型「AlphaGeometry」，它以聊天機器人（Chatbot）語言模型「Gemini」當作基礎的混合式神經符號（neuro-symbolic）人工智慧系統，結合神經網路和符號推理的人工智慧技術，解決複雜的幾何等數學題目。此次挑戰國際數學奧林匹亞競賽的「AlphaGeometry 2」，則爲比「AlphaGeometry」更快速的改良升級版本。

每年的國際數學奧林匹亞競賽考題都有6道深奧的題目，出題範圍涵蓋代數（algebra）、幾何（geometry）和數論（number theory）等領域，贏得金牌的應試者將躋身全球最優秀的年輕數學家之列。

國際數學奧林匹亞競賽參賽學生分兩階段解答題目，每個階段的時間限制爲4小時30分鐘。Google DeepMind團隊豁免時間限制，國際數學奧林匹亞競賽的題目被翻譯成正式的數學語言，讓兩套人工智慧系統能夠理解，該系統僅用16秒就解決一道幾何問題，卻花了72小時解決其他問題。

負責評分的英國數學家高爾斯表示，AlphaGeometry 2透過語言模型和更類似數學的方法配對，並在此次國際數學奧林匹亞競賽解題中，凸顯其幾何領域的重大進展。他解釋，AlphaGeometry 2選擇了一條出乎意料的「捷徑」，「曾有些電腦輔助的經典例證比維基百科（Wikipedia）還要長，結果事實並非如此」。

Google DeepMind團隊表示，AlphaProof成功解答兩道代數題和一道數論題，其中包括今年最難、只有5名參賽學生答對的難題；另外，AlphaGeometry 2解出一道幾何問題，另有兩題解不出來。衛報指出，人工智慧系統與人類不同，要麼完美解答題目，要麼絕望當機。

Google DeepMind系統團隊獲得28分，相當於銀牌的水準。高爾斯賽後透過昔稱「推特」（Twitter）的「X平臺」發文寫道，「（Google DeepMind）系統需要比人類應試者更多的時間處理問題，有些問題的解題時間甚至超過60小時，其處理速度固然比可憐的老人腦快上許多，但若人類參賽者也有這麼多時間處理每一道問題，他們無疑會獲得更高分。」

Google DeepMind著名的戰役還有8年前打敗南韓圍棋好手李世乭。（圖／歐新社）

●閱報秘書／逾600學生參賽臺灣2金2銀2銅

國際數學奧林匹亞競賽官網顯示，今年國際數學奧林匹亞競賽的6道題目中，每解出一題可獲得7分，總分最高42分。本屆賽事7月11日到22日在英國巴斯登場，共吸引來自108個國家的609名選考生應試，其中包括81名女性。今年的金牌最低門檻爲29分，共有58人獲得；銀牌最低門檻爲22分，共有123人獲得；銅牌最低門檻爲16分，共有145人獲得，其中共有6名臺灣學生得獎，締造2金、2銀、2銅牌的佳績。另外，榮譽獎項頒給170人。

負責評斷Google DeepMind團隊分數的評審團，包括曾獲菲爾茲獎（Fields Medal，被譽爲數學界諾貝爾獎）殊榮的英國數學家高爾斯（Timothy Gowers）、國際數學奧林匹亞競賽本屆試題委員會主席邁爾斯（Joseph Myers），兩人都是國際數學奧林匹亞競賽金牌得主。

●新對手／SearchGPT挑戰Google 衝擊搜尋網路流量

SearchGPT可在短時間內搜尋並明確回答使用者的問題，直接挑戰搜尋引擎龍頭Google。(圖／YouTube)

人工智慧新創公司「OpenAI」7月25日表示，已開放部分使用者及發行商測試由聊天機器人「ChatGPT」驅動的搜尋引擎「SearchGPT」。SearchGPT可在短時間內搜尋並明確回答使用者的問題，直接挑戰搜尋引擎龍頭Google，且可能影響使用者找新聞及其他資訊的網路流量。

科技新聞「The Verge」報導，SearchGPT測試官網首波開放1萬名測試者，試用以GPT-4打造的人工智慧生成式搜尋服務原型，並針對相關錯誤改善並優化系統。

網友實測顯示，SearchGPT的搜尋速度不僅飛快，且資訊展示非常直觀，沒有廣告干擾，甚至可以直接播放YouTube的影片；如此一來，SearchGPT可能成爲一個多媒體的入口網站，而當使用者不需要點擊其他網頁的連結，可能影響其他網站的流量及其潛在營收。

隨着生成式人工智慧的出現與普及，微軟（Microsoft）已使用OpenAI工具將人工智慧驅動的功能加入Bing搜尋引擎；Google也在今年5月改良其搜尋引擎，利用人工智慧生成的摘要現在經常出現在搜尋結果的最上方。這些摘要的目的是快速回答使用者的搜尋查詢，以便他們不用點選連結或造訪其他網站，就能獲取資料。

如今OpenAI的SearchGPT可能挑戰Google和微軟的Bing等傳統搜尋霸主地位，並對人工智慧聊天機器人驅動的對話式搜尋引擎「Perplexity」構成威脅。

好讀周報／AI數學推理能力大進展！奧數難題6道對4道 等同「銀牌」水準

相關資訊

好讀周報／AI數學推理能力大進展！奧數難題6道對4道等同「銀牌」水準