☰

21歲大學生揭開2000年前古卷之謎：用AI重現“消失的”文字

2000 多年前“消失的”古卷文字，如今被 AI 重現了。

近日，一名 21 歲計算機科學專業的學生利用人工智能（AI）技術在未打開的赫庫蘭尼姆古卷中發現了第一個單詞。

他就是內布拉斯加大學林肯分校的 Luke Farritor，他開發了一種機器學習算法，可以檢測捲起的紙莎草紙上的希臘字母，其中包括 πορphiυρας（porphyras），意思是“紫色”。

Luke 通過利用表面紋理的微妙、小範圍差異來訓練神經網絡並突出墨水，成功破譯並讀取 4 平方釐米區域內的 10 多個字符，贏得了 4 萬美元的 First Letters 大獎。

意大利那不勒斯大學的紙莎草學家、審查 Farritor 研究成果的學術委員會成員 Federica Nicolardi 表示：“當我看到第一張圖像時，我感到震驚，我實際上可以從卷軸的內部看到一些東西。”

赫庫蘭尼姆古卷是龐貝古城附近一座私人圖書館中收藏的古代卷軸，因公元 79 年維蘇威火山噴發而被掩埋並碳化。近 2000 年來，這座唯一倖存的古代圖書館一直被埋在地下 20 米厚的火山泥下。18 世紀，它們被挖掘出來，雖然在某種程度上得到了保存，但非常脆弱，如果處理不當就會變成灰塵。

如何閱讀無法打開的卷軸？數百年來，這個問題一直沒有答案。

2019 年，肯塔基大學 EduceLab 的 Brent Seales 教授在粒子加速器中對赫庫蘭尼姆古捲進行了成像，生成分辨率高達 4 µm 的 3D CT 掃描。他的團隊還掃描並拍攝了帶有可見墨水的分離卷軸碎片，從而提供了地面真實數據集。Seales 教授的研究生 Stephen Parsons 致力於使用機器學習模型從 CT 掃描中檢測墨水，並在分離的碎片上取得了成功。

這一成功引起了科技企業家 Nat Friedman 和 Daniel Gross 的注意，他們發起了維蘇威火山挑戰賽以加速這一進展。他們於 2023 年 3 月發起了一場公開競賽，除了 70 萬美元的大獎外，還爲開源工具和技術的開發頒發了幾個較小的獎項。

後來，一小羣研究團隊開始使用最初由 EduceLab 構建並由社區改進的工具來繪製卷軸的 3D 結構。到今年七月，數百平方釐米的古卷被分割並被“幾乎壓平”。

八月初，前 JPL 初創公司創始人 Casey Handmer 寫了一篇博客文章，講述自己發現了一種看起來像墨水的“裂紋圖案”。Casey 是 2000 年來第一個在未打開的卷軸中發現墨水和一封信的人。

Luke Farritor 是一名大學生，同時也是 SpaceX 暑期實習生，他從 Dwarkesh Patel 接受 Nat 的播客採訪中聽說了維蘇威火山挑戰賽。

他看到的 Casey 裂紋模式在 Discord 中被討論，並開始在深夜訓練關於裂紋模式的機器學習模型。隨着每一個新裂紋的發現，模型都會得到改進，在卷軸上就可以顯示出更多的裂紋。

Luke 發現了幾十個墨跡筆畫以及一些完整的字母，可以將其標記並用作訓練數據。不久之後，卷軸就露出了肉眼看不見的裂紋痕跡。很快，這些痕跡開始形成字母和實際單詞的暗示。

與此同時，另一位參賽者、柏林的埃及生物機器人研究生 Youssef Nader 則採取了不同的方法。受到 Casey 和 Luke 發現的激勵，他篩選了 Kaggle 上墨水檢測獎的獲獎作品，該獎的重點是改進 Stephen Parsons 在分離片段中的機器學習方法。他使用域轉移技術使這些模型適應卷軸：對卷軸數據進行無監督預訓練，然後對片段標籤進行微調。

他提交了“墨水檢測後續獎（Ink Detection Followup Prize）”的想法並獲得了一個小獎。幾周後，Youssef 向第一封信獎提交了自己的作品。他看到了 Luke 在 Twitter 和 Discord上分享的早期結果，並決定關注卷軸中的同一區域。

儘管完全沒有依賴 Casey 手動尋找裂紋的方法，但是通過 Kaggle 競賽的修改模型，他成功地找到了一些字母。然後，他在標籤數據中註釋了看起來像字母形狀的內容。

分割團隊和參賽者不斷取得進展，幾天前 Youssef 的模型生成了一張清晰度和尺寸令人震驚的新圖像（如下圖所示）。

威尼斯卡福斯卡里大學的古希臘和羅馬歷史學家 Thea Sommerschield 向《自然》雜誌解釋說，這一發現可能“徹底改變我們對古代歷史和文學的認識”。

21歲大學生揭開2000年前古卷之謎：用AI重現“消失的”文字

相關資訊