用AI破譯古文明?Google DeepMind推出AI模型Aeneas,拼湊古羅馬人的生活日常

古羅馬留下的不只有共和體制和全民愛喝的葡萄酒,也留下了滿城可見的古碑文。這些文字被刻在石塊上、繪於牆面,或鑄進紀念碑中,內容除了官方政令與法規,也包含情詩、政治塗鴉、墓誌銘與日常書寫。據統計,每年仍約有1500塊新的古碑文陸續出土,只可惜,由於年代久遠,多數早已字跡模糊、破損難解。

如果我是當年某位刻下情詩的戀愛腦羅馬俗民,也許會慶幸這些文字的殘缺不全,讓後世沒能看懂——至少不會讓自己的暈船語錄流傳千年。但這份小確幸可能要結束了!Google DeepMind與一群歷史學者攜手合作,開發出名為「Aeneas」的AI模型,試圖將這些破碎的文字重新拼接、解讀,讓我們更深入理解兩千年前的古羅馬人在想些什麼。


命名致敬古典神話,學者與AI攜手拼出古羅馬人的心思

你可能覺得這個名字有點耳熟?「Aeneas」(艾尼亞斯)正是出自《伊利亞特》與羅馬神話中的英雄人物。傳說中,希臘人用木馬屠城之計攻陷特洛伊的那一晚,艾尼亞斯在奮身一戰後,扛著父親、牽著兒子逃離火海,踏上流亡之路,最終抵達義大利,這也被視為羅馬文明的開端。

這幅《艾尼亞斯逃離燃燒中的特洛伊城》,無論畫名或畫面,都直接勾勒出那晚的逃亡情節。(來源:WIKI)

這款AI模型之所以以他為名,不只出於浪漫,而帶有文化意涵:如同艾尼亞斯從戰火廢墟中踏上開啟新文明的旅程,Aeneas也試圖從破碎的碑文中拼湊線索,重建人們對古羅馬的理解。

不過,這位AI英雄並不單靠演算法,而是人文學者與科技團隊聯手打造的成果。Aeneas由Google DeepMind與牛津大學、倫敦大學、威尼斯大學等古文字專家合作開發,並導入全球三大拉丁碑文資料庫,包括拉丁碑文資料集(EDCS)、歐洲古希臘與拉丁碑文網絡(EAGLE),以及來自北非與高盧的區域紀錄,總計超過17萬筆、橫跨千年的碑文資料,成為Aeneas學習歷史語境的強大養分。

Aeneas融合了自然語言處理(NLP)與圖像辨識,讓它不只看得懂文字,碑文照片也能同步分析。該技術會先透過擅長視覺辨識的ResNet模型,判斷石材種類、字體風格與破損位置。接著,再結合已知的文字殘片,交由語言模型推理語意和重建原始句構。

Aeneas會同步接收文字殘片與碑文照片,並由Transformer結構的Torso Decoder進行語意理解與推理。(來源:Google DeepMind)

實際應用上,Aeneas提供三項主要功能:補全缺失文字、預測碑文的地理位置與年代,並從資料庫中找出語境相近的歷史文獻做比對。換句話說,這個模型不單重建文字,也試圖還原古羅馬的語境與歷史脈絡。

補字(restoration):類似英文克漏字,單次查詢最多可以補上20個缺字,Aeneas也會同時列出多種可能的補字方式,並依機率排序,幫助研究者快速判斷最合理的選項。

年代判定(dating):年代最早可追溯到西元前800年,最晚到西元800年。Aeneas會用黃色標出可能的年代區間,再用紅線畫出平均預測年份。

地點推測(attribution):Aeneas會根據語言與風格特徵,在62個羅馬行省中推測可能的出處。圓圈在地圖上顯示得越大,則代表越有可能來自該處。

Aeneas能推測碑文的可能產地,並以機率熱區的形式呈現。(來源:Google DeepMind)

這樣的AI協作模式也獲學界肯定。牛津大學古代史教授、Aeneas共同研究者喬納森.普拉格在接受《衛報》採訪時表示,這套系統可以應用在現有的碑文資料庫上,協助學者檢視哪些部分還能進一步解讀。他補充,Aeneas的誕生也讓更多人有機會參與這些古文的研究。

「在沒有這樣的工具時,你唯一能做的,就是仰賴自己累積大量知識,或者翻遍整座圖書館,」他說,「但真正重要的是,你對這些資訊的運用是否具備批判能力。」這也讓人們對於「AI是否挑戰專業性」的疑慮,稍微沒那麼緊繃。


那AI會比專家厲害嗎?實測數據揭曉

為了測試Aeneas是否靠譜,研究團隊委託了23位專業碑文學家進行對照實驗。他們需修復被刻意刪除的文字,並推斷碑文的年代與來源。實驗分別讓學者在「單獨判讀」與「搭配Aeneas協作」的情境下完成任務。

結果相當有趣:在純人力推估下,碑文年代的平均誤差為31年;但在Aeneas的協助下,不只地點判斷更準確,年代預測的誤差也縮小至約13年左右。

事實上,這並非Google DeepMind首次跨足古文解讀。早在2022年,他們就推出了以《奧德賽》故鄉命名的「Ithaca」,專注於解讀古希臘碑文;而這次的Aeneas,則聚焦拉丁文碑文,涵蓋整個羅馬帝國時期的文字紀錄。兩套系統都體現AI與歷史學家合作的嘗試。

古希臘人的租約、法律、曆法與神諭等紀錄,散落在石頭、陶器或金屬上。Ithaca便來解讀這些地中海的歷史碎片。(來源:Google DeepMind)

在這兩者問世之前,學界解讀古文的方法也曾歷經多次技術革新,只是過程往往極度耗時、依賴專業直覺。像18世紀末發現的羅塞塔石碑,是破解埃及象形文字的關鍵,但語言學家商博良花了20多年才在1822年成功解碼。

到了21世紀,科技才開始參與和古文的對話。2016年,研究人員利用X光斷層掃描(X-ray CT)與虛擬拆捲(virtual unwrapping)技術,成功「在螢幕上攤開」一捲燒得焦黑、一碰就碎的恩戈地古卷,讀出了《聖經.舊約》裡〈利未記〉的前兩章。到了2023年,「維蘇威火山挑戰賽」向全球AI團隊開放挑戰,目標是解讀因火山噴發而碳化的「赫庫蘭尼姆古卷」。最終,AI成功讀出其中約5%的內容,內容是一篇兩千年前描寫羅馬生活風格的隨筆。

來自義大利的赫庫蘭尼姆古卷,受維蘇威火山爆發碳化成這副模樣。(來源:Vesuvius Challenge)


不只西方:韓國也用AI讓古樂重生

古文修復當然不專美於古希臘或拉丁碑文,亞洲文化圈同樣擁有豐富的歷史音律與文字遺產。舉例來說,近年來韓國也開始用AI重製亡失的古典音樂。

朝鮮王朝時期的宮廷音樂《正樂》(정악)中有不少曲目亡佚,雖然當年使用的「井間譜」還留有紀錄,但許多旋律細節與演奏技法也已失傳。這種譜記以一格格「井」字標記節奏與音高,現今除了少數研究者外,幾乎沒人能看懂。

上方為西洋五線譜,下方便是井間譜。中間虛線則是讓人們易於比較這兩種樂譜在節奏上的對應。(來源:arVix)

為了讓這些沉睡的聲音重現,韓國國立國樂院與韓國智慧資訊社會振興院攜手合作,運用AI技術修復這些古典音樂。AI不僅能模擬樂器的音色,還能遺失的旋律與轉音,並重組編曲。最後交由樂師實際演奏,整體還原度也相當不錯,甚至有專家表示,猶如「在宮廷裡聽過」。


說實話,有時候看著新聞,會懷疑自己是否該轉行去學經絡按摩,或報名個水電工課程,因為AI取代人類創作與工作的趨勢實在過於排山倒海。但像Aeneas這類AI模型,感人的或許是:總算不再是傳來搶飯碗的悲報了,而是適時在一旁,作為人類延伸的好助手。

返回頂端