騰訊科技訊 據外媒報道,三名賽前素昧平生的學生組成的團隊,利用 AI 技術解密了 2000 年前的羅馬帝國著名卷軸文物中的部分内容,在比賽中赢得 70 萬美元大獎。這些學生利用 AI 解決問題的能力令人贊歎,而由科技大佬發起挑戰賽的巧妙安排也爲他們開展合作、施展才華提供了推動作用。
開始這個故事前我們先了解一點背景知識。紙莎草是一種植物,埃及人用它制成紙張,成爲古代信息傳播的重要媒介。赫庫蘭尼姆紙莎草(Herculaneum papyri)是著名的上古卷軸,公元 79 年維蘇威火山噴發時,它被掩埋在了龐貝古城附近的一處私人住所的泥土與灰燼下。18 世紀左右,當它們重見天日的時候,損壞已經非常嚴重,人們一直無法閱讀這些上古卷軸。
2023 年,科技大佬籌資 100 萬美元發起 " 維蘇威挑戰賽 ",要求參賽者使用 AI 技術解密卷軸中的幾段文字。近期這個挑戰賽取得了重大突破,三名學生拔得頭籌。
在參加維蘇威挑戰賽之前,這三名學生互相并不認識。而且至今他們仍然沒有親自見過面。但他們在合作中加深了友誼,共同完成了他們無法獨自完成的事情。
理查德 · 揚科(Richard Janko)是密歇根州立大學古典書卷研究的首席教授,在這三名學生還沒有出世之前,他就一直夢想着讀懂這些紙莎草卷軸。揚科表示,如果沒有科技人才的幫助,解密卷軸幾乎是不可能完成的任務。
這些卷軸遺迹中,可能包含着古代科學、數學和哲學的秘密,但是它們毀損嚴重,以至于無法從物理上解開。
燒焦了的紙莎草卷軸,看起來像狗狗糞便
大約 20 年前,肯塔基大學的計算機科學家布倫特 · 海爾斯(Seales)設計了一種新方法,想用現代技術解開卷軸的秘密。過程包括三個步驟:第一步掃描,第二步切開,第三步尋找墨迹。這聽起來很簡單,但實際上卻很難做到。首先,卷軸必須通過粒子加速器以高分辨率掃描。然後,需要對紙頁進行識别、分割和數字拼合。隻有這樣才能讓機器學習模型尋找墨迹。
海爾斯認爲,從理論上講,這倒也不是不可能的。但他也不清楚需要多長時間才能将理論轉化爲現實,直到他收到一封陌生人發來的電子郵件,
發郵件的人是奈特 · 弗裏德曼(Nat Friedman),著名的科技投資者、創業家,曾擔任 GitHub 的首席執行官。當時他了解到赫庫蘭尼姆卷軸的事情,對此非常着迷。聽說了海爾斯爲解密這些卷軸所做的工作後,他想幫點忙。但他也不知道如何才能幫上忙,于是發郵件聯系了海爾斯。讨論之後,他們決定舉辦一個挑戰賽。
這次挑戰賽獲獎的三名學生中,盧克 · 法裏托(Luke Farritor)主修計算機科學課程,去年曾到 SpaceX 實習。他才華橫溢,對計算機、科學和考古都有廣泛的興趣,完全可以幫忙解密卷軸,但問題是沒有人會找他幫這種忙。" 維蘇威挑戰賽 " 的舉辦給他提供了機會。" 這種研究方法被嚴重低估了," 法裏托說。" 我認爲在很多不同的領域裏,需要有很多這樣的挑戰賽。"
法裏托說維蘇威挑戰賽的引人之處在于獎金豐厚,且具有重要的曆史意義,可以喚起英雄主義情懷,符合在各個領域引入最新科技的理念,而且還有參與冒險故事的刺激感。法裏托後來告訴媒體 , 當時他想的是:" 如果我把時間花在刷 TikTok 上,還不如花在這個項目上呢。"
團隊的另一名成員優素福 · 納德爾(Youssef Nader)是柏林自由大學的機器學習專業博士生,現年 27 歲。納德爾是埃及人,當他讀到 " 維蘇威挑戰賽 " 的新聞時,也和法裏托有同樣的感覺,不過他決定參賽的原因略有不同。
他告訴媒體說:" 我作爲一個埃及人,紙莎草這個詞引起了我的強烈興趣。" 很快,他開始把精力更多地放在挑戰賽上,而不是自己的博士學業上。他說," 這就像是我在過一種秘密的雙重生活," 不久之後,他腦子裏想的就隻有羅馬帝國了。
第三名成員朱利安 · 希利格(Julian Schilliger)今年 28 歲,在瑞士蘇黎世大學讀研。
從左到右:朱利安 · 希利格、優素福 · 納德爾和盧克 · 法裏托
舉辦挑戰賽的一個好處就是吸引人才,特别年輕的人才。
在參加 " 維蘇威挑戰賽 " 的 3000 多名科技人士中,許多人都是學生。這些年輕人通常是最有時間,也最有創造力、野心和好奇心的人,而這些也恰好是試驗一項新技術所必需的。
這場挑戰賽是由西爾斯、弗裏德曼及其投資夥伴丹尼爾 · 格羅斯(Daniel Gross)共同發起的,他們衆籌了資金,提供了誘人的大獎:在 2023 年年底之前,恢複四段清晰的、每段約 140 個字符的第一個團隊将獲得 70 萬美元的獎金。
他們知道這項挑戰賽将吸引一大群 AI 技術人才。他們不知道的是,破譯工作會取得多少進展。
弗裏德曼在構思這個挑戰賽的時候,認爲必須把競争與合作聯系起來,所以他在維蘇威挑戰賽中設立了 " 裏程碑獎勵 ",鼓勵參賽者分享他們的進展和代碼。
如果是單純的競争,那麽取得很小的進展也會花費更多的人力,因爲有太多的工作要做,成功機會卻很小。弗裏德曼想讓 " 成功的小機會 " 變得遠遠更大。例如,一位擁有理論天體物理學博士學位的參賽者使用新技術,成功地在卷軸上檢測到了裂開或隐藏的墨水痕迹。這是一項重大的發現,該名參賽者獲得了 1 萬美元的 " 裏程碑獎勵 "。
法裏托得知有兩個希臘字母的形狀被辨認出來之後,就訓練自己的機器學習模型以便尋找更多的字符,而這需要計算機視覺來識别肉眼看不到的墨迹。
一項進展激發了另一項進展——這恰恰說明了 " 維蘇威挑戰賽 " 的優勢。
去年夏天,法裏托實習結束回到學生宿舍,使用五台電腦開展研究。他的新 AI 智能模型發現有大約 10 個字母組成的詞,拼寫爲 porphyras,含義是紫色。法裏托成爲兩千年來第一個在未打開的卷軸中閱讀單詞的人。這也使他獲得了 4 萬美元的獎金。
另一邊,納德爾也因爲自己的進展赢得了大約 1 萬美元的 " 裏程碑獎勵 "。他置辦了新的電腦,購買了雲計算服務,以便開展接下來的研究。
這時法裏托和納德爾決定組團工作,不再單打獨鬥。在 2023 年 12 月 31 日挑戰賽截止日期之前不久,希利格也加入了團隊。希利格擅長從卷軸中提取出頁面,這就可以提供更多數據。
截止日期到了,在提交成果的 18 個團隊中,他們拔得頭籌。
那麽這些紙張上到底寫的是什麽呢?
抱歉,還沒有完全破譯,獲獎團隊也隻是破譯了一小部分。卷軸作者很可能是著名的伊壁鸠魯學派哲學家菲洛德摩斯,文中讨論了我們今天仍然在熱議的話題:音樂、食物和快樂。也就是如何才能過上幸福的生活。
參與挑戰賽的每個人都在思考,他們下一步要做什麽,他們如何才能将這次比賽的經驗教訓應用到其他看似不可能完成的任務中。
現在大家對卷軸有了一點點了解,但還想知道更多。 " 維蘇威挑戰賽 " 在 2024 年提出了新的目标:恢複已掃描的 4 個卷軸中的 90%。而這可能隻是一個開始。學者們相信還有更大的寶藏等待着從赫庫蘭尼姆發掘出來,足以讓他們前仆後繼再忙上下一個兩千年。
法裏托可能沒有那麽多時間再花在卷軸上了:他剛剛辍學,因爲弗裏德曼招聘了他。入職時間就是他赢得維蘇威火山挑戰賽的第二天。(編譯 / 雲開)