赫库兰尼姆古卷首次被完整虚拟解读
阅读原文· scrollprize.org两千年来首次完整读取密封的古卷,用 X 射线和机器学习做到了,还把数据和代码全开放了,我觉得这是 AI 应用在人文领域最优雅的示范之一。
研究人员利用高分辨率X射线显微断层扫描和机器学习,在未物理展开的情况下完整虚拟展开并读取了赫库兰尼姆古卷PHerc.1667(Scroll4)。这是首卷被从头到尾连续读取的纸莎草卷,内容为斯多葛哲学论著,提及克里西普斯的侄子Aristocreon。第二卷PHerc.Paris4通过更高分辨率成像使墨水在三维数据中直接可见,独立确认了2023年大奖赛的解读。第三卷PHerc.139确定标题和作者为菲洛德穆《论诸神》第八卷。所有数据与代码已公开。
我们完整阅读了一卷书卷——从未将其打开
阅读预印本:《赫库兰尼姆卷轴完整虚拟展开与阅读》(PDF)。数据可在 scrollprize.org/data 公开获取,代码托管在GitHub上。
近两千年来,赫库兰尼姆被碳化的图书馆一直维系着残酷的平衡:它的卷轴在维苏威火山喷发中幸存下来,却也因此变得脆弱不堪,无法打开。要阅读一卷,就意味着要毁掉它。数百卷书卷因此继续保持密封状态,其内容虽被保存下来,却无法触及。
今天,这一局面被改变。我们已完全虚拟展开并阅读了PHerc. 1667号卷轴——维苏威挑战社区称之为“卷轴4”——全程未曾触碰其书页。这是第一卷被数字化展开、完整通读,并可供学术界持续研究的赫库兰尼姆纸莎草卷轴。

从密封的团块到可阅读的书籍
PHerc. 1667号卷轴最初是一团发黑、卷曲的碳化纸莎草。为阅读它,我们从未进行物理展开。相反,我们用高分辨率X射线对其进行扫描,重建了卷内层叠的纸层,将其展平为可阅读的表面,并利用机器学习来显现古代墨水的细微痕迹。

三卷密封卷轴,三个里程碑
这项工作不仅限于单卷书卷。除了完整阅读PHerc. 1667号卷轴外,该研究还建立了一种方法,该方法能经得起独立检验,并可扩展应用于其他卷轴。
PHerc. 1667 — 完整通读
PHerc. 1667 是一个更大卷轴的残余部分:早期试图用手打开它的尝试——在 19 世纪,以及 1969 年和 1980 年代——破坏了它的外层,只留下了紧凑的内核,高度约为原始 19–24 厘米中的 8 厘米。从这一幸存部分,我们现在已经完整恢复并阅读了文本——大约 22 列文字的下部,由纸莎草学专家转录并审校。这是第一次将卷起的赫库兰尼姆卷轴中保存下来的文本从头到尾连续阅读,而不是零散的单词或片段。
恢复的文本是一部关于伦理学的哲学论文,证据指向一部斯多葛学派的著作:它探讨人性、冲动和人类的道德进步,其最后保存的列中提到了阿里斯托克雷翁——伟大的斯多葛学派哲学家克吕西波的侄子和弟子——这一点,结合文本的语言和主题,将其置于斯多葛学派的语境中,并确定其年代为公元前 2 世纪。
由于纸莎草受损,文本解读是碎片化的,表面缺失处存在空白。即便如此,有几段文字在两千年来首次可以清晰阅读:
PHerc. Paris 4——通过更高分辨率使墨水可见
在第二卷卷轴中——PHerc. Paris 4,即维苏威挑战社区所称的卷轴 1——一种更高分辨率的成像技术首次使卷轴内部的墨水在三维 X 射线数据中直接可见。经过三维分割并投影回展开的页面上,这些墨水与 2023 年大奖赛阅读的文本一一对应——这是基于更好的数据进行的独立确认,证明阅读结果是真实的。


PHerc. 139——一个标题,一位作者
在第三卷卷轴 PHerc. 139 中,我们复原了卷轴的标题和作者归属:该著作被确认为菲洛德穆的《论诸神》第八卷——一部由伊壁鸠鲁学派哲学家撰写的论著,其作品占据了这个图书馆的大部分馆藏。读到封闭卷轴的标题,就能让学者在研读卷内任何一列正文之前,知道这卷书的内容。

如何做到的
扫描是利用法国格勒诺布尔欧洲同步辐射装置(ESRF)BM18 线站的高分辨率相位衬度 X 射线显微断层成像获取的——该设备能够分辨赫库兰尼姆卷轴中极薄且紧密堆叠的纸莎草层。此项工作与意大利那不勒斯“维托里奥·埃马努埃莱三世”国家图书馆合作完成,该馆负责保管赫库兰尼姆纸莎草文献。团队从这些卷册出发,重建了卷轴的几何结构,追踪并将其表面展开为可读的平面,并训练机器学习模型来检测几乎与下方碳化纸莎草无法区分的墨水。随后,纸莎草学家对每次读解结果进行了检查和转录。
关键在于,这一切都是开放的。断层扫描数据、重建表面和转录结果均以知识共享许可协议发布于 scrollprize.org/data,并在 ESRF 存档,代码则托管于 GitHub。任何人都可以核验这些工作、在此基础上继续研究,并将其应用于尚未处理的卷轴。
开放与全球科学的胜利
这就是开放科学所能实现的。赫库兰尼姆卷轴的虚拟展开由 EduceLab 的首席研究员 Brent Seales 教授开创。2023 年,Seales 将其实验室的成像和软件技术开放给维苏威挑战赛(Vesuvius Challenge)——这是一个由他与 Nat Friedman 和 Daniel Gross 共同发起的、由捐款资助的公开项目,旨在公开破解这些卷轴——此后,一个全球性的社区开始着手解决这个问题。首批字母和 2023 年大奖由来自世界各地的参赛者赢得。
接下来发生的事鲜为人知。维苏威挑战赛的大多数研究团队成员最初都是以参赛者身份加入的。他们参加公开竞赛,凭借取得的突破赢得奖项,随后被招募进这个现已读完一整卷卷轴的团队。这项突破背后的人,很大程度上正是挑战赛本身所创造的全球社区。
下一步
PHerc. 1667 只是其中一卷。还有数百卷尚未打开——整整一座哲学、诗歌和散文图书馆,正等待着自古代以来首次被阅读。这里展示的方法是为此规模而构建的,并且应用它所需的一切都是开放的。
如果你想帮助阅读其余藏书:
- 阅读科学内容:预印本(PDF)。
- 获取数据和代码:scrollprize.org/data 以及 GitHub。
- 加入行动:成为阅读这些卷轴的社区一员。
古代世界的思想,在黑暗中封存了两千年,正在重新回到光明——一次一整卷。