预测过去?DeepMind用AI复原古希腊铭文,登Nature封面

机器之心报道
编辑:杜伟、陈萍

用深度神经网络(DNN)修复受损的古希腊铭文 , DeepMind 探索 AI 与古文字学的融合 。
人类文字的诞生标志着历史的曙光 , 对于我们了解过去的文明和今天生活的世界至关重要 。 例如 , 2500 多年前 , 古希腊人开始在石头、陶器和金属上书写 , 记录下了包括租约、法律、日历、神谕在内的所有内容 , 从而令后人详细了解地中海地区 。 遗憾的是 , 这种记录是不完整的 。
几个世纪以来 , 许多遗留下来的铭文已被损坏或从原来的位置移走 。 同时 , 放射性碳测年法等现代测年技术不能用于这些材料 , 导致解释铭文变得困难且耗时 。
DeepMind 一直探索如何利用 AI 修复古老的语言 。 2019 年 10 月 , DeepMind 联合牛津大学共同打造了 AI 工具 Pythia , 它可以通过训练神经网络来修复古希腊铭文中缺失的字符或单词 。
今日 , 在最新一期 Nature 封面文章中 , DeepMind 联合威尼斯大学人类学系、牛津大学经典学院的研究者 , 探索利用机器学习来帮助历史学家更好地解释这些铭文 , 从而让人们更深入地了解古代历史 , 并释放 AI 和历史学家之间合作的潜力 。
他们提出了首个可以恢复受损铭文缺失文本、识别原始位置并帮助确定创建日期的深度神经网络 —— Ithaca , 它是以荷马史诗《奥德赛》中的希腊伊萨卡岛命名 , 在之前的 Pythia 工具上构建并进行了扩展 。
预测过去?DeepMind用AI复原古希腊铭文,登Nature封面
文章图片

  • 论文地址:https://www.nature.com/articles/s41586-022-04448-z
  • GitHub 地址:https://github.com/deepmind/ithaca
研究结果表明 , 当单独使用时 , Ithaca 在恢复受损铭文文本方面的准确率达到了 62% 。 相比之下 , 参与的历史学家的准确率为 25% , 不过他们使用 Ithaca 可以将这一数字提升到 72% 。
同时 , Ithaca 在识别铭文原始位置方面的准确率达到了 71% , 鉴定它们的年代只与真实日期范围相差不到 30 年 。 历史学家已经使用 Ithaca 重新评估了希腊历史上的重要时期 。
此外 , 为了让广大研究人员、教育工作者、博物馆职员及其他人使用他们的研究成果 , DeepMind 与谷歌云、谷歌艺术与文化合作推出了 Ithaca 的免费交互版本 。 并且 , DeepMind 还开源了代码、预训练模型和交互 Colab 笔记本 。
预测过去?DeepMind用AI复原古希腊铭文,登Nature封面
文章图片

Ithaca 交互版本:https://ithaca.deepmind.com/
下图 1 中修复的铭文(IG I3 4B)记录了一项关于雅典卫城(Acropolis of Athens)的法令 , 日期为公元前 485/4 年 。
预测过去?DeepMind用AI复原古希腊铭文,登Nature封面
文章图片

下图 2 为 Ithaca 的架构 。 文本受损部分用符号「-」表示 , 并人为损坏了字符
预测过去?DeepMind用AI复原古希腊铭文,登Nature封面
文章图片

。 提供输入后 , Ithaca 恢复了文本 , 并识别出文本编写的时间和地点 。
预测过去?DeepMind用AI复原古希腊铭文,登Nature封面
文章图片

研究者相信 , 这只是 Ithaca 这类工具应用的开始 。 他们目前正在研究针对其他古语言训练的 Ithaca 版本 , 历史学家也已经可以在当前架构中使用他们的数据集来研究其他古书写系统 , 比如阿卡德语、古埃及世俗体、希伯来语和玛雅语言 。
Ithaca
该研究使用机器学习进行铭文识别 , 他们提出了 Ithaca , 这是一种经过训练的深度神经网络架构 , 可以同时执行文本恢复、地理归因和时间归因任务 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。