厦门大学近日在其官方公众号上公布了一项创新性的学术探索,旨在通过人工智能技术,为古老的甲骨文考释工作注入新的活力。据悉,该校的研究团队正着手利用AI多模态大模型,结合甲骨文的音韵、形态与意义,协助专家们更加高效地解读这一有着三千多年历史的文字。
甲骨文,亦称“殷墟文字”,作为世界四大古文字之一,不仅是中华文明的重要瑰宝,也是现代汉字的源头。然而,传统的甲骨文考释工作却面临着巨大的挑战,需要考古专家凭借深厚的知识积累和丰富的文献阅读,通过字形分析和辞例研究等方法,逐步破译这些古老的文字。这一过程不仅耗时费力,而且效率极低。
面对这一困境,厦门大学的研究团队决定借助近年来迅猛发展的AI技术,利用深度学习模型的强大语义表示能力,为甲骨文考释提供新的解决方案。针对甲骨文数据稀缺、图像质量参差不齐的问题,团队系统整理了相关古文字数据,构建了更大规模、更高质量的甲骨文多模态数据集,并提出了基于多元信息辅助考释模型的技术方案。
为了实现这一目标,团队设计了一系列与实际考释过程密切相关的任务和评估方法,如跨字体图像映射、跨字体IDS解码以及甲骨字与现代字的对译关系等。这些任务旨在有效训练多模态大模型,提升其对于甲骨文的理解和识别能力。
在AI技术的辅助下,团队利用其强大的跨模态理解能力,对甲骨文进行更为深入的考释。在大模型提供的语义嵌入基础上,团队还计划设计融合音、形、义、用多元信息的端到端甲骨文综合考释模型。这一模型将综合利用字形结构、语义关联、同音通假和用法聚类分析等多种手段,开发一种更加轻便、高效的考释系统,以适应资源有限的实际考释场景。
可以预见,随着AI技术在甲骨文考释领域的不断应用,这一古老而神秘的文字将有望得到更为全面、深入的解读。厦门大学的这一创新尝试,不仅为甲骨文的保护与传承提供了新的可能,也为考古学、历史学等相关领域的研究开辟了新的道路。