甲骨文因年代久远、字形变化多样、无传世文献可供对照等因素,对其识别一直是考古学面临的难题。南方科技大学6位本科生运用图像和文本处理、深度学习算法、创新的神经网络算法和生成对抗算法,结合甲骨文的形态、语义、上下文关联等知识,实现甲骨文文字的自动识别、生成和检索目标。
甲骨文,指中国商朝晚期王室用于占卜记事而在龟甲或兽骨上契刻的文字,最早出土于距今3000多年的河南省安阳市殷墟遗址。识别甲骨文一直是困扰学术界的难题,为了解决这一问题,南方科技大学2018级本科生曾鸣、杨睦圳、鲁昊天、汪炜、席睿翎和2017级张舒煜等6名同学,在人文社科唐际根老师、计算机系刘江老师以及研究团队章晓庆、胡玙璠、钟雯的指导下,以CS330《多媒体信息处理》课程学到的知识和技能为基础,尝试用AI解读甲骨文。
据介绍,他们首先建立了甲骨文数据库,将已识别的甲骨文图像及其对应汉字收入库中,目前已完成558个单字、1.8万多张图像的录入。接着,采用经典的深度残差神经网络(ResNet)模型实现手写甲骨文图像识别的任务;然后,选择pix2pix生成对抗网络(GAN)作为生成甲骨文的自动方法,用于增加样本多样性和生成一些未知甲骨文,其中基本网络采用U-Net结构;最后,利用检索算法将未知甲骨文图像与已有的甲骨文对比,从数据库检索出未知甲骨文图像。
本项目创新地开发多媒体信息处理和人工智能技术应用于甲骨文的识别和生成,以考古学研究需求为导向,以多媒体信息处理和人工智能创新算法为核心,充分融合南方科技大学考古研究与多媒体人工智能算法创新的科研实力,体现了跨学科交叉融合的魅力与力量,实现了跨越学科边界的思维碰撞与技术共享。目前,合作团队已经着手开发可用于展示和互动的微信小程序,希望将甲骨文的识读面向大众,提升大众对甲骨文的理解。
项目小组组长曾鸣说:“在甲骨文识别项目中,小组学习了甲骨文相关历史和研究现状,并把人工智能技术应用到甲骨文。这次人文研究和计算机技术的结合,让我们体会到交叉学科研究的魅力!”(首席记者 吴吉)