全球最大甲骨文多模态数据集发布

2024年07月23日18:35

来源:安阳融媒

全球最大甲骨文多模态数据集发布

共包含1万片甲骨拓片、摹本等数据

  安阳融媒记者 张俊军

  7月22日,记者从安阳师范学院甲骨文信息处理教育部重点实验室获悉,日前在上海举行的世界人工智能大会上,“数字甲骨共创中心”正式发布全球最大的甲骨文多模态数据集,共包含1万片甲骨拓片、摹本,甲骨单字对应位置、对应字头、对应释文以及辞例分组、释读顺序等数据。

图片

图片来源:腾讯云微信公众号

  “数字甲骨共创中心”由安阳师范学院甲骨文信息处理教育部实验室、腾讯SSV数字文化实验室、厦门大学、腾讯优图实验室、中国社会科学院甲骨学殷商史研究中心、中国社会科学院考古研究所安阳工作站、郑州大学汉字文明研究中心等单位共同发起,并获得中国社会科学院古代史研究所以及英国剑桥大学等知名高校和研究机构的专业支持,旨在通过汇聚各方的专业科研力量,共同推动甲骨文研究的数字化和智能化。

图片

图片来源:腾讯云微信公众号

  此次发布的甲骨文多模态数据集集合了甲骨文数字化研究的最新成果,吸收了当前业界最先进的甲骨文研究资料,运用AI相关技术为数据集的信息丰富提供了支撑。这套数据集的形成,由安阳师范学院甲骨文信息处理教育部重点实验室和腾讯优图实验室、腾讯SSV数字文化实验室、厦门大学联合开发的AI模型技术功不可没。其中的甲骨字检测模型标注准确率超90%,摹本生成模型可以实现摹本—拓片逐像素对齐,字形匹配模型能够自动匹配相近字。基于以上3个模型,实验室与腾讯等单位还开发了最新的“甲骨校重模型”,像“侦探”一样帮助专家找到失传甲骨最清晰的拓片。

图片

在安阳师范学院甲骨文信息处理教育部重点实验室,博士张展正在给学生们展示甲骨缀合。(图片来源:河南日报客户端)

  “甲骨文多模态数据集将为人工智能服务甲骨文研究提供数据支持,加速甲骨文研究智能化进程,让更多遥远的声音被今人‘听见’。”安阳师范学院甲骨文信息处理教育部重点实验室主任刘永革说。

编辑:任昱炎

我来说两句 0条评论 0人参与,