2016年,中国文字博物馆曾向公众发出悬赏令,承诺每破译一个甲骨文字便奖励10万元人民币。然而直到2023年前,仅有一位学者凭借对“蠢”字的研究获得了这份奖金。截至目前,已发现的甲骨数量接近16万片,其中包含约4500个不同的甲骨文字符。但遗憾的是,这些字符中只有大约1500个被成功解读出来。
造成这一现象的主要原因包括:许多甲骨上的文字模糊不清、相似字形难以区分以及人工查找效率低下等挑战。
为了加快甲骨文的解码速度,腾讯公司构建了一个包含超过143万个单字记录的世界最大甲骨文数据库,并利用数字技术实现了相似形状和相关甲骨之间的匹配与关联功能。该数据库已于近期开源。
通过这个平台,用户可以快速检索到相关信息。例如,在搜索栏输入“牛”,系统将返回3504种与之形态相近或相关的甲骨文样本及其对应的原始材料。
除此之外,腾讯还发布了首个多模态甲骨文数据集(涵盖一万份甲骨拓片及摹本),详细标注了每个单字的具体位置及其所属类别等信息,这一系列举措有助于加速甲骨文被考释的进程。