腾讯建全球最大甲骨文单字数据库：一个“牛”有3500种写法

2024年12月10日 14:55 次阅读稿源：快科技条评论

2016年，中国文字博物馆曾向公众发出悬赏令，承诺每破译一个甲骨文字便奖励10万元人民币。然而直到2023年前，仅有一位学者凭借对“蠢”字的研究获得了这份奖金。截至目前，已发现的甲骨数量接近16万片，其中包含约4500个不同的甲骨文字符。但遗憾的是，这些字符中只有大约1500个被成功解读出来。

造成这一现象的主要原因包括：许多甲骨上的文字模糊不清、相似字形难以区分以及人工查找效率低下等挑战。

为了加快甲骨文的解码速度，腾讯公司构建了一个包含超过143万个单字记录的世界最大甲骨文数据库，并利用数字技术实现了相似形状和相关甲骨之间的匹配与关联功能。该数据库已于近期开源。

通过这个平台，用户可以快速检索到相关信息。例如，在搜索栏输入“牛”，系统将返回3504种与之形态相近或相关的甲骨文样本及其对应的原始材料。

除此之外，腾讯还发布了首个多模态甲骨文数据集（涵盖一万份甲骨拓片及摹本），详细标注了每个单字的具体位置及其所属类别等信息，这一系列举措有助于加速甲骨文被考释的进程。

1 (20%)

4 (80%)

已有条意见

编辑精选

加载中...

本周本月

招聘