在社交网络上“斗图”的时候,最尴尬的莫过于有图在脑海、却难以搜索到。为了解决广大网友的这个痛点,知名 GIF 动图分享网站 Giphy 决定借助搜索巨头 Google Cloud Vision 的力量。机器学习兼软件工程实习生 Bethany Davis 解释了这个错综复杂的流程,关键部分是,其将重点放在了标题、而不是来源的描述上:“Cloud Vision 会对 GIF 资源库进行光学字符识别(OCR),检测图中出现的文字或说明”。
动图来自:Giphy
“Google Cloud Vision 可以返回相当不错的结果,对于将数据直接整合到搜索引擎中,我们团队对此感到很有信心。我们的任务是解析数据、并对每个 GIF 编制索引,然后更新我们的搜索请求,以利用全新支撑的元数据”。
在艰苦的数据编译工作之后,Davis 还得将它整合到搜索查询中。在计算出几个变量之后,比如是否使用了一个匹配短语查询、有多信任 Google Cloud Vision 数据、以及来源提供的描述,然后通过公司内的各种工具进行内部测试。
举个例子,她可以将旧的搜索结果和新的查询进行比对。在得到正面回应之后,就将搜索结果发布给用户。而下一步,他们将比对点击,以判断用户是否切实搜到了更好的结果。
Davis 将今夏开始 Giphy 的搜索结果和自己的测试进行了对比,发现新的搜索结果已经表现出了极大的改善:“当你下一次在 Giphy 上搜索特定场景或直接引用的时候,将能够直接看到自己想要的搜索结果”。
[编译自:Neowin]