知乎优化AI算法 “阴阳怪气”难题有救了

6月25日消息，随着网络的发达，在网络上精于抬杠的人越来越多，这群人就是所谓的“杠精”，一个20字以内的主谓宾简单句，就能让人无语凝噎，而被抬杠的人往往是受伤又无奈。知识分享平台知乎近日宣布要治治这些杠精了。

知乎运营总监孙达云

在知乎平台，杠精也被称为“阴阳怪气”，知乎运营总监孙达云告诉TechWeb，过去一年，知乎都在探索对阴阳怪气类评论的解决方案，其运用的是算法机器人“瓦力”，近期知乎还将对该技术进行产品化尝试。

瓦力如何破解“阴阳怪气”类评论

据孙达云介绍，知乎治理“杠精”的初衷是因为阴阳怪气类评论极大伤害了创作者和交流者的体验。这种行为通常以“不针对发言内容，而是批评对方的语气”以及“提出反对意见，但不给或给出极少数论据支持”这两类常见言论为代表。

不过，因为网络语言的复杂性，这类评论很难解决。例如经典的“呵呵”，由于双方不同关系、说话的不同场景和时间都会带来迥然不同的表意。即便是人工判定都存在标准化难度，算法模型的训练挑战就更为艰辛。

经过知乎团队的不懈努力，“瓦力”成为最新的阴阳怪气技术解决方案。

知乎内容质量管理团队技术负责人刘兆来

知乎内容质量管理团队技术负责人刘兆来解释称，针对阴阳怪气评论通常表达负面情感的特点，知乎构建了内容情感倾向性识别的算法模型和识别用户亲密度的模型，针对阴阳怪气评论的典型特征，建立了文本识别模型不断标记训练样本。

刘兆来表示，三大模型的结合不仅摆脱了单一算法模型的局限性，也让“瓦力”的阴阳怪气识别准确率超过了大多数人工判断。具体来说，就是瓦力会首先通过知乎社区里的举报、反对等负向用户行为收集训练数据。然后通过各种同义替换、规则模版方式对训练数据进行扩展，以缓解训练数据稀疏的问题。同时，“瓦力”提取文本、句法、表情符等特征，并利用一个带attention的CNN和LSTM的融合模型进行分类，最终判断出内容是否为阴阳怪气。

刘兆来向TechWeb等表示，优化技术方案后，“瓦力”已能实现对“暗藏玄机夸奖”（忍不住关注答主了，你的答案很有水平！你博士快毕业了吧！）、“好为人师”（我觉得你挺惨，虽然长这么大了，还真应该回小学改造）、“强行反驳”（你开心就好、请开始你的表演）等数类阴阳怪气内容的识别。

据TechWeb了解，有部分用户会将一些“阴阳怪气”类的评论视为神评论，甚至对这些神评论的关注超过了事件本身，如果去掉这些神评论，只剩下就事论事的评论，是否会影响用户体验？

对此，刘兆来回应说，具体的落地会考虑一些特征，比如在用户间熟悉的情况下，一些阴阳怪气的评论可能只是开玩笑，但在陌生人间就有了嘲讽的意味。知乎的情感倾向性识别的算法模型和识别用户亲密度的模型就是针对这块设计的。此外，用户也可以自己选择要不要用这个功能。

瓦力未来的应用方向有哪些？

知乎在2016年推出了算法机器人瓦力，主要用于治理平台上的谩骂、答非所问、贴标签等不友善内容，如今进一步升级后，用来挑战“阴阳怪气”类评论的治理。

在深度学习的AI大潮中，知乎的AI技术也在运用到越来越多的板块。比如现在通过站内数据做的知识图谱，识别图文相关性，以此来判断图片是否违规或含有不良信息等。

此外，还有对视频的理解。刘兆来称，现在视频主要还是靠人工审核比较多，后面会通过算法对现在做的短视频进行识别。比如，对视频打标签，根据视频的标签或者文本，对问题或者评论的文本判断相关性。

对于介于不同标准之间的打标签行为，刘兆来称，会结合人工进行上下文语境判断。比如用户点“踩”比较多，被举报了，但通过不友善模型识别又没有辱骂词，这种情况就需要结合人工审核来做判断。

据介绍，目前，知乎借助AI技术，并辅以人机结合和多元的产品举措，多重手段加强对社区氛围的维护。现阶段，知乎已实现对95%以上的违法违规、广告导流和不友善等内容的主动打击、覆盖和筛查。

对文章打分

知乎优化AI算法 “阴阳怪气”难题有救了

最新资讯

编辑精选

热门评论

相关文章

OpenAI 悄然修改AI政策文件删除"无政治偏见"的提法

OpenAI的A推理模型有时会用中文"思考" 但没人知道为什么

WhatsApp 希望将 Meta AI 放在手机主屏的前沿和中心位置

日媒预测今年AI动画飞速发展成本只有传统手绘一成

OpenAI发布美国AI经济蓝图完整讲述AI基础设施国家战略意义

Meta AI的Llama语言模型经修改后可在有20年历史的Xbox 360上运行

Top 10

王国辉：只需要一家中国公司成功开发出EUV光刻机那么“芯片战争就会结束”

美国量子计算公司CEO：黄仁勋100%错了

刘强东今日给乡亲发钱：运钞车到场特警护送现场发近1500万现金

王国辉：只需要一家中国公司成功开发出EUV光刻机那么“芯片战争就会结束”

2025年贺岁纪念钞、纪念币今晚预约抢到赚500元

北大韦神板书曝光：果然数学的尽头是英语一句中文也没有