今日头条升级灵犬反低俗助手新增图片识别功能

2019-07-30 17:30:54 责任编辑：出处：

【TechWeb】7月30日消息，今日头条宣布正式推出新版灵犬反低俗助手（以下简称灵犬），同时支持图片和文本识别。这是时隔半年后，灵犬的又一次重要升级。用户目前可以在今日头条内，搜索灵犬进行试用。

据了解，灵犬脱胎于今日头条反低俗模型，是一款检测内容健康度的辅助小工具。字节跳动人工智能实验室总监王长虎介绍称，2012年以来，今日头条内部搭建了反色情、反低俗、反标题党、反虚假信息、反低质等数百个模型，并投入近万人专业审核团队。

王长虎称，新版灵犬重点拓展了反低俗识别类型和模型能力，现已覆盖图片识别（反色情低俗、反血腥暴力）和文本识别（反色情低俗、反暴力谩骂、反标题党）。后续还将支持语音识别和视频识别。

此前一年时间内，灵犬已陆续完成两次迭代。2018年3月28日，今日头条首次上线灵犬，支持检测文字和文章链接。2018年5月16日，灵犬完成服务能力升级，增加反色情短文本模型和反谩骂模型，将准确率从73%提升至82%。2019年2月20日，灵犬2.0 正式上线，除了反色情低俗模型，加入反暴力谩骂和反标题党模型，覆盖了主要的低俗低质内容类型，整体识别准确率接近85%。

用户只需要在灵犬内输入一段文字或文章链接，灵犬就可以帮助其检测内容健康指数，返回一个鉴定结果。对于用户输入的内容，灵犬会先进行提取、分词和语义识别，然后根据相关规则，输出对应的分数、评级和结论。这一切都在短短几秒内完成。图片和图片链接检测同理，用户在灵犬内上传图片或图片链接，即可快速获取鉴定结果。

据王长虎介绍，灵犬背后的文本分类模型，已经经过了三次迭代。每个新版本相对于旧版本，在技术和数据集层面，都有一个明显的跃升。这一代灵犬训练数据集总量是1.2个T，相当于20倍百度百科或100倍维基百科的数据总量，包含920万个样本，准确率提升至91%。

在图片识别层面，灵犬采用深度学习作为解决方案，在数据、模型、计算力等方面均做了针对性优化。数据层面，灵犬已累积上千万级别的训练数据。模型层面，灵犬针对许多困难样本做了模型结构调优，尝试解决多尺寸、多尺度、小目标等复杂问题。计算力层面，灵犬利用分布式训练算法以及GPU训练集群，加速模型的训练和调试。

截至2019年6月，灵犬反低俗助手的使用人次已经超过了300万。

? 打开APP阅读全文