2018年内容安全审核成为互联网头部公司的重点关注领域。截至2017年6月,中国网民规模达到7.51亿,互联网普及率达到54.3%。移动化、碎片化、去中心化的内容生产方式对于平台的管理和审核提出了新的考验和要求。
在这个过程中,头部互联网公司过度依赖AI的算法和机器审核,却忽视了AI算法中只对过去大量、重复性、共性内容可以做到有效屏蔽,但是对于新的内容变化存在无法有效识别的短板,而遭遇了新的挑战。
今日头条作为其中的代表公司因内容合规问题前后已受罚4次,并关停内涵段子。凤凰网、快手、腾讯等公司均因内容审核问题遭到不同程度的处罚。而后,包括今日头条、快手在内的互联网公司开始进行搭建或者持续扩充千人级别以上的大型人工审核团队。
中国网络安全行业图谱
国内内容安全审核服务的现状
1、以BAT为首的云服务厂商阵营
国内云服务厂商所提供的内容审核服务为云商店中的插件工具,互联网客户通过调用开放平台的API来实现文本、图片及视频内容的系统审核。
目前市场中的主流供应商包含:阿里绿网、百度识图和腾讯优图。而每家厂商提供的内容审核服务并不完全一致,如BAT提供服务的重点都集中在图像及人脸识别技术,主要针对UGC场景下的图片及视频内容的审核工具。
2、以图普科技、云净网为主的第三方内容审核服务供应商
垂直于内容安全审核服务的创业公司所具备的必要条件是:团队的相关背景和数据的积累,图普科技的创始人李明强来自早期的QQ邮箱团队,目前主要专注于通过人工智能技术实现的图像/图片/人脸识别场景下的内容审核,以UGC平台的图片鉴黄为主。
而云净网的核心团队则来自原中国移动-飞信内容审核的原班人马,具有10年以上的内容审核服务经验及大量敏感词库的积累,每日审核的文本内容过亿条,并且目前拥有1500人的人才池。
3、以今日头条、新浪微博、快手为主的UGC平台
目前国内大型UGC平台都具备自有的内容审核系统和人工审核团队,以今日头条和新浪微博为例,建立了自有的审核系统基础上还运营了近5000人的审核团队,而快手也宣布将再扩充2000人的审核团队保障平台内容的合规性。
人工审核团队的存在给互联网平台运营方造成了成本扩张压力,而过度集中在同一区域的人才需求会造成成本的直线攀升,同时也不利于人才池的弹性扩张和保持。国内大型互联网公司相继扩张人工审核团队充分说明AI技术无法解决内容审核的质量保障问题。
为什么AI审核仍需要人工审核介入
1、多部门监管对于被监管方的政策解读能力及内容更新提出高要求
互联网内容安全监管受到来自中宣部、国家网信办、文化部、公安部、国家广电总局及全国扫黄打非办等政府跨部门的监管,多部门监管对于被监管方的政策解读能力和及时跟进能力提出了更高要求,只有紧跟进监管部门的最新要求才能保证审核的有效性和准确性。
2、NLP技术仍存在很大提升空间
过去10年,神经网络在图像识别、语音识别技术上取得的进步有目共睹,其技术已经逐渐渗透至安防、物联网、机器人、金融等领域。反观自然语义理解技术目前应用的场景比较有限,主要集中在搜索引擎和智能聊天系统。
目前搜索引擎只能针对用户的提问回答一些简单问题,可以回答复杂问题的系统仍然处于起步阶段,而普通人想获取一些琐碎复杂问题的答案,则需要在搜索引擎提供的结果中再次进行筛选、分析和整理。
内容审核业务中存在大量文本类内容,自然语义理解可以有效的解决简单语义的筛查,但是结合上下文及时序事件存在的一些含沙射影的含义却难以理解。时至今日,自然语义技术无法实现突破的重要原因在于计算机无法模拟人类语义的扩展性、联想性以及时序性等特点。
3、采用人工审核,企业新的内容风险出现的概率会大幅降低
目前主流平台依靠大量人审模式,通过7*24小时不间断肉眼+机器辅助进行审核,会大大降低内容风险的出现。
泰岳梧桐资本观点
1、内容安全服务的产业链条将会在未来几年逐步完善,对于互联网公司的重要性将日益凸显。我们认为,相关公司将会迎来快速的发展期,除技术提供方、人力外包提供商外,直接受益的相关产业的培训和教育也将进入快车道。
2、以数据为驱动的内容安全运营服务,尤其是自体能够形成数据沉淀的公司将会成为价值公司。
3、未来5-10年存在对于NLP技术或自学习、迁移学习等算法方面应用突破的可能性,但在此之前人工审核都将伴随AI审核的存在而存在。
云净网提供的服务
早春“针织衫”才是刚需,选款和搭配都总结好了,照着穿真减龄早春的季节,温度回升,我们的衣衫也变得轻薄起来。尤其是在温暖的南方地区,春季的氛围也是越来越浓烈。轻薄、软糯、甜美的针织衫,也成为女性必备单【详细】
40岁女人衣品更重要,简约优雅不失时尚,基础款穿出高级感世人都说40岁男人是一朵花,其实这个年龄段女性,也是有自己优势。这种具体表现在,就是自己得体穿着,姣好气质。衣品上代表你对生活审美,以及自己时【详细】