(原标题:“艾莎门”调查:视频审核主要靠人又是KPI惹祸?)
#lexo_img_start http://cms-bucket.nosdn.127.net/catchpic/0/0b/0bf84835c3257087f23b230ede0611e7.jpg?imageView&thumbnail=550x0 lexo_img_end#
大量披着儿童喜爱的动画角色而制作的充斥着暴力、色情、低级笑料的视频内容去年出现在国外的视频网站You Tube上。由于《冰雪奇缘》里的艾莎公主是这类视频最常利用的角色,因此这个事件被称为“爱莎门”。近日,有家长在微博上反映,这些在被境外封杀的视频悄悄流入国内市场,优酷、爱奇艺、腾讯、搜狐等视频网站全部中招。南都记者调查获悉,虽然目前国内各大主流视频网站均进行了紧急处理。但这绝不是一次突击清理这么简单。视频网站对UGC(用户原创内容)是如何进行审核和监管的?这类视频如何堂而皇之通过审核?艾媒咨询集团CEO张毅接受南都记者采访时表示,UGC内容是目前的大趋势,对这种模式的监管和审核应该越来越受到重视。
审核主要依靠人工?
上周,微博网友“肉呆大魔王”在微博上呼吁网友关注并举报问题视频。事件引起关注之后,1月20日,腾讯、爱奇艺、优酷等发布了紧急声明,纷纷表示采取措施。主要通过封停账号、屏蔽搜索关键词、下架视频等方式进行处理。昨日上午,南都记者在几个主流视频网站搜索发现,绝大部分关键词搜索已经被屏蔽。
但南都记者注意到,微博网友“sihan涵晗”在优酷的声明微博下评论称:有人曝光就查一下,没人曝光就随便发视频……该网友的评论实则指出了这次事件背后的根本问题--视频网站对UGC内容审查机制是否存在漏洞?大规模的问题视频是如何通过了审核的?
南都记者了解到,目前视频网站审核UGC内容主要依靠关键字排查、视频抽帧、人工审核等手段。有知情人士向南都记者表示,视频审核一部分依靠机器筛查,主要借助视频中的关键字+图像识别。机器审核视频是基于深度学习图像识别云,实际也是将视频截图,由机器审核每一张截图的安全性。不过具体是3秒截一张还是5秒截一张,松紧度由视频网站自己控制。机器审核视频原理是先建模,然后导入海量的数据建库,让多个机器同时进行深度样本学习,再标注无法通过的图像种类,进而把这些样本揉碎、旋转、添加“噪音”,提高机器识别能力。对于不能通过的视频,机器审核会给出两类结果:确定不能通过的,这类准确率几乎99.5%以上:仅作参考的,准确率在95%到97%,这就意味着,该视频需要再次进行人工审核。机器基本能筛过99%的视频,只有1%需要再次动用人工。
“在实际操作中,上面所提到的流程是理想状态,更多的上传视频其实还是主要依靠人工审核,机器只是辅助。”一家视频网站的相关负责人向南都透露,比如机器检测到流量的异动,点击、评论等数据短期内暴涨,借助这个辅助手段,审核人员会对视频二次审核,如果涉黄涉暴就会处理;如果视频即便涉黄涉暴,但数据没有飙升,也很难发现。“视频总量太大,人工只能抽检,没办法普查,发现问题其实都是概率事件。”
KPI考核的压力?
这是否意味着,针对上传视频的监管,目前并没有什么好办法,主要大量依赖人力审核?对于上述疑问,目前,爱奇艺、优酷土豆、搜狐等都不愿意对审核和监管的细节详细解读。
不过,很多网友都曾抱怨过,上传视频网上审核时间偏长。南都记者此前试验也发现,在白天上班时间,上传一个5分钟的视频,大约半个小时到一个小时就能审核通过。但在深夜,同样上传一段5分钟的视频,等待审核通过的时间需要3个小时或者更长。对此,业内人士表示,晚上审核的人少,相对会慢一些。
在上述视频问题出现后,有网友建议,视频网站应加强算法等,采用更好的技术手段来解决这一问题。但有网友指出,有的上传视频其实反映的价值观非常隐晦,目前的AI技术根本不能够筛查出来。比如,表面上是一个教小孩子DIY橡皮泥的视频,中间有一小段出现了明显类似内脏的东西,橡皮泥的颜色也类似器官。昨日中午,南都记者在优酷还看到了比这位网友描述的更加隐晦的包含暴力暗示的视频内容。一段表面来看是视频制作者带着芭比娃娃和小猪佩奇一家玩过家家游戏,但中间会出现小猪的头被“不经意”扭断的画面。
一位曾在某内容平台负责视频内容审核的业内人士向南都记者透露,“如果平台这类视频上线量不够,用户留存率不高的,人工审核时就会有意识地去增多这些问题视频。”比如,今天上线的视频总量有5000个,按照KPI的考核情况,为了炒热度和点击量,就可能会选择尺度比较大、有冲击性的视频上线。这个比例每天都在调整,至于有冲击性的内容的尺度把握,“要看负责审核的人,很多人都不会看具体内容,只是看视频的栏标签,这些栏目标签都是人添加的。色情、恶搞的点击率明显比优质视频的高多了。”该人士表示,虽然审核人员不与视频热度KPI考核直接挂钩,但KPI考核还是会影响选择上线视频的倾向性。
至于机器审核的截图和动图,“这些都是可以人工操作的,根据需求规避。”上述人士表示,这其实都是行业的潜规则。
用实名制认证防范?
针对这一次采取“封停账号、屏蔽搜索关键词、下架视频等方式”净化问题视频之后,视频网站如何预防此类内容和事件的再次出现?目前视频网站的审查和监管还存在哪些短板,未来将如何提高把关水平?
相对于目前的审查手段,业内认为,实名制的推进才能减少用户权益受损。2017年6月1日正式施行的《中华人民共和国网络安全法》要求,“网络运营者为用户提供信息发布、即时通讯等服务,在与用户签订协议或者确认提供服务时,应当要求用户提供真实的身份信息。用户不提供真实身份信息的,网络运营者不得为其提供相关服务。”去年7月,bilibili(B站)已公告开始采用实名制,UP主(视频创作者或上传者)上传视频内容(包括新增、编辑、换源等)需通过实名验证。昨日,优酷土豆方面向南都表示,目前还没有接到消息要实名制。搜狐、爱奇艺对此没有回应。
采写:南都记者 莫柳 实习生 陈琳玫
视频网站这样应对
1
优酷在声明中称,将对视频上传环节更加严格地把关。
2
腾讯视频发布的声明中也指出,处理过程中,经过技术侦查,发现存在大规模恶意有组织上传行为。对此,“我们正在全力进行技术反制,将向有关部门报案,追究其法律责任。”
3
搜狐视频回应称,严格筛查的同时,将严密监控相关内容和上传的账号,及时严格对上传账号进行处理。
4
“为避免相关违规动漫关键词及视频内容变种过多不易筛查,搜狐视频宁可整部剧集全面下线清查,也绝不放过。搜狐视频后续将持续重点关注此类动漫内容,随时接受用户监督,对于此类不良内容坚决抵制并处理。”