七问今日头条:公开算法、招聘审核、封禁账号,会让“低俗内容”消失吗?
2018-01-18 09:28:08     [查看原文]

2017年的最后一个工作日,无疑是“今日头条”最难捱的一天:高歌猛进了一年,没想到却以封停24小时收官——因“传播色情低俗信息”,网信办约谈头条,责令其整改。随后,今日头条多个栏目停止更新,进入维护状态。

这应该是中国互联网史上新闻资讯平台遭遇的最严厉的一次处罚了。

随后,今日头条发文道歉“正视问题、积极整改”;取消了“社会”频道;元旦后还放出风声,称将招聘2000名内容审核员;1月11日,今日头条更是大张旗鼓的举办了一场所谓的“算法公开”分享会,邀请了圈内100多人参加。

此举很快引起了业内的注意,有自媒体将之称为“今日头条的转折点”,因为这是“国内第一家做推荐引擎的公司开放算法技术”。

动作频频,诚意满满,有破有立,义正辞严。笔者不由对头条的公关团队油然起敬!

这一系列事情,看似大手笔,但其实经不起琢磨。作为吃瓜群众,笔者突然有一些问题也想问一问今日头条:

一问价值观:“你关心的,才是头条”,媒体平台的价值观何在?

在一年前接受《财经》采访时,张一鸣直言:“媒体是要有价值观的…这个我们不提倡”、“因为我们不是媒体”,但被《财经》记者直接反问道:你们是最大的媒体聚合平台。

对此,笔者深以为是。头条可以自认不是媒体而是企业,但对用户来说,却是他们获取资讯(可能唯一的)渠道,因此它不可辩驳地带有媒体属性。既然有媒体属性,就应该承担起传递有用信息、剔除谣言和低俗、维护社会主流价值观等责任。在这个知识爆炸、技术爆炸、资讯爆炸的时代,资讯平台有责任将最优质、最权威、最丰富的内容及时推送给用户,而不是以“用户导向”为挡箭牌,暗地里大行输送低俗内容之道。

因此,“你关心的,才是头条”这句话其实偷换了概念,丢弃一切媒体责任,将所有低俗的原罪推给用户。

另一方面,数年来头条一直宣称“算法”和“技术”中立,说白了就是以算法来决定推荐,因此出现了明明可以抓取权威精华资讯,却给用户推送垃圾内容,这也是头条屡次被约谈甚至停更的根本性原因。

当然,若笔者不惮以最大恶意来揣摸头条方面的逻辑,或许他们不是没意识到价值观和媒体责任,而可能故意绕开了,这就涉及到下面几个问题。

二问算法:既然算法可以纠偏,为什么低俗内容屡禁不止?

此前张一鸣曾公开表示:用户喜欢高雅还是低俗,技术平台并不会干预。

在这样的“算法无罪”、“技术中立”论调之下,头条的内容在2017出现了失控迹象,即使在各界包括人民日报和人民网多次提醒之下,用户对其推荐“内容低俗”的诟病更是始终未曾落停。

而如今,在遭到最严厉的处罚后,头条的态度突然来了个大转弯。在11日的“分享会”上,其资深算法架构师曹欢欢说:“算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型”、“有些算法还做不到、做的不好,这就需要内容干预” 。

问题来了:如果可以“纠偏,设计、监督并管理算法模型”,如果自己也承认算法做得不好之处需有内容干预,那为什么之前不做呢?

在面对《财经》时,张一鸣说自己“最忌讳价值观先行”、“不干涉可能是对内容最好的管理”,为什么现在又要干涉了呢?

而当《财经》提问(头条)为什么不通过内容来给用户以正确的引导时,张一鸣的回答是:平台的责任是克制(引导用户),多数情况下“不克制带来的伤害更大”。

拿这话对比现在头条的态度就能发现,张一鸣其实早就知道算法是有问题的,但他作为生意人,首先考虑的是“怎么做伤害更小、利益更大”,当然他想的是对公司的伤害,却没有考虑到对用户、对社会的伤害。现如今面临处罚又说出自相矛盾的话,还要招聘审核编辑,还是说明此前对算法不是不能干预,而是不愿干预。

三问诚意: 是算法公开还是一场公关秀?

参加11日头条的分享会的人大致分为两类,一是媒体人士,二是互联网公司的算法工程师、产品经理。

一位参加了分享会的算法工程师会后表示,很多所谓的技术都早已是公开的秘密,个性化推荐技术发展到现在这个阶段,各家的算法框架不会有本质的差别,比如在线推荐模型,目前各公司都是这样做的,“算法很重要的是你以什么为目标,如果你的算法目标是‘点击率\时长’,这其实也是头条最擅长的,讲到这部分的时候他说‘这就需要内容干预’,讲的很糊涂。算法的基本原理都是公开透明的,细节才是根本,只公布原理却不公布算法细节,基本都是些’正确的废话’。感觉今日头条这次的沟通会,不是特别有诚意,”

要知道,现场那么多专业“攻城狮”,是奔着“智能推荐引擎的公司的算法技术”去的,至少也是抱着学习的心态,结果大家听到的是一场算法知识科普分享会……

对于此次所谓的算法公开,业内人士普遍认为这更像一次公关秀,套路OK但诚意欠佳。而现场曹欢欢还跟大家收了简历,这是不是有点“变相挖人”的嫌疑呢?

四问初心:既然建立了低俗样本库,用户为什么还会被低俗内容困扰?

今日头条的算法公开分享会后,其官方微信发布了一篇名为《12段话,了解今日头条算法的秘密》的文章,头条方面表示:“头条现在拥有健全的内容安全机制……包括鉴黄模型、超过百万样本库的低俗模型和谩骂模型等……”

笔者不禁想问,既然已经有了如此强大的“样本库”,为什么用户还会被持续不断的低俗内容所困扰?网信办在29日处罚封停时明确指出“传播色情低俗信息”,难道政府错了?还是说,那些“色情低俗信息”在今日头条眼中,还算不上低俗,进不了样本库?

知乎上有技术专家指出,“实际上如果想完全避免低俗内容是完全可以做到的,方法就是建立样本库。但这个决定权不在于算法而在于算法背后的人,是否希望真正做到完全过滤还是要靠低俗内容吸引用户增加流量。”

所以,只有两个解释,要么是样本库远不完善,要么是“故意”不完善。

五问成本:信息茧房是不能破,还是不愿破?

很多用户和业内人士此前对今日头条的另一不满,在于“信息茧房”——由于纯算法驱动,用户看了什么,机器就推送什么,比如一个网友抱怨的:他只是看了一条王宝强与马蓉离婚的新闻,此后机器就没完没了地给他推送“小三”、“劈腿”、“偷情”之类垃圾信息。

有技术专家指出,算法可以做到主动探索用户的兴趣点,通过尝试推送其它领域的内容来不断验证用户是否感兴趣,当然,这样会加大成本,尤其在一些老用户身上。

“当某用户已经完全沉浸,每天刷N小时以上,就没必要在他身上浪费运算了。”这位技术专家对笔者说,“反正用户已经成为头条的深度用户,对产品形成了沉浸体验,流量和时长已经赚到,那就不需要为他付出更多成本。”

所以问题来了:“今日头条”的宗旨和目的,是真的为用户提供更多优质内容,还是只为赚流量和时长?

六问隐私:算法和用户隐私哪个更应该向用户解释清楚?

“低俗内容”问题还在持续,又曝“泄露用户稳私”。1月11日,工信部就手机应用侵犯用户隐私的问题,约谈包括今日头条在内的三家互联网企业。

工信部明确指出,对照《网络安全法》《全国人民代表大会常务委员会关于加强网络信息保护的决定》《电信和互联网用户个人信息保护规定》(工业和信息化部令第24号)有关规定,今日头条等三家企业均存在用户个人信息收集使用规则、使用目的告知不充分的情况,要求三家企业本着充分保障用户知情权和选择权的原则立即进行整改。

同时工信部称,上述三家企业表示,将按照监管部门要求,对相关服务进行全面排查,加强内部管理,完善产品设计,举一反三,认真整改。

今日头条一边向政府部门表示积极整改,一边又高调发声明表示“已就此事向工信部汇报,不存在泄露用户隐私问题,同时鉴于谣言已经扩散,将向公安机关报案,申请立案处理”。笔者不禁想问:谣言始于哪里?工信部还是用户?如果不存在用户反应的问题,是否应该向公众解释清楚?而不是简单粗暴的定性为谣言,甚至还扬言将向公安机关报警!对于用户来讲“算法”和“泄露隐私”哪个更重要?哪个更需要开一场公开的说明会呢?

七问责任:公开算法、招审核、封禁帐号,就可以抵销“追求商业利益”的原罪吗?

近日,笔者看到了一批观点雷同的洗地稿件,业内一些知名自媒体老师观点一致地认为“现在的今日头条就像七年前的腾讯”。

腾讯在经历了3Q大战之后,从一家封闭的互联网帝国走向开放,几年时间建成了良性的生态系统。而这一轮的洗地稿认为,今日头条现在面临的问题是成长喜悦中如影随形的成长烦恼,同时会成为一个契机为今日头条打开一个不一样的世界。所以不得不承认,今日头条的公关还是很厉害的,尤其近期!

与今日头条恰恰相反,腾讯是一家“重产品轻公关”的企业,无论是头条早期的“挑战腾讯”还是现在的“自己就是七年前的腾讯”,腾讯始终未做任何回应。业界经常会把腾讯的开放战略归功于3Q大战,在去年的全球合作伙伴大会上,腾讯公司副总裁林松涛曾表示,“外界认为腾讯开放是3Q大战直接引发的,但其实腾讯开放的想法早已经有,3Q更像是导火索和催化剂。”

在笔者看来,腾讯的成功源于其“一切以用户价值为依归”的产品理念,包括张小龙曾经刷爆朋友圈的“善良比聪明更重要”的产品价值观,而这一点也表现在微信在商业化层面的克制,相较于其他平台微信掌握了更多的用户信息,只要微信“想”,完全可以让朋友圈充满个性化广告,但到目前为止笔者每天在朋友圈只能接收一条广告。

反观今日头条,首先利用色情低俗内容快速积累用户,再通过“算法”为用户持续不断的推送此类内容完成用户时长等对于资讯平台来讲至关重要的指标,有了流量的加持,商业变现自然水到渠成。有媒体报道,今日头条明年广告收入目标冲500亿保300亿。因此,今日头条低俗化的锅,不应由算法来背,而应该是算法背后追逐商业利益对低俗内容的放纵。

公开算法,招聘内容审核人员,封禁、禁言账号等一系列公关大秀之后,就可以让“低俗”消失吗?让我们拭目以待!

本栏目中的所有页面均系自动生成,自动分类排列,采用联索网络信息采集、网页信息提取、语义计算等智能搜索技术。内容源于公开的媒体报道,包括但不限于新闻网站、电子报刊、行业门户、客户网站等。使用本栏目前必读