从钻研计算机技术到“探路”新媒体,清华大学新闻与传播学院教授沈阳告诉记者,对他而言,学科跨界是顺其自然的。多年前,还是一名年轻的计算机专业教师的他发现,不少新闻专业的教师和学生用他开发的软件“辅助”研究。随着沟通的增多和了解的加深,他对新闻学产生了兴趣,并逐渐将研究重心转向媒体数据挖掘、数据新闻等领域,他的研究成果受到学界关注。
专注媒体数据挖掘
在沈阳看来,互联网时代,诸如微博、微信等新媒体的研究价值日益凸显。它们在政策导向、思想传播等方面,发挥着越来越重要的作用。要透过这些新媒体切实了解民生百态,媒体数据挖掘是不可或缺的重要环节。并且,这是一座学术富矿。它不会随着媒体平台的兴衰而趋于没落,研究者会孜孜不倦地寻求新的研究范式,或构建新的理论框架体系。
沈阳的“媒体数据挖掘”研究之路始于网络舆情。“随着互联网的快速发展,各行各业对网络动态有着越来越大的需求。网络舆情是一个很好的获知途径。”他说。
意识到网络舆情研究价值的并非沈阳一人。不过,情报学和计算机科学的学科背景让他的研究独辟蹊径。其中,关于网络舆情的推演颇具代表性。通过分析2008—2012年发生在中国的320个重大网络舆情事件,沈阳假设了23个影响网络舆情演变的舆情因子和5个反映舆情发展结果的效果因子,并通过结构方程构建了网络舆情推演模型,借此探究网络舆情的产生、发展和演变。
除了网络舆情之外,沈阳也是国内较早关注以微博为代表的自媒体研究者之一。他告诉记者,这一研究灵感也是在网络舆情中“孕育”的。因为微博的“茁壮成长”,使之逐渐成为网络舆论的主场。他的微博研究也很有新意。例如,基于对政务微博基础数据的分析,他率先提炼出传播互动力指标、时效指标、群体联动指标、行动力指标、管理指标、满意指标等八项评价指标,使之有了统一的评价标准。
打造“百年老店”数据平台
沈阳说,要开采好“媒体数据挖掘”这座学术富矿,还需要得力的研究工具。对于数据挖掘来说,研究工具是有时效性的。比方说,当网页模板或数据平台变化之后,数据抓取方式就会产生相应的改变。虽说这种改变意味着技术更新,但也可能导致研究受阻。为此,沈阳和他的研究团队希望能够打造一个类似于“百年老店”的数据平台,为研究的可持续提供支持。
经过不懈努力,2014年10月,我国首个开放的“两微一端”大数据平台新媒体指数上线。作为“第一个吃螃蟹的人”,沈阳及其研究团队的研发过程并非一帆风顺。其中,如何有效实现“开放性”就是一个不小的考验。因为这个平台建设的初衷之一,就是为新媒体的整体发展趋势和社会化媒体的传播方向“把脉”。为了把这条“脉”号得尽可能公正、客观,沈阳他们不仅将平台搜集的数据免费开放,还将整合数据的计算公式进行了公布,邀请网友提出改进建议。
沈阳说,这种开放不仅可以提高平台上各类新媒体载体数据监测和相关排行的透明度及公信力,更为重要的是,为做好数据的完善和迭代提供了契机。