人民网
人民网>>传媒>>人民网奖学金>>武汉大学2016

计算传播学视域下大数据技术对新闻专业主义的重塑

吴倩
2017年01月12日11:04 | 来源:人民网研究院
小字号

摘 要

仅仅停留于对理论的探索一直是社会科学被诟病的一个无奈,对于新闻学来说“新闻无学”也一直是被争论的议题。但是随着信息通信技术的发展,计算社会科学的兴起以及推广至新闻传播学的计算传播学为新闻传播学的实践应用开辟了新的天地。本文梳理了计算传播学的发展脉络,并从内容和用户两个层面分别以网易“数读”和今日头条为例探究了计算传播学视域下大数据技术对新闻专业主义的重塑。本文的创新性在于将新闻专业主义置于计算传播学的视域之下探究其在大数据和信息时代的意义。同时为计算传播学理论和实践的双重发展奠定基础,能够充分研究、使用这样一个尚在成长中的理论,无疑是推动学科发展与世界同步的一个良好的立足点。

关键字:计算传播学;大数据;新闻专业主义;数据新闻;网易数读;今日头条

一、文献综述:计算传播学的缘起与发展

社会学从产生、发展到现在,所走过的是一条坎坷不平的道路,对社会学研究方法的探索一直是社会学家的重要命题。20世纪70年代后,由于计算机的发展与广泛使用,以及由此所带来的各种数据分析统计软件的问世,社会学研究在大样本问卷调查、数据的多变量统计建模与分析方面,达到了一个前所未有的水平。[1]近些年来,信息通信技术进步使得社会学研究方法的进一步创新成为可能。

2009 年 2 月,Lazer等15位美国学者在《Science》上联合发表了一篇具有里程碑意义的文章《Life in the network: the coming age of computational social science》,正式提出“计算社会科学”(Computational Social Science)这一概念。该文指出:“计算社会学”这一学科正在兴起,人们将在前所未有的深度和广度上收集和利用数据,为社会科学的研究服务。[2] 2014年8月近百名来自哈佛大学等美国顶级名校不同学科的学者聚集在斯坦福大学“计算社会科学中心”召开了一次名为“新计算社会学”的学术研讨会,会上首次推出了“新计算社会学”(New Computational Sociology)这个新的社会学名词。其实这个“新计算社会学”只是Lazer等人提出的“计算社会科学”的一个深化,并没有本质上的区别。罗玮和罗教讲在对国外的新计算社会学的成果进行梳理后将之定义为:“新计算社会学是当代社会学界借助计算机、互联网与人工智能技术等现代科技手段,利用大数据、新方法来获取数据与分析数据,从而研究与解释社会的一种新的范式或思维方式。其目的是要克服既有社会学研究方法的局限与不足,达到对人类行为与社会运行规律的真实认知与科学解释。[3]”

计算社会科学可以应用到多个细分学科中去,如:计算语言学、计算社会学、计算心理学、计算传播学等。虽然信息通信技术已经在国内如火如荼的发展,大数据、云计算等计算机技术已经渗透到了日常生活的方方面面。但计算传播学在我国新闻传播学研究中尚未得到充分重视并进行系统的分析。国内对计算社会科学的讨论和新闻传播学应用始于2014年,主要学者有香港城市大学祝建华、南京大学王成军等。王成军是计算传播学实验研究中心的研究员,该中心隶属于南京大学新闻传播学院,创建于2015年2月。该中心主要关注“传播网络分析、媒介文本挖掘、数据新闻、计算广告、数学模型、编程工具以及开放数据。理论起源于数据,阶及模式、法则、机制,而达根本原理。将人类传播行为(开放数据)可计算化的转化过程依赖于数学模型和编程工具,专注于传播网络分析、媒介文本挖掘,而应用于数据新闻和计算广告领域” 。

祝建华、彭泰权等人在《计算社会科学在新闻传播研究中的应用》一文中指出“计算社会科学是最近10年内兴起的一种采用互联网、大数据、机器学习等计算技术来研究社会科学问题的新思潮和新方法。”[4]文中按照新闻传播研究中经典的5W模型,讨论了传播者、受众、内容、渠道和效果等要素的计算社会科学研究实例,阐释了计算社会科学与新闻传播学研究的关系,同时指出计算社会科学和网络大数据对这些研究领域的主要贡献和现存问题。

但是祝建华等学者并没有阐释计算传播学的具体内涵。在此基础之上,王成军在《计算传播学:作为计算社会科学的传播学》一文中通过引文分析、梳理计算社会科学的相关文献,分析了可计算化社会科学的基本要素和组成部分。他认为计算传播学的精髓在于“可计算性”,认为计算传播学是以网络科学为基础骨架,以计算新闻学、计算广告学为实践的知识框架。计算机模拟是计算社会科学的早期基础,但是计算社会科学的真正崛起与爆发和网络科学及大数据密不可分。

王成军将计算传播学定义为“它主要关注人类传播行为的可计算性基础,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,(以非介人的方式)大规模地收集并分析人类传播行为数据,挖掘人类传播行为背后的模式和法则,分析模式背后的生成机制与基本原理,可以被广泛地应用于数据新闻和计算广告等场景”[5]。

虽然对计算传播学的学术定义考究仅仅是近几年的事情,但是实际应用则渊源已久。曼纽尔?卡斯特在2001年提出了网络社会的概念,他认为“网络建构了我们社会的新社会形态,而网络化逻辑的扩散实质得改变了生产、经验、权利与文化过程中的操作和结果”[6]。计算传播学的分析基础在于人类传播行为的可计算性的基础。社会网络分析方法(SNA)正是研究关系,从社会网络角度考察人、关系和社会的重要方法和研究范式。早期的社会网络分析可追溯到由美国心理学家莫雷诺在20世纪30年代发展起来的、用于研究小整群体内部结构与人际关系的社会计量法。[7]但是随着大数据技术的发展,以复杂网络为基础的网络科学为社会网络分析注入了新的活力。大数据背景下社会化媒体的研究将更加丰富,例如“信息的传播与控制、突发事件的预警、谣言的散播、舆论与舆情的演化和控制等”[8]。

除了网络科学之外,新闻传播学研究需要处理大量的文本数据,因而计算传播学需要借助计算语言学作为传播内容分析的工具和方法。随着互联网的发展,尤其是自然语言处理、统计语言模型、中文分词、语言识别、网络爬虫、网页排名技术、地图搜索、新闻分类、信息指纹、搜索广告、云计算等功能的实现让“数学计算”的地位越来越重要。[9]此外,词云分析、语义网络分析、情感分析、文本聚类、主题模型、机器翻译等可以广泛地应用到新闻文本挖掘当中来。

上文已经提到,计算传播学可以被应用于数据新闻的制作。因为在大数据时代,数据在掀起信息领域变革的同时也引领了新闻媒体发展方向和传播形式新变化,其中数据挖掘、新闻可视化等被认为是计算传播学的一个具体应用。本文将着眼于大数据技术所催生的新的新闻生产模式,从新闻数据化和受众数据化两方面对新闻专业主义进行重塑。本文的创新性在于第一次将新闻专业主义置于计算传播学的视域之下探究其在大数据和信息时代的意义。同时为计算传播学理论和实践的双重发展奠定基础,能够充分研究、使用这样一个尚在成长中的理论,无疑是推动学科发展与世界同步的一个良好的立足点。

二、大数据技术与新闻专业主义的重塑

1 新媒体语境下新闻专业主义问题的再审视

伴随着新闻学在我国的创立和发展,“新闻有学无学”之争零星延续着。“从业无门槛”、“是术不是学”、“新闻是宣传”、“研究无张力”等是无学论者们的论调。20世纪80年代,随着中国新闻体制的改革,新闻生产开始被染指浓重的商业色彩。但同时由于特殊的政治环境,在政治控制与商业收买的双重挤压之下,新闻专业主义的努力进退维谷、举步维艰。

越来越同质化的内容、遍布的谣言和假新闻、处处受到禁锢的新闻采访和每天都在上演的烂尾新闻让越来越多的受众对新闻不再信任。更甚,互联网信息技术的发展创造出了一个新的领域和舞台,即互联网公共空间,使对新闻的权威性的质疑再次雪上加霜。有人认为公民新闻传播的时代已经到来,传统的大众传媒将被公民新闻所取代。新媒体的发展,尤其是社会媒体的发展,将传统媒体逼上了一条革新之路,同时也给新闻专业主义提出了新的挑战。以至于有人进一步追问,作为新闻业重要标志的“新闻专业主义”是否真的将不复存在,对新闻专业主义的坚持方向何在?

要想回答这个问题,关键在于弄清楚新闻专业主义到底是什么、其安身立命之本是什么。

20世纪90年代,“新闻专业主义”这一概念被郭镇之引入国内的新闻学研究中,他认为“新闻专业主义有两个最主要的特征——中立的把关人和客观的反映者。客观性和中立性是新闻专业主义的特征,并由此发展出一套专业的理念和技巧”[10]。在新媒体语境下,很多学者重新审视了新闻专业主义问题并达到新闻专业主义需要重构的共识。虽然新闻专业主义作为一种专业的独立性、权威性被新媒体技术关照下分权化运动所消解、拉平。但是这并不意味着新闻专业主义的沦陷,也未必预示着新闻业的全面衰落甚至消亡。

“内容为王”已然是老生常谈的话题,在新闻专业主义的指导框架下,越来越多的新闻从业者发现在以报纸、杂志等传统媒体为主的时代,优质的新闻内容是媒体的安身立命之本。优质的内容永远是稀缺资源,因此坚持“内容为王”仍然是成功的互联网媒体的核心竞争力之一。“因为更专业的报道、更专业主义的表现,在新媒体环境下,仍然是人类对新闻传播活动的不变期望”[11]。

与此同时,在操作层面,新闻专业主义还包含专业的机构设置。美国新闻自由委员会在《一个自由而负责的新闻界》中明确提出,新闻界应“从事专业化那样标准的公共服务”。也就是说,新闻报道有着稳定的规律和内在逻辑,专业性新闻机构能为持续提供高水准的新闻报道提供人力、财力和物力。相反,自发的公民新闻则不太可能获得这样的保证。

2 大数据与新闻专业主义的两个层面——以网易“数读”及今日头条为例

随着信息时代的快速发展,新闻传播方式正在发生着巨大变化。在时效性无法与新媒体比肩的困境中,深度报道应成为新闻报道制高地的最优选。互联网技术和大数据思维催生的数据新闻,不仅为深度报道带来新的发展模式,也为新闻行业带来了曙光,利用新媒体的内容将被动变为主动,这种新型的新闻报道方式将给新闻专业主义理念注入新的血液。

新闻产业包括新闻生产和新闻推广两个步骤,单单生产出好新闻而不能很好的传递给受众其效果将大打折扣。因此,一方面,新闻报道的重点应转向深入挖掘事实、加工海量信息、综合分析材料、引导受众思考的道路上来。另一方面,在机构的专业性层面,新闻生产必须由单纯的信息传播辅助以受众的挖掘和新闻精准推送才能在未来的新闻市场占据一席之地。

2.1 内容的专业:数据新闻探索者——网易“数读”

数据新闻(data journalism)或称数据驱动新闻学(data driven journalism),对于这一概念的界定众说纷纭,并常常将之与计算机辅助新闻报道和精确新闻相提并论。简而言之,数据新闻就是通过深度挖掘和展示数据的关联与模式,运用可视化手段呈现的新闻报道方式。数据新闻成为新闻学的新疆域和实践范例,并作为一门新的新闻分支进入主流媒体。

数据新闻旨在把事件发生背后的趋势和意义以崭新的方式呈现给受众。其表现方式不只有文字和配图,而是在传统表达方式基础上加上多种媒体技术,运用分析和过滤,把大量数据融合到一个整体中。开放数据、共享资源是数据新闻的特质。

国外的数据新闻制作要提前于中国国内的数据新闻尝试,其数据新闻成果和制作的成熟度也要高于国内的数据新闻作品,其中美国《纽约时报》和英国《卫报》最值得关注。国内的媒体在数据新闻方面也有一些较成功的尝试,例如网易的“数读”、搜狐的“数字之道”、新浪的“图解新闻”、央视的“据说春运”和“两会大数据”等。

网易“数读”是网易(163.com)于2012年2月成立的专门进行数据新闻制作和发布的新闻栏目,它在创立之初就将栏目定位为“用数据说话,提供轻量化的阅读体验”。网易“数读”的数据新闻主要由网易新闻中心负责制作和发布。经过四年时间的打造与完善,网易“数读”已形成一定的数据新闻制作模式,拥有一定的用户群,在数据新闻制作和用户反馈等方面呈现出一定的特色。

图2-1网易“数读”页面布局

网易“数读”的数据主要来源有调查报告、调查机构、商业咨询公司、政府部门、国际组织、大学等科研机构、媒体、网站等,也有少量的数据来源于在线数据库、电子图书馆。但网易“数读”更倾向于政府部门、调查机构、网站、国际组织等机构或组织公开的数据。这些机构或组织通常出于政治或商业目的而进行一些调查活动,得到的数据不仅数量庞大,真实性和可靠性相较其他结构也要更大,因此,更能够从来源于这些机构或组织的数据中发现当前社会中一些不够突出或被隐藏起的现象。

图2-2 网易“数读”新闻数据来源

有人称数据新闻是精确新闻的升级版,也有人称数据新闻类似深度报道。这样说的一大原因是数据新闻多是对传统新闻或消息更深层次的报道,或者是对新闻背后隐含的一些现象的报道,但这些内容来自新闻制作者对于相关数据的挖掘和分析。网易“数读”在制作数据新闻时,注重的正是对媒体广泛报道的新闻背后隐含的现象或原因的剖析,以当前发生的热点事件为切入点,通过对大量公开的数据进行筛选、整合、分析,从中找到较少为人关注的新闻点,进而展开调查进行报道。

网易“数读”数据新闻的背景均是当时国际或国内的热点话题,新闻内容是对这些事件相关内容的深层的报道。如2015年2月7日的新闻内容是探讨索契冬奥会的成本,当时正值索契冬奥会开幕,这届冬奥会被称为“史上最昂贵的一届奥运会”,新闻对索契冬奥会的各项成本以及俄罗斯民众的观点进行了分析。而2015年2月13日的新闻则关注的是世界各国对于人道主义援助的投入,而这篇新闻的背景是在西非埃博拉病毒肆虐,世界上多个国家派出了医疗队,提供了各类物品对其进行援助。2015年2月20日讨论的是发达国家的“看病难”问题,当时的一个背景是在当年的两会上看病难问题是代表们和媒体关注的一个热点。以上的事例表明,网易“数读”致力于通过数据,挖掘出热点背后的新闻。

经过简单的统计,网易“数读”的数据新闻中有超过96%的图表都是静态信息图表。虽然静态信息图表和动态交互式信息图表在展示数据和信息时,都能够充分体现制作者想要传达的信息,但相较静态信息图表,动态交互式信息图表通过用户的点击或移动鼠标获得相关信息,使用户的在互动的动作中获取相关信息,通过这样的动作增加用户的使用体验,也增强了用户对信息的记忆。而网易“数读”的数据新闻中较少使用动态交互性信息图表,从某种程度上减弱了与用户的互动,也减弱了用户对数据新闻内容记忆程度。这在某种程度上来讲,并不利于网易“数读”的数据新闻品牌的建构,也不利于其新闻内容的传播,减弱了新闻产品的影响力。随着HTML5的技术的广泛应用,数据新闻的呈现将更加多样和丰富。

从上文分析可以看到,首先,数据新闻中运用的数据并非仅靠简单的人力调查和样本采集,而是新闻媒体联合专业的数据搜集和调研机构、利用专业的数据分析软件,通过大数据和云计算等一系列互联网技术,在相对精准且大量的计算基础上获得的,数据新闻使新闻的客观性大大加强。大数据时代的新闻不再以部分样本作为报道对象,而是把目标聚焦于全体数据,影响新闻客观性的个人因素被最小化。随着云计算、大数据分析、Hadoop、Mapreduce以及模型等大数据处理技术日臻完善,实现对某一事件所有相关数据的收集、筛选、挖掘和发布已经不存在大的困难,通过对全维数据的加工整合,新闻报道有望无限接近事件本身情状。

其次,面对公民新闻和社交媒体的冲击,数据新闻能从一定程度上消解专业媒体所面临的窘境,从而进一步增强专业媒体在新闻报道中的主动性。社交媒体中的信息纷繁复杂,但是利用数据挖掘与分析技术,可以变劣势为优势,为下一步新闻报道方向的选择提供决策依据。

再者,数据新闻需要在大量复杂的数据中通过多维度的分析和比较,提取结构化数据,解释数据集间复杂的关系,发现时间表象背后的深层次原因,从而使事实以客观的数据分析结果清晰地呈现给受众,受众对新闻内容的理解由具体狭义的新闻事件扩展到整个社会环境中,实现了新闻报道从表层现实到深层现实的深度挖掘。

(责编:温静、赵光霞)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部