数据新闻生产的常态化趋势及其限度

林溪声

2018年03月29日15:50  
 

来源:《新闻爱好者》

【摘要】在全球进入大数据时代的背景下,数据新闻成为新闻业发展的战略方向。大数据和人工智能技术是数据新闻生产的主导力量,并带动了五种主要趋势:一是推动传统调查性报道的转型升级,有助于发现海量数据中隐藏的价值及数据关系;二是根据用户需求提供个性化服务,诠释宏观社会现象对用户的影响;三是将抽象数据具象化,突破传统叙事报道的范式;四是推动专业化数据新闻平台的搭建,提升数据新闻专业主义的标准;五是创新对突发事件的解读分析。在数据新闻生产不断丰富的过程中,开放数据与数据垄断、信息安全的竞合,可视化形式与功能的矛盾,以及跨领域与新闻专业性之间的冲突是制约其发展的关键问题。

【关键词】数据新闻;人工智能;可视化;移动化;交互性

“数据新闻”(Data Journalism),是指基于大数据技术、人工智能技术,通过对历史信息和即时信息的高效处理,更具备归纳统计能力、可视化呈现能力以及更高新闻生产效率的新型新闻报道方式。由于数据在报道中的核心地位,又被称作数据驱动新闻。现今广泛使用的“数据新闻”概念最早由《华盛顿邮报》的软件工程师兼“每个街区”网站①创始人阿德里安·哈罗瓦提于2006年提出。哈罗瓦提认为,媒体应通过计算机处理原始数据,为公众提供更重要、更有参考价值的报道,以便深刻地理解周遭世界;记者应公布结构化的、机器可读的数据,与以叙述故事为核心的报道形成互补,以适应媒介变革的需要。[1]经过业界的不断探索,数据新闻已形成一股方兴未艾的浪潮,影响着全球新闻业的格局。

一、数据新闻生产的常态化趋势

随着硬件技术和算法技术的拓展,数据新闻嵌入以关系为纽带的社会网络,广泛深入社会生活的方方面面,并以自动化、规模化、快捷化处理和呈现信息的方式,把媒体报道的覆盖范围和创造活力提升到新的高度。[2]

(一)数据驱动型调查报道

调查性报道是传统媒体最具影响力的优势产品,这种报道方式以捍卫公众利益或公民权利为己任,以揭发政治权力与市场权力种种黑幕为手段,往往需要经过媒体长期而完整的独立调查。随着互联网技术的发展,传统媒体遭遇危机,从事调查报道的采编人员逐年下降,甚至连每年提交普利策新闻奖的调查报道作品也呈下滑趋势。[3]然而数据驱动型调查报道正在西方新闻界如火如荼地进行着,与传统媒体调查性报道逐渐式微形成鲜明对比。2015年《华尔街日报》“医疗解密”系列报道是数据驱动型调查报道的典型,其以920万条数据的智能分析为基础,揭示美国医保体系的巨大黑幕,引发美国政府和行业的巨大震动,促进了美国医保体系的改革。2016年全球编辑协会新闻调查奖作品是西班牙一家非营利机构关于药品专利制度对全球药品获得性影响的调查,其基于全球发达国家和发展中国家4.5万个领域的药品价格和1.45万个领域的药品支付情况数据,进行Ruby和Nokogiri智能化搜集、处理和分析,判断出尽管医药领域的专利制度地位不可动摇,但其他制度并非不可行,在一定范围内引发了公众对制药行业现行制度的思考。

数据驱动型调查报道是大数据和人工智能时代的产物,在生产机制上与传统调查报道有明显区隔:传统调查报道的线索主要来源于个人或机构,或是根据社会舆论的关注点和社交媒体爆料来进行,而大数据和人工智能应用通过对数据的处理,成为拓展新闻线索和选题来源的新方式;在新闻生产流程和方式上,传统调查报道遵循的是“记者—编辑”的线性操作模式,数据驱动的调查报道则依赖“团队协作模式”,在具体的报道中综合运用多种技能,对团队的新闻素养与技术能力提出更高要求。[4]不同于传统调查类报道,数据驱动型调查报道的基础是海量数据的抓取分析以及多个维度的信息交叉印证,重在发现数据隐藏的价值及数据相关关系。

(二)智能化移动应用

伴随智能移动终端在世界范围内的全面普及,移动新闻客户端凭借其丰富的资讯资源、实时的信息推送和方便的社交互动被越来越多的用户认可。2016年年底,猎豹移动大数据平台结合第三方市场调研机构的数据,以中国、美国、日本、印度、欧洲为重点研究对象,分析世界新闻APP市场,结果显示:用户新闻接收渠道日益多样化,用户的阅读时间日益碎片化,用户在移动端获取新闻的主要渠道是专门的新闻APP和社交媒体APP。[5]新闻APP作为移动端首要的传播渠道,是新闻媒体重点争夺的领地,各国呈现出各自市场的特色。

在新闻生产的智能化方面,“今日头条”的小明机器人、Google的人工智能编辑,都展现出对即时信息,比如体育赛事结果、上市公司财报信息的快速搜集并智能生成新闻内容的能力。在用户界面的智能化方面,类似大数据精准营销,新闻APP基于用户个人信息、工作习惯、生活习惯等全方位信息的分析,可以对用户进行画像,判断用户对新闻内容的偏好,构成用户专属的移动新闻APP界面。

个性化新闻应用也可被视为“专属新闻”,这种新闻应用致力于以用户的需求为中心,以算法的方式将新闻精准地推送至受众群体,实现传统大众传媒无法实现的“长尾”传播。互动性更强的新闻应用是将宏观抽象的政治、经济问题转换成与用户日常生活息息相关的信息,让用户了解经济、政策等方面的改变与自身的关联程度,比如税收的调整会不会影响日用品的价格等。可以预见,根据用户需求提供个性化的大数据服务,是数据新闻未来的重要增长点。

(三)数据化叙事报道

数据化叙事报道主要是指对抽象数据的具体化,挖掘数据相关性,揭示数据的新闻价值,并制作出可视化立体文本,呈现数据背后的深层意义。正如数据新闻编辑阿隆·菲尔霍夫所说,“(数据新闻)囊括了一套仍在不断增多的用于新闻叙事的工具、技巧与方法”②。人工智能技术的突破,使机器对各类型信息的处理能力大幅提升,可分析数据对象从人们习以为常的数字,扩展为广义的文本、图片、语音甚至视频。《华尔街日报》2017年获得全球编辑协会可视化作品大奖的《汉密尔顿的韵律》(The Rhymes Behind Hamilton)基于百老汇口碑甚佳的音乐剧《汉密尔顿》(Hamilton),利用语音识别、声纹识别对音乐的押韵结构进行智能分析,让用户理解这部音乐剧的引人之处。美国商业性新媒体BuzzFeed News在2016年4月推出作品《空中密探》(Spies in the Skies),编辑团队从飞行轨迹网站Flighttradar24搜集了约200架联邦调查局和国土安全局监测器在2015年8月到12月的飞行轨迹数据,揭示美国政府的空中监控动作,并以时间序列的方式展示飞行监控的特性,吸引了众多网民的关注。

技术正推动数据化叙事报道的边际变化,比如可分析数据对象的扩展和数据挖掘能力的提升,并在改变新闻的话语形态,即从单一的封闭形态转变为融合开放的形态。数据新闻最终呈现的是丰富多元的可视化信息,这种叙事模式增强了内容的透明度和易读性,具有高度的互文性、动态性、参与性,并且是一种开放结构,接受者可以解读出不同的意义。数据新闻的范式突破,突出表现为“社交化、个人化和应用性”[6]特征,这是对传统新闻报道模式的深加工和重塑。

(四)数据新闻网站或机构

数据新闻同传统新闻的诸多差异,造就数据新闻制作团队的构成大大区别于传统新闻编辑部。基于数据新闻在数据搜集、处理和呈现等方面的特点,对团队构成和人员职责提出了更高的要求。[7]数据新闻团队除了要具备采写编评能力外,还需要掌握挖掘和处理海量数据的能力,以及一定的计算机程序编写、统计分析、制图软件的操作能力。近年来,数据新闻业最受关注的标志性事件是几大专业化数据新闻平台的建立。平台的建立带来了独立性,编辑团队对选题的掌控和主导权得到强化,推出了许多引人注目的好作品,提升了数据新闻的专业主义标准。

作为数据新闻的先驱,英国《卫报》的网站已经同《卫报》母体有了明显的角色分工:前者报道全球事件,不断开发新的新闻工具,后者则趋于本地报道。《卫报》网站下的《数据博客》《数据商店》都是数据新闻的发布平台,在两个栏目上可以看到数据报道、数据化新闻故事、数据新闻媒体群组,以及在社交媒体上广泛开展的数据新闻讨论。类似的数据新闻编辑团队还有Five Thirty Eight,它在娱乐与体育节目电视网(ESPN)支持下专注于政治选举、体育赛事预测,以及聚焦美国国内法治的数据新闻平台The Marshall Project等。数据编辑团队的专业水准则取决于团队成员的新闻敏感和数据敏感,以及各环节人员的合作情况。随着工具型应用的日益完善,对编辑团队的要求更多体现在将智能化工具与新闻专业性的结合上。

(五)突发新闻数据使用

突发新闻报道曾经被认为与数据新闻报道之间存在难以解决的矛盾:一是事件的突发性使得短时间内采集大量数据成为难题,无法为数据新闻报道提供有效支撑;二是再简单的可视化编辑也远不如文字发布的速度。[8]近两年这种局面正在改变,数据新闻题材覆盖面越来越广,突发新闻的报道也开始运用数据手段。在2015年5月美国铁路公司货车脱轨事故报道中,半岛电视台美国频道次日就能发布脱轨火车的行驶速度严重超速,正得益于之前编辑团队调查美铁列车所存储和搜集的数据。在突发事件“第一落点”的竞争中,数据新闻的优势并不明显,但在“第二落点”的竞争中可以用数据说话,呈现更加完整的背景和真相。

突发新闻与数据新闻的结合突破了传统媒体时代无法快速获取、分析、归纳历史数据的局限,为数据新闻的发展开拓了新的空间,也对数据新闻制作提出了新的挑战。针对突发事件报道,数据新闻编辑应当具有这样的能力与素养:在突发事件的高发领域做好日常数据积累,事件发生时快速搜集各方材料,事件发生后密切关注数据更新,为事件的报道解读拓展深度。[9]由于时效性的制约,突发新闻报道的可视化方法可以不复杂,但需要突出与事件相关的历史与未来、横向与纵向的数字与关系对比,并通过移动端优先的策略快速传播到受众群体,在后续报道中继续以故事化的方式对事件全方位解读。实践证明,数据新闻在突发事件报道领域并非一无是处。

二、数据新闻生产的限度

(一)开放数据和信息垄断、信息安全的竞合

数据新闻对数据的真实性、准确性、全面性和时效性提出了较高的要求,数据获取和使用的权利成为制约数据新闻快速发展的瓶颈。当前的主要数据源集中在电信运营商、主要国家机构、大型互联网企业的手中,数据源占有呈垄断形态,且在商业利益和信息安全的边界下难以形成数据互通,而“内容为王”的核心竞争需求则要求新闻业必须拥有一定的数据使用权。

在线信息是目前新闻业数据获取的重要来源,而技术的拓展和深化正让过去难以透析的互联网信息成为重要资源,数据来源更具开放性。对新闻业而言,应该基于对历史新闻报道数据需求的总结,基于对新技术条件下数据源的深度认识,对数据源形成明确的需求规划,通过公益性、商业性等不同的策略手段实现同主要数据拥有者的合作,实现对尽可能多的数据源的使用,把握数据新闻时代的战略机遇。

从信息安全的角度来看,无论是使用更多数据拥有者的数据,还是应用技术拓展数据来源,都对信息安全包括公民隐私、商业秘密和国家机密构成潜在威胁。基于新闻专业性的要求,新闻业应尽可能明确对数据使用合规性的判断和理解,对国家政府机关数据,把握好公开的度;对个人隐私数据,把握好脱敏要求;对商业经济数据,把握好应用的准确性,在充分体现新闻业社会责任的基础上,平衡好数据获取应用与信息安全的关系。

(二)可视化形式与功能之间的矛盾

数据新闻依托海量数据和新闻编辑对新闻的理解,以形象化、艺术化的方式提供客观系统的报道和良好的阅读体验。为准确、高效地处理和呈现数据,各种实用、专业、智能的处理工具应运而生。与可视化工具日趋简便、灵活相伴的一个常见讨论是:信息图表与可视化会不会带来新闻的简化?

数据新闻讲故事的能力曾备受质疑。但谷歌数据新闻编辑西蒙·罗杰斯认为,“数据新闻不是图形或可视化效果,而是用最好的方式去讲述故事。只是有时故事是用可视化效果或地图来讲述”[10]。实际上,在如何处理最佳角度呈现数据、受众之间的相关性、故事化叙述最有价值的新闻上,数据新闻必须不断进行深度挖掘以弥补天然的品质缺憾。人工智能技术在文本分析、语义分析、神经网络学习等方面的快速进展,将有助于数据新闻故事化叙事的提升。

(三)跨领域与新闻专业性的冲突

数据新闻生产过程中的互动性造就了一种“众包”的产制,但也提出了系列问题:新闻报道的主体会不会转移到数据分析师、程序员甚至高智能的机器人上?新闻传播的专业性会不会消解?

大数据和人工智能技术的成熟,意味着部分新闻生产有可能被机器取代,更意味着专业记者与各部门更普遍的合作。作为职业的内容生产者,应直面现实,更加努力于提升自身的数据素养:对大数据及其技术有较为全面客观的认识和实事求是的态度,可以评判大数据对某一问题的分析;具备一定的数据采集、处理、分析、可视化等方面的能力,追踪数据新闻生产的关键技能;具备良好的传播能力和判断力,使数据新闻生产遵循专业规范和社会规范,符合新闻专业主义的采编标准。数据新闻生产并非抑制专业新闻从业者的主体性,而是推动其全面转型,在生产传播过程中动态地传递新闻传媒的信息和态度。

三、结语

数据新闻的实践已经激发了对传统新闻生产模式的更新和改造。在数据的获取和分享上,数据新闻帮助媒体从碎片化信息中发现规律和趋势,增加了报道的广度和深度。在表达层面上,可视化的数据新闻报道有助于传播繁杂的信息,将新闻生产转变为媒体与受众之间的互动甚至多向度的众包,并进一步扩大新闻作品的应用性。在传播效果上,数据新闻提升了新闻报道的科学性和预测性,成就了跨越一定时间和空间的立体综合式报道。当下,以实现模拟人脑认知和学习能力为目标的各类人工智能技术,包括自然语言处理、语音识别与交互、视频和图像识别与搜索、机器学习与智能编辑等取得了显著进展,为数据新闻生产提供了更多创新的可能,对其发展中形成的热点趋势和有效应用需要进一步观察和反思。

(本文为2017年上海市高峰学科新媒体研究课题、复旦大学“卓学计划”项目成果)

注 释:

①“每个街区”(Every Block)是以邻里新闻和讨论为主的网站,网站提供包含美国的城市新闻、公民数据以及混合形态的信息服务。

②《数据新闻手册》在线中文版。《数据新闻手册》是为对数据新闻这一新兴领域的爱好者所出版的一本免费开源的参考书。该书始于2011年在伦敦举行的数据新闻工作坊,后通过来自包括BBC、《卫报》《金融时报》《纽约时报》等媒体的诸多数据新闻领域的倡导者与资深专家网络协作方式编写而成,并基于“知识共享协议”发布。http://datajournalismhandbook.org/chinese/。

参考文献:

[1]刘义昆.大数据时代的数据新闻生产:现状、影响与反思[J].现代传播,2014(11):103.

[2]王斌.大数据与新闻理念创新:以全球首届“数据新闻奖”为例[J].编辑之友,2013(6):16.

[3]郭之恩.式微的调查性报道[J].美国新闻学评论,2010(9).

[4]李梅,王倩楠.大数据时代传统调查报道的变革和重构[J].今传媒,2016(1):15-18.

[5]猎豹全球智库.2016全球APP发展报告[EB/OL].http://lab.cmcm.com/qygc/2016-09-02/85.html/2017-01-12.

[6]Bradshaw Paul.The Inverted Pyramid of Data Journalism[EB/OL].http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/2017-01-16.

[7]刘琼.国外报纸如何做数据新闻[J].中国报业,2016(9):36-39.

[8]任轶楠.突发事件报道如何利用“大数据”[J].新闻世界,2015(7):114.

[9]方洁,杜涵.用数据新闻报道突发事件有哪些技巧[J].新闻与写作,2015(2):67-69.

[10]Rogers,Simon,Facts are sacred:the power of data,Faber and Faber,Guardian Books,2013.

(作者为复旦大学新闻学院副教授)

(责编:赵光霞、宋心蕊)

推荐阅读

全国党报网站总编辑2018贺新春
  辞旧丹鸡鸣盛世,迎新瑞犬颂神州。新春佳节即将来临,人民网总编辑余清楚以及全国多家党报网站总编辑共同为网友们送上新春祝福!祝大家新的一年万事顺意,节节进步!
【详细】全国党报网站总编辑2018贺新春   辞旧丹鸡鸣盛世,迎新瑞犬颂神州。新春佳节即将来临,人民网总编辑余清楚以及全国多家党报网站总编辑共同为网友们送上新春祝福!祝大家新的一年万事顺意,节节进步! 【详细】

为网络空间“岁月静好” 网信工作不骛虚声
  2017年,在习近平总书记网络强国战略思想指引下,网络安全和信息化工作各项工作扎实推进,网上主旋律高昂,正能量强劲,各项法律法规进一步完善,网络空间更加清朗,网络空间国际话语权和影响力明显提升。
【详细】为网络空间“岁月静好” 网信工作不骛虚声   2017年,在习近平总书记网络强国战略思想指引下,网络安全和信息化工作各项工作扎实推进,网上主旋律高昂,正能量强劲,各项法律法规进一步完善,网络空间更加清朗,网络空间国际话语权和影响力明显提升。 【详细】