摘 要:互联网技术已将世界联结为一个整体,由此带来人类社会政治、经济、文化的深刻变化。移动互联网、物联网技术,更是催生出海量的数据及其相关的云技术的发展。在此背景下,传统新闻采访、报道方式面临前所未有的情势。数据新闻以能够分析、处理海量新闻信息、挖掘数据背后深层的宏观社会背景、着以可视化的呈现方式成为当下网络传播时代的亮点以及未来新闻报道的趋势。本文着重分析大数据时代背景下,数据新闻的采集、处理分析以及呈现的类别特性,以为进一步深入研究数据提供我们的一些思考,并对大数据技术提出反思。
关键词:数据新闻;大数据;新闻报道
互联网云技术时代深刻地变革着我们的社会生活,移动互联网、物联网的海量信息将人类带入大数据时代。云技术、大数据同样也改变着传统新闻报道的呈现方式:一种可视化的、交互的新闻报道样式,被称之为数据新闻(Data Journalism)。数据新闻在一定程度上消解了传统新闻采集、写作、报道,甚至是传者与受者之间的疆界。海量新闻的抓取、挖掘、处理分析与可视化呈现,这个制作流程不仅需要传统新闻从业者的专业知识与实践经验,同时也离不开信息处理、计算科学以及其他专业领域的从业者通力协作。数据新闻带给新闻传播领域新的视界,引起国内外业界、学界的高度关注。文本将对数据新闻制作流程的类别特性做一梳理,以期为数据新闻教学与实践提供有益的思考。
一、数据新闻出现的背景
数据新闻的出现,与互联网云技术时代相伴相随,且与大数据紧密相联。云计算相当于硬件资源的虚拟化,而大数据则是海量数据的高效处理。如果把云计算比喻为计算机的操作系统、它将大量的硬件资源虚拟化后再进行分配使用的话,那么,大数据则是海量数据的“数据库”。前者如Amazon,为云计算提供了商业化的标准。后者如Google、facebook、Twitter等前沿互联网公司为人类带来了SQL(Structured Query Language,简称SQL。SQL语言是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统)的操作[1]。技术的不断发展为数据新闻的发展提供了可能。就全球而言,欧美国家的一些主要媒体首先觉察出网络技术发展之于新闻报道的巨大影响,并迅速作出应对。《泰晤士报》《卫报》及《纽约时报》都已组成数据新闻团队,对一些重要新闻事件进行数据的深度挖掘与呈现。如《卫报》数字新闻部针对新闻选题搜集海量数据,过滤后,通过图表、互动效果图等可视化转换方式完成事件的新闻叙事。再如《纽约时报》在2007年成立互动新闻技术部(Interactive News Technologies Department)探索在线新闻报道。其利用美国总统大选、奥运会等重大新闻事件搜集海量信息、挖掘其中有价值的新闻线索,以互动图表的可视化方式呈现在《纽约时报》网站上。
2012年,由“全球编辑网络(Global Editors Network, GEN)”在全球评选“数据新闻奖”。这一奖项的设立为数据新闻的制作与普及树立了标杆。纵观其三年来的参赛及获奖作品,大多集中在欧美国家[2],反映出我国数据新闻与世界顶级媒体在数据新闻领域的差距,同时,也为我国数据新闻的发展起到某种示范作用,启发我们对数据新闻的探索与实践。
二、大数据背景下数据新闻的制作与呈现
如前所述,数据新闻与云技术、大数据之间有着十分密切的关系。有学者对大数据的特点归纳为4V,即多样性(Variety)、海量(Volume)、快速(Velocity)以及价值[3](Value)。大数据的总体架构共分为三层,数据存储、数据处理和数据分析。类型复杂的海量的数据存储依托云技术解决,数据新闻的快速和时效性有赖于数据处理层解决,最后,数据新闻的价值由数据分析和可视化呈现解决。数据新闻首先要解决存储问题,然后根据新闻事件的需要和目标价值建立起相应的数据模型和数据分析指标体系,对数据进行深层次挖掘,揭示数据所蕴含的宏观意义。由于计算机技术的飞速发展,可对数据进行并行计算和分步计算已成为可能,以保证新闻事件的时效性并通过可视化呈现出来。
(一)数据新闻的采集、处理与分析
数据新闻的生产过程包括了数据的采集、处理分析与呈现等几个环节的过程。大数据时代产生海量的即时数据,对数据抓取、挖掘与处理提出了很高的技术要求。数据新闻制作依据一定的报道意图,把存储在云端的大数据挖掘出来,再结合编辑记者的新闻理念对数据进行处理分析。这不仅要求传统的新闻从业者具有从纷繁复杂的大数据中对有价值的新闻事件的敏感与“嗅觉”,即所谓“新闻鼻”或“新闻眼”,而且也要求其具备基本的数据分析与处理能力,它同时也为与信息处理、计算科学等专业领域人士进行协作提供了平台。当面临海量、复杂的大数据时,寻求与专业人士的合作,组建数据新闻团队更能提高数据新闻报道的质量和效率。
较早开始数据新闻实践的一些世界顶级媒体,也正是以这样的理念进行数据新闻的实践操作的。芝加哥论坛报的APP制作小组自称为“潜入新闻编辑部的快乐黑客”,他们的工作包括:“与编辑和记者密切合作,帮助他们1.调查和报道故事;2.在线描绘故事;3.为芝加哥当地的特定群体建立永久的网络资源。最重要的一点是我们就在编辑部里工作,常常能在与记者面对面交谈中找到我们需要做的东西。[4]”在这些世界顶级媒体,雇佣类似的“黑客”进行数据的采集已不再新鲜。黑客能够熟练利用互联网络技术,根据记者的需求编写有针对性的工具软件,抓取记者想要采集的网络数据,或者对大量文本资料进行数据化转换,以便记者处理分析。
BBC的数据新闻团队也是包括由记者编辑、设计师、研发人员在内的人员组成,这样的团队包揽着复杂的数据新闻制作。记者编辑提供设计建议,技术人员提供技术支持和建议,合作完成数据的采集与分析处理。ABC(澳洲广播集团)的团队成员都包括:一位网页开发及设计人员、一位主编记者、一位制作人顾问、一位长于数据采集分析与整理的兼职研究员、一位专长于数据挖掘与图形可视化以及其他技术的学术顾问、一位项目经理以及ABC跨媒体平台部门的行政支持,尤为重要的是,还有一支由记者及相关人员组成的顾问团队[5]。这支团队从政府网站和公开报告的数据中汲取灵感,并让记者编辑与技术顾问在一起工作,以便及时交流沟通各自的思想。记者编辑、技术专家、数据专家一起对数据的处理分析提出建议,面对海量数据快速反应,通过合作对数据进行专业分析,并从中发现新闻报道的线索和故事。新闻记者与数据专家这两个过去没有交集的职业,在ABC的办公室里逐渐融合,共同完成数据新闻的跨领域制作。对数据采集、处理和分析的跨域合作,不仅更好地实现了大数据的采集挖掘,也促进了数据处理分析专业性与新闻性的结合。
(二)数据新闻的呈现
大数据不仅提供了多样性、海量、快速变化的信息,更重要的是提供了隐含在这些信息背后的价值。数据新闻通过对信息的采集与分析,能够挖掘出信息背后的有价值的事件线索。但如何传播这些信息,如何在新闻呈现时体现信息的价值,是数据新闻制作必须解决的难题。在尝试数据新闻的起始阶段,媒体直接将文字新闻的页面链接到APP,但这样的做法并没能带来访问量的大幅提升。于是数据新闻开始尝试将文字新闻向可视化新闻样式的拓展,利用可视化的呈现方式帮助受众理解数据,解读数据所蕴含的价值。并在大数据的基础上,试图让读者从数据中发现自己的故事。英国《卫报》是研发数据新闻较早的媒体,在其数据新闻博客(Guardian Datablog)上,《卫报》分享着新闻报道背后完整制作故事,包括数据采集、数据的可视化分析作品、以及一些以公共数据为基础的搜索引擎。受众通过个性化的搜索,寻找数据中的自己,加深对数据的理解和情感联系。然而,《卫报》并未就此停步,而是以这些数据和可视化作品为基础,继续进行数据挖掘探索,并将其编辑成一系列的新闻故事和深度报道,充分开发数据所蕴含的价值。相比于传统媒体直接将原始统计数据呈现给公众而言,数据新闻呈现更侧重于对数据的意义提供解释,呈现数据的价值。《卫报》西蒙?罗杰斯(Simon Rogers)曾举例说明数据新闻可视化的有效呈现方式,“当英国首相声称2011年8月发生的暴乱与贫困无关时,我们在有贫困指数的地图上标注了骚乱者的地址,以此来揭示这份声明背后的真相。[6]”
通过海量数据的呈现来反映新闻的内在价值,需要的不仅是可视化的技术手段,更重要的是指导数据分析与呈现的新闻理念和编辑思想。不同的新闻理念,反映在可从数据中发现不同的新闻价值。《纽约时报》的可视化作品《重塑纽约(Reshaping New York)》[7]展示了12年来纽约城市的变迁,从房屋建筑到区域划分,再到各区房价、物价及教育水平等资源的流变。报道既客观平静地展示了纽约的变化,又让这些立体的图景以无声的语言一一道出了彼时最具争议的市长布隆伯格在任12年来对纽约城市所做的工作。变化的图表展现了纽约市貌的改进,却没有体现这些改变对普通居民带来的困扰;经济指标表现了纽约经济水平的提升,却回避了高房价逼走的本土居民。数据的呈现方式给新闻披上了貌似客观公正的外衣,却遮掩了背后的事实真相。通过不同编辑理念的新闻思维和不同呈现方式的选择,可以体现出事件背后不同的内在价值。数据是会说谎的,在海量、即时的大数据面前,挖掘出数据背后的真正价值,仍然需要专业的新闻理念和编辑思想的支撑。
三、数据新闻的类型特性
数据新闻作为众多新闻报道样式中的一种,其特征也可以从内容和形式两个方面来总结。
(一)数据新闻的内容
数据新闻关注的内容主要包括两类:数据和故事。所不同的是,数据新闻的数据更为庞杂,记者的任务就是从对这些数据的处理中找到清晰的联系和深层的意义;数据新闻的故事则是从庞大的数据库中精选出来的最具代表性或者最为动人的故事。数据为故事勾画了更为宏观的图景,故事也给数据做了最为生动注脚,二者相辅相成相得益彰。
所谓数据新闻,首先就是要有数据的驱动。从历年的获奖作品也不难看出,要形成优秀的数据新闻报道,大量有价值的数据是必不可少的前提条件。以2014年的世界数据新闻奖为例,获奖作品多是数据驱动型的调查类报道。如,描绘欧洲移民故事的《移民档案》,讲述人们如何失去房屋所有权的《被夺走的家园》,专注支持新闻调查类报道的NZZ团队,以及《纽约时报》推出的“地理位置在收入阶梯中的作用”的互动地图等数据新闻项目[8]除了在形式上的创新外,所有新闻都掌握了大量的数据,并对所掌握的数据进行了核实与整理。以《移民档案》为例,这是一个由六个国家10余名记者协作完成的、包含了2769个事件,13713个移民故事的庞大数据库。记者在这些数据的基础上,对欧洲移民的历史现状以及相关政策进行了详尽报道与解读。
尽管数据是驱动数据新闻的前提和基础,但是在这些获奖作品中,数据并不是唯一重要的内容。另一重要的内容则是故事。所有获奖作品无一例外都讲述了有着深刻社会历史内涵的完整故事。这些活生生的故事赋予了数据以生命,使得存在于数据中的不再是简单枯燥的数字,而是一个个鲜活的富有生命力的人和他们的故事。条理清晰的数据配合上这些精心挑选的故事,赋予了数据新闻强大的生命力和可读性。数据和故事共同揭示的不再是简单一个故事或一个主人公,而是通过这些现象和鲜活的人勾勒出复杂的社会现象,从故事扩展到数据,推及到群体,上升到社会群体层面,提醒人们进行深层思考。
从实践操作层面看,有三种新闻类型由于其蕴含着丰富的数据和故事适合采用数据新闻的报道形式:数据驱动型调查报道、受众参与共建型全景式新闻、视觉丰富型新闻事件。随着开放数据源(open data source)的不断涌现,新闻业可利用的数据愈来愈多。如何把这些新闻富矿开采出来,如何理解这些表面上毫无规律可循的数字,并将其变成生动的新闻报道,如何从中寻找新闻线索、挖掘社会问题、解读社会现象,数据新闻还有很长的路要走。与此同时,社交网络和移动互联的发展为受众参与新闻报道提供了可能,受众可以随时随地为新闻的全景式呈现贡献各自力量。受众的无处不在带来了比记者在场更为丰富的新闻内容,并且突破了时空的限制,第一时间带来第一手资料,新闻机构将这些资料进行整合,再与受众互动,形成了信息共建的良性循环,共同对新闻事件进行全景式描述。视觉冲击是数据新闻的特色,其本身就能提供丰富的视觉符号的事件,或者适合于用多种形式展现的数据,在最终的可视化呈现上会更有优势。
尽管数据新闻成为当下的热点话题,但是必须明确的是,数据新闻只是一种报道样式,并不适用于所有的新闻报道,不能刻板地把所有新闻报道都进行数字化改造。如果仅仅为了使表面效果看起来绚丽夺目而刻意进行可视化,则会变成把简单信息复杂化的盲目炫技或跟风,反而不利于新闻信息的传播。归根结底,数据只是一种手段,新闻的关键还在于对数据背后的有价值的意义的呈现与解读。
(二)数据新闻的形式
从全球范围来看,数据新闻的报道形式多种多样,目前可大致归纳为三类,即静态图表、动态图表、人机交互。目前我国媒体使用较多的为前两种,在人机交互方面的实践并不多。
媒体的种类影响着其信息呈现的样式。如广播不具备数字可视化的条件,报刊杂志也只能使用静态图表的呈现方式,同时还受版面空间和审美等多方面的限制,电视由于其视听综合的特质成为实现静态与动态图表展示的优质平台。如2014年1月底,中央电视台综合频道《晚间新闻》的“据说春运”节目中,主持人“用大数据讲述了春运背后的故事”。故事是通过一张最新迁徙动态图给出的,黑色的背景中勾勒出中国地图的轮廓,不同的城市间用连接线条标示出人们往来移动的线路,动态的线条在视觉上形成了城市间的流动感。同时辅以百度指数提供的热词分布表,以便进一步解释当年春运的现状。这种报道方式更加直观地展示了春运的现状,准确地对春运进行了全景描述,在视觉上带给人一定的享受。
比传统媒体相比,网络媒体与数据新闻之间有着某种天然的“亲密关系”。尽管我国目前并没有专门进行数据新闻报道的门户网站或APP(第三方应用程序),但一些媒体借助微博、微信等社交媒体或一些门户网站的平台及时的发布新闻。
1.静态图表。静态图表有简单、复杂之分。简单静态图表多为一些较为直观的频率分布表或趋势走向图。复杂静态图表通常用来报道一些较为复杂的社会现象,或者解读一些相对复杂的政策报告。在理清事情发展脉络或事物间的关系方面,静态图表有其独特的优势。通过静态图,可在复杂的时间线索中抽出主线,清理旁支,使复杂现象在视觉上一目了然。
2.动态信息图。静态信息图可以展现一个平面的事物,或者说一个二维空间的信息。一旦涉及到多个维度,则需要动态信息图进行补充。动态信息图能够反映注重某一新闻事件的多维角度,呈现事物发展的动态过程,或将时空等多维度视域进行融合报道,或通过简单图表的动态结构清晰呈现事物多个层次,不仅能清晰提供更为立体的大量信息,还能通过动态的变化画面,吸引受众注意。
3.人机交互。在人机交互方面,引领风气之先的是欧美一些主流媒体和专业数据新闻门户网站。如BBC“你是全球第几个出生的人”,就是基于现有人口数据,实现人机交互的报道。受众按照要求填写自己的姓名、出生时间之类的信息,系统便会粗略算出答案。这种交互人机互动满足了受众的参与需求,其不仅提高了主动获取信息的兴趣,还在很大程度上增强了信息传播的效果。
受众既是事件的亲历者,又是报道的直接参与者,而且还是新闻事件的受者与传者。人机交互更多的是报道理念的一种变化,把新闻生产变成所有人共同参与的事情,新闻机构只扮演信息汇总、整理的角色。目前人机交互还刚刚起步,要真正做到人机交互,还有一段很长的路程。
四、结论与建议
(一)数据的采集
数据是数据新闻的核心所在,获取数据是数据新闻的第一步,不断拓展数据的来源就成了数据新闻发展的重要环节。一方面,新闻机构可以寻求外部的帮助,与数据挖掘、程序员等专业技术人员合作,拓展数据获取的渠道。不仅要报道官方公布的数据源,还要通过计算科学技术深入挖掘现实社会深层的有价值的信息,用数据来驱动新闻报道。另一方面,还应该充分吸纳受众参与,开放数据源,进而实现数据的共享与共建。
(二)数据的利用
对数据的理解利用是考察数据新闻制作水平的关键环节。理解数据,不仅要多维结合,扩展数据的广度,还要根植社会现实,挖掘数据的深度。其中新闻理念、编辑思想是牢牢树立在其中的主线。即在拓展数据广度、挖掘数据深度时,明确拓展与挖掘何为,探索有价值有意义的数据联系。数据和故事相联系,新闻与意义相契合,才能最好地利用数据展示新闻的社会价值,促进社会发展。
(三)数据的呈现
可视化是数据新闻呈现的重要工具,几乎所有的数据新闻都在视觉效果上做足了功夫。无论是静态图表的绘制还是动态图示的设计,都在美观和易读方面抓取了受众眼球,成为当下最为耀眼的新闻“明星”。
然而,数据新闻呈现的可视化应以明确的新闻理念和编辑思想为指导,否则,数据挖掘、拓展以及可视化的呈现就会流于表面,成为炫耀的苍白图式,
(四)避免唯技术论的巢穴
无论是数据挖掘还是可视化呈现的技术,仅仅是一种示现表达的工具。酷炫的可视化效果固然引人入胜,但如果不是建立在有价值内核的新闻价值基础之上,流于表象的形式主义终究是没有生命力的。
数据新闻强调的是数据思维、数据理念,是透过数据的一种洞察力。数据新闻为新闻报道注入的,是一种新的报道视野。从内容来看,与传统的基于记者敏锐的洞察力和新闻敏感相比,数据能轻松地找出不同寻常的新闻线索,并能在看似毫不相关的事物中找到联系,探寻线索背后的社会根源以及解释社会因素间的复杂联系,这些都对记者提出了更高的要求。在技术的辅助下深挖内容,在有技术支持的基础上呈现更深层次的内涵,才是数据新闻与传统新闻报道的本质区别所在。
(王锡苓系中国传媒大学新闻学院教授、博士生导师、民意与传播研究所所长;王 荣系中国传媒大学新闻学院博士研究生)
参考文献:
[1] 邱文斌.云计算和大数据二者的区别[EB/OL].来自微信公众号:智慧城市圈子.
[2] 周婷婷,陈琳.数据新闻实践的前沿发展——以全球“数据新闻奖”2013年获奖作品为中心的分析[J].新闻前哨,2014(1).
[3] 彭兰.大数据时代:新闻业面临的新震荡[J].编辑之友,2013(1).
[4] Brian Boyer: <How the News Apps Team at Chicago Tribune Works>, <The Data Journalism Handbook> , Chapter 3.
[5] Wendy Carlisle: < The ABC’s Data Journalism Play>, <The Data Journalism Handbook>, Chapter 3.
[6] Simon Rogers: < Behind the Scenes at the Guardian Datablog> , <The Data Journalism Handbook>, Chapter 3.
[7] http://www.nytimes.com/newsgraphics/2013/08/18/reshaping-new-york/.
[8] 数据来自Data Journalism Award – 2014 shortlist http://www. globaleditorsnetwork. Org / programmes / data-journalism-awards / 2014-shortlist/.