人民网
人民网>>传媒>>人民网奖学金>>南大2015

中国数据新闻的发展历程

郑峰山
2016年03月01日14:04 | 来源:人民网研究院
小字号

摘 要:中国数据新闻的发展,经历了从最初的新闻报道简单复制、罗列一些数据,到数据更加丰富详实、数据新闻报道的数量增多,再到“数据新闻”的正式诞生:注重对数据的挖掘、分析,并借助可视化手段呈现。中国的数据新闻虽获得了较大发展,但目前的发展水平依然与西方国家有较大差距。本论文试图梳理中国数据新闻的发展历程:首先介绍数据新闻的诞生;然后以网易两会专题报道为例,对中国数据新闻近十五年的发展进行分析;重点介绍其发展现状;最后探索中国数据新闻的发展路径,以帮助大家更好地了解中国数据新闻的发展,并为其进一步发展提供借鉴。

关键词:数据新闻;精确新闻;两会报道;大数据新闻

数据新闻这一新兴的新闻报道方式,被视为未来新闻的发展趋势,虽然已经成为学界的研究热点,但是研究其发展历程的论文非常稀少。本论文聚焦于中国数据新闻发展历程,共分为四个部分:第一部分,讲述了数据新闻的诞生;第二部分,采用立意抽样,以定量分析为主、定性分析为辅,对网易2004年、2009年、2014年的两会专题报道进行纵向和横向分析,梳理中国数据新闻近15年的发展过程和各阶段特征;第三部分,分析中国媒体2015年的数据新闻报道,来说明中国数据新闻的发展现状;第四部分,探索中国数据新闻的发展路径,针对其发展存在的问题提供建议,并展望数据新闻未来的发展方向。

一、数据新闻的诞生

(一)数据新闻简介

数据新闻从广义上讲,就是用数据说话的新闻,这种新闻形式早已有之。正如欧洲新闻中心的莉莉安娜·博内格鲁所指出的,使用数据以改善新闻报道的做法可追溯到“数据”问世的年代。 例如《卫报》首个使用数据新闻的案例可以追溯到1821年5月5日创刊第一期的一篇报道,它使用表格列出了曼彻斯特的各个学校的学生人数和所付的学杂费用。但是在这些原始的数据新闻报道中,由于数据新闻的数量规模较小,报道中所容纳的数据量有限,呈现方式单一、原始,所以数据新闻还未能成为一种独立的新闻报道方式。数据新闻走上独立、繁荣发展的道路是在近几年,借助丰富的数据资源、先进的数据处理以及可视化技术,它在数据量、可视化、交互性方面都实现了质的突破,产生了巨大的影响,从而被西方视为一种新兴的新闻报道方式,并正式提出了“数据新闻”这一概念。

现在所说的数据新闻,是指针对新闻选题,运用社会科学研究方法对数据进行收集、过滤、挖掘,然后借助可视化手段对数据信息进行组织与呈现的新闻报道。舍恩伯格认为,数据化是指一种把现象转变为可制表分析的量化形式的过程,它需要从数据中挖掘出巨大价值,然后揭示出深刻的洞见。 这句话启发我们,数据新闻的核心之一正是数据化,它也往往需要借助图表来分析、呈现,并有利于揭示出深刻的洞见。数据新闻随着大数据的兴起而繁荣,在大数据时代,思维转变、数据处理与可视化技术的进步以及丰富的数据资源,给数据新闻的发展提供了良好条件。它被人们视为未来新闻报道的趋势,并诞生了一门新的学科“数据新闻学”。

(二)数据新闻的诞生

数据新闻是精确新闻在大数据时代的进一步发展。精确新闻由美国著名学者与记者菲利普·迈耶于20世纪60年代提出,它是指借助社会科学的调查研究方法,对社会现象或新闻事件进行调查研究,然后对所获取到的数据进行挖掘,用数据说话,从而使新闻报道更加客观、公正、准确、全面。该新闻报道理论在20世纪70年代风行于美国新闻界,后传遍世界各国新闻界。20世纪80年代,中国新闻界开始运用该新闻报道理论报道新闻。郭晓科认为:“数据新闻学是精确新闻学的进一步延伸,数据新闻学使新闻生产过程更为精细化,它对新闻工作者的技能要求除传统的文字写作、音视频制作外,还包括社科研究方法,计算机数据抓取、处理、可视化,平面、交互设计,计算机编程等多个领域。”

欧洲新闻中心的莉莉安娜·波内格鲁在《数据新闻手册》中提到,有关数据新闻最早的表述之一,是由EveryBlock的创始人阿德里安.哈罗瓦提(Adrian Holovaty)在2006年提出的:阿德里安.哈罗瓦提认为记者应公布结构化的、机器可读的数据,而抛开传统的“大量文字”。 而数据新闻引发广泛关注始于2010年,维基解密先后将美国有关阿富汗战争和伊拉克战争的绝密文件泄露出来,这些文件包含了数以万计的数据,为了让大量的数据更易于理解,发布的阿富汗战争文件就使用了独立第三方的数据可视化技术。这也进一步刺激了各大媒体采用可视化手段呈现绝密文件中纷繁复杂的数据,例如《卫报》采用数据地图呈现伊拉克战争中所有人员的伤亡情况,《卫报》的数据新闻也因此而名声大震。蒋瞰指出,英国《卫报》最先采用“数据新闻”这一术语,自2010年7月,维基解密泄露阿富汗战争文件后,这个概念被广泛使用。之后,数据新闻这一概念在2010年下半年,开始被学术会议和期刊运用。

而“数据新闻”这一术语传入中国并引起业界、学界的关注则是在2013年,有关数据新闻研究的集大成之作《数据新闻手册》的中文版于2013年在网上面向读者开放,推动了“数据新闻”这一概念在中国的普及。这本手册由欧洲新闻中心和开放知识基金会共同开发,由诸多国外数据新闻专家于2011年合作编写而成,它不仅解答了数据新闻的含义、价值,而且讲述了国际各大主流媒体数据新闻实践案例,也详细地讲述了如何获取数据、理解数据、展现数据以及用到的各种工具,是第一本有关数据新闻的系统著作。中国最早的一篇关于数据新闻的研究论文,是由清华大学国际传播研究中心的李希光和张小娅于2013年1月15日在《新闻传播》发表的《大数据时代的新闻学》,该论文对《数据新闻手册》的主要内容、重要案例进行了介绍和概括。

(三)数据新闻的作用

揭示深刻的洞见。数据新闻通过对大量数据的收集、深度挖掘和分析,有利于发现数据之间的联系,揭示出深刻的洞见。在2011年的伦敦骚乱发生后,英国政治保守派认为主要原因是社交媒体的谣言鼓动了骚乱的发生,并据此要求暂时关闭社交媒体。《卫报》与学界进行合作,对260万条关于骚乱的推特信息进行了挖掘分析,以数据地图的形式显示出骚乱发生地点的贫困状况,揭示出了骚乱与贫困的密切联系,从而推翻了保守派的结论。

将复杂故事简单化。数据新闻借助可视化手段展示诸多关联数据,将数据之间存在的复杂关系非常直观地呈现给受众,增强了新闻报道的易读性,有利于受众更好地理解新闻事件,并留下更深刻的印象。“数据新闻最重要的一项功能是使用数据可视化软件,通过统计大量的数据,帮助记者使用数据图表讲述错综复杂的故事,而这种讲故事的方式必须依赖于对大数据的分析和可视化处理,由于数据量巨大,按照传统的新闻生产方式是几乎不可能实现的。”

良好的交互性。一方面,数据新闻增强了新闻报道与个人的联系。例如,腾讯《数据控》于2013年12月11日发布的第44期报道《超生会被罚多少钱》,就在图表中设计了帮助读者计算社会抚养费的互动环节,读者只要输入夫妻二人的年收入、省份、罚款倍数、户籍这些信息,图表就可以自动算出超生所需要缴纳的社会抚养费。财新网也曾制作了摇车号的游戏,月度指标数据配合虚拟的未来摇号总数,就可以帮助用户随机算出是否摇到了车号,从而增强了新闻报道的互动性。另一方面,读者可以参与数据新闻的制作,实现众包生产。媒体将使用的数据以及软件公开给受众,允许受众下载使用,进一步实现了数据的再利用。田加钢指出,《卫报》数据新闻的一个鲜明特色在于,它将制作新闻所使用的数据完全公开在“数据博客”页面上,所有数据新闻所使用的原始数据均可以免费下载,供公众用来做进一步分析。

二、中国数据新闻的发展历程

中国网络媒体走在数据新闻实践的前沿,搜狐早在2011年5月21日就推出了中国最早的数据新闻栏目《数字之道》,而其它网络媒体开始集体试水数据新闻始于2012年,例如网易的《数读》(2012年1月13日上线)、新浪的《图解天下》(2012年6月4日上线)、腾讯的《数据控》(2012年12月3日上线)等。之后,传统媒体也开始探索这一新兴的新闻报道方式,央视《晚间新闻》于2014年1月25日正式推出的“据”说系列节目的影响,使数据新闻迅速升温,成为中国学界、业界的热点。

而在四大门户网站中,网易在数据新闻实践方面做得最好。网易不仅在2012年1月就推出了《数读》,而且它更新速度最快、报道量最多,数据来源渠道更加多元,选题也更具国际视野。而每年的两会报道,又具有典型性。因此,本论文采用立意抽样,以网易2004年、2009年、2014年的两会专题报道中的数据新闻报道为例,将“以数据为基础设置新闻议题”作为选取数据新闻的标准,对这些数据新闻报道进行分析,来说明中国数据新闻近15年的发展过程及在三个发展阶段的特征。

(一)网易2004年的两会专题报道

在网易2004年的两会专题报道中,共找到并分析了《1100亿元国债投资边调减边调向》《政府工作报告让城乡群众直接受益1936亿元》《回望2003:北京去年新增城镇就业42万人》《回望2003:北京一年内新增地名桥名384个》《两会数字:大会收到提案4312件》《沪磁浮列车40余天运客20万 不久将正式投入运营》《回望2003:北京37件实事已落到实处》7篇数据新闻报道。

网易2004年的两会“数据新闻”,大都是对政府报告中的数据进行简单复制,或者简单引用文献资料、相关人士说的数据,报道中包含的数据量也较少。除了《两会数字:大会收到提案4312件》对数据进行了浅层挖掘,其它报道都缺乏对数据的主动挖掘。从总体上看,该时期的“数据新闻”数量以及新闻报道中包含的数据量少,而且对数据缺乏挖掘,也都没有采用任何可视化手段。

(二)网易2009年的两会专题报道

在网易2009年的两会专题报道中,共找到并分析了《吴邦国:2008年共审议15件法律案 通过9件》《温家宝:8500亿医改和近6000亿减税不在4万亿中》《曹建明:去年共查办厅局级国家工作人员181人》《曹建明:去年抓获在逃职务犯罪嫌疑人1200名》《曹建明:侦查官员商业贿赂案10315件 涉案21亿》《曹建明:纠正181人次超期羁押案 比上年增113.%》《王胜俊:排查处理重点信访案件36727件》《王胜俊:2008年最高人民法院受理案件10553件》《王胜俊:审结劳动争议案286221件 同比升93.93%》《经济成“温家宝总理记者会”提问焦点 约占2/3》《两会车队运行精确到秒》《陈竺:职工医保封顶额明年拟升至人均10万》《王胜俊:共判处罪犯1007304人 有效震慑犯罪》《高强:美国军费是中国的11.8倍》《两会期间股市微涨1.7%》《温家宝:09年GDP增长目标8% CPI涨幅4%左右》《温家宝:三年内中央财政将向医改投入3300亿》《温家宝:中国GDP超过30万亿 比上年增长9%》《中国扩增财政赤字至9500亿创建国60年之最》等共19篇数据新闻报道。

网易2009年的两会“数据新闻”依然以政府工作报告为主,但数据新闻报道数量大幅增多,而且数据更加详实、精确,主要原因在于政府工作报告本身对数据更加重视,最典型的就是最高法和最高检的工作报告。不过在这些报道中,《经济成“温家宝总理记者会”提问焦点 约占2/3》《两会车队运行精确到秒》开始注重主动挖掘数据了,而其它的数据新闻报道仍然都是对政府工作报告的简单复制,缺乏对数据的主动挖掘。该时期,采用可视化手段的数据新闻报道数量仍然为0.

(三)网易2014年的两会专题报道

在网易2014年的两会专题报道中,像2004年、2009年那样,简单复制政府工作报告的数据新闻报道数量仍然很多,包括2篇最高检察院工作报告、6篇最高法院工作报告、1篇政府工作报告、4篇两会发布会报道,在此不再一一列出。本论文重点分析了《两高报告表决背后:代表因个案遭遇不公投反对票》《媒体解读政府工作报告10大关键数字》《99.3%的代表给总理报告点赞》《今年政协提案5875件 1/4关注民生(图)》《16年总理记者见面会盘点:三任总理回答208次提问》《中国现任31位省级纪委书记近2/3为异地空降(图)》《四川取消279项行政审批 3年为企业免税千亿元》《"两高"报告表决获最多反对票 引现场惊叹》共8篇数据新闻报道。

网易2014年的两会“数据新闻”,主动挖掘数据与可视化特征凸显。注意主动挖掘数据的数据新闻报道共有4篇:《媒体解读政府工作报告10大关键数字》《中国现任31位省级纪委书记近2/3为异地空降》《今年政协提案5875件 1/4关注民生》《16年总理记者见面会盘点:三任总理回答208次提问》。而采用可视化手段的数据新闻报道也共有四篇:《"两高"报告表决获最多反对票 引现场惊叹》《两高报告表决背后:代表因个案遭遇不公投反对票》《中国现任31位省级纪委书记近2/3为异地空降》《今年政协提案5875件 1/4关注民生》。但是,中国“数据新闻”的发展还处在起步阶段,与欧美差距巨大,主要体现在对数据的深度挖掘、可视化技术以及互动性方面。

附分析图表:

(责编:王妍(实习)、燕帅)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部