人民网>>传媒>>传媒专题>>人民网奖学金>>清华大学新闻传播学院

数据新闻:数据可视化在健康报道的应用与实践

赵璞

2015年03月12日13:43    来源:人民网研究院    手机看新闻

摘要:伴随着大数据时代的来临,在获取处理、挖掘海量数据的技术支撑下,如何全面展现信息的多维面向已经成为当前国际主流媒体正在集中探索的领域。本文通过分析埃博拉(Ebola)疫情爆发的可视化新闻作品,试图追寻各类媒体使用可视化新闻工具的策略、分析维度上的不同,以及辨析可视化传播对健康报道这一类专业类报道的指导意义。

关键词:可视化数据 新闻 埃博拉

     数据可视化(Data Visualization)作为概念被提出,肇始于上世纪八十年代, 是指利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域。[1]近年来,社交媒体不仅改变了媒体话语权力结构,也改变着新闻业内容生产的形态,基于数据挖掘下的可视化新闻报道开始涌现,以英国《卫报》(The Guardian)和美国《纽约时报》(NewYork Times等为代表的传统媒体开始利用网站、社交媒体平台推出例如伦敦马拉松爆炸案、“桑迪”飓风事件等可视化的数据新闻报道,利用数据流海量、准确、全面的信息优势,和视觉传播产品传达清晰,互动性强的特点,实现对复杂问题、系统性问题进行报道。作为数据新闻的先行者,英国报业巨擎《卫报》于2009年开始开设数据商店板块,不仅通过数据博客可视化新闻作品,而且向用户开放数据库的链接和搜索。[2]传统通讯社路透社也在2013年开设Data Dive频道,在财经报道中引入可视化新闻作品。

    医学健康类报道也一直是公众了解医学信息、获取健康知识,做出医疗决策的重要信息渠道,其中健康类报道对于公众对健康风险的认识乃至于健康行为有着重要影响。[3]然而健康新闻较社会类新闻专业性要求更高,涉及多领域信息广泛,对读者的阅读素养要求比同类新闻要高。而数据可视化应用于健康新闻报道中,可以实现整合信息的基础上,针对于那些很难用文字表现的信息进行全面、清晰和深入的展现。例如《卫报》的可视化新闻报道《我们为何而死》挖掘并分析了与死亡有关的上百万条信息和twitter,运用可视化技术揭示了影响人类死亡的主要因素和疾病,旨在提高大众在关注容易被传媒着重报道的传染、大流感等疾病的同时,不要忽视自然灾害、慢性疾病等致死率更高的风险。这类报道突破了以往仅依靠文字报道,却对事件的全景缺乏清晰、全面和深入的呈现的旧有展现模式。

一、数据可视化与数据新闻

    为何要谈论数据?数据本身对新闻工作来说并不陌生,早在1821年,英国的《卫报》上已经出现了数据表。[4]随着大数据时代的来临,多样化的数据来源、巨大的数据量和快速处理数据工具的出现,让海量数据分析成为可能,有助于媒体突破传统的媒介报道形态。作为增长欧洲新闻学中心(European Journalism Centre)和开放知识基金会(Open Knowledge Foundation)联合了一批研究数据和新闻的研究专家、新闻工作者后发表了一本《数据新闻学手册》,用于指导记者参与到这场新闻变革实践。米尔科·劳伦兹就提出,随着受众获取信息的渠道越发多样,新闻记者不能满足于报道“发生了什么”,而是应该通过数据整合,将工作重心从抢占事件的第一落点,转变为提供优质、全面、深刻的数据分析。[5]

    在亚利桑那大学教授SteveDoig看来,“数据新闻学就是获取信息的完全另外一种方式,数据新闻实质上是受众对数据所做的一次采访。”[6]如果说媒体记者是通过和被采访人的交流获取信息,那么数据新闻则是将寻找数据背后的隐含信息的权力赋予了公众。

    但是单纯的数据展现的方式会枯燥乏味、容易给受众的理解制造困难和偏差。因此,利用数据可视化工具制作新闻作品,已经成为了一些媒体尤其是网络媒体报道的重要抓手,也已成为数据新闻学的重要组成部分。数据的可视化通过反复抓取、筛选和重组来深度挖掘数据, 聚焦专门信息以过滤数据, 可视化的呈现数据并合成新闻故事。

    由谷歌公司资助创立的首届数据新闻奖将大数据新闻项目的创新分为三个类别,分别是“数据驱动的调查性报道”,“数据可视化和数据叙事”,和“数据驱动的应用”。[7]因此对数据可视化的理解,已经超越了视觉信息辅助文字报道的旧有概念,视觉化作业已经可以作为独立的新闻作品。

    数据可视化对于新闻报道的价值,体现在知识和信息传播的需要。借助数据可视化工具能够将抽象概念简单化,特别是可以通过海量数据的加工、整合后对将通过文字、图像难以描述的现象进行全景式的展现。纵观近年来国内外媒体在数据可视化领域的实践,集中体现在三方面:一是交互性,实现图像的动态演绎,提升用户在获取信息过程中的主动性,通过在线的数据搜集反应社会现象。例如《卫报》编辑通过邀请所有学生读者参与调查,请他们判断自己所在大学与英国其他院校的教学水平差异:结果发现读者自我对大学教学水平的判断与权威大学排名出入较大;读者可以通过实时选择观看来自自己所在大学同学的投票情况。二是多维性,这类数据可视化一方面体现为多元信息与地理信息的叠加,另一方面不依赖于传递事实,而且注重传递经验、态度、观点、意见等主观性变量。《纽约时报》对马航客机MH370“失联”事件进行报道时,模拟马航飞机从起飞到失去联系的数个小时中所处的不同飞行高度,飞行时间、飞机上可能出现的各种意外状况等多个变量通过一张图表进行了展现。[8]三是数据间的关联性。新闻报道中,每个消息内部都有一个简单的数据关联,并且包括两种数字,表示数量的数字和表示分类的数字。[9]出色的数据可视化作品往往是通过一整套数据结构和逻辑展现数据间的关系,通过数据关联和比较,阐发报道的核心主题。

 

二、数据可视化在健康报道中的实践

    本文所指健康报道特指媒体网站的“健康”一栏中的报道,以及电视媒体中对有关公众健康的报道。笔者以埃博拉疾病感染事件为例,分析和比较对于这一在全球引起恐慌的公共卫生事件,媒体是如何利用数据可视化建构报道的。

    埃博拉(Ebola virus)又译作伊波拉病毒,是一种能引起人类和灵长类动物产生埃博拉出血热的烈性传染病病,致死率很高。埃博拉病毒最初于1976年出现在当时名为扎伊尔和苏丹的两个国家,即如今的刚果民主共和国和南苏丹,当时共导致431人丧命。在扎伊尔,当初有88%的感染病例死亡。今年的西非埃博拉病毒疫情2月爆发于西非的疫情,根据世界卫生组织的数据,截至7月29日四个西非国家已报告1323个确诊或疑似病例,其中729人丧生,堪称该病毒上世纪70年代被发现以来,爆发最激烈的一次疫情。尤其是一名美国医生在非洲感染了该种病毒被曝光后,一时间引起了美国国内的巨大恐慌,甚至有国民众在社交媒体上发帖,要求不要将埃博拉病毒感染者接回美国。[10]本文选取了从2014年6月初埃博拉病毒开始被国际媒体广泛关注,到2014年8月美国公民感染上埃博拉病毒被送回国这段时间作为分析对象,从客体分析,影响范围,症状预警这三个公共卫生事件中需要及时向公众传递的信息出发,分析境外媒体数据可视化报道中,在选取数据、展现数据和分析数据等方面异同。

    客体分析:埃博拉病毒的历史

    对健康议题的报道,是媒体将现象和研究成果,转化为大众的健康知识,从而改变公众健康理念和行为的过程。[11]《纽约时报》采用时间链条的方式,对埃博拉自1976年以来诸次爆发的情况进行了汇总,用两个圆圈组成的同心圆分别表示当年爆发发现的病例数和死亡人数,特别是将每年爆发的情况与爆发地一一对应,向读者准确传达了包括20世纪以来埃博拉的爆发愈发密集、病毒致死率高,波及范围仅限于西非洲等信息。

    英国广播公司的网站同样采用了时间链条作为横轴,采集标准采用每两年为一个单位,在展现方式上采用了柱状图的结构,纵轴变量同样选取了当年发现病例数与死亡人数,与《纽约时报》相比没有强调爆发地点。从上文所提到的可视化数据的三个维度看,《纽约时报》的作品展现维度更多样,更强调数据之间的关联性。

    路透社的报道相比较于前两者,在时间轴中引入了国别的变量,与前两篇报道侧重于介绍在西非蔓延的情况不同,路透社强调这场疾病对整个撒哈拉以南非洲的实际影响,尤其是将中南部非洲受影响国家在地图中特别标注出来,传达出对疾病可能对周边国家产生影响的忧虑。《电讯报》对信息的覆盖最为全面,对埃博拉在过去几次爆发时的病毒束进行了区别,在本文所列举的四家媒体的可视化报道中,空间维度和时间维度的结合可谓最为紧密。

    影响范围:埃博拉病毒的影响区域

    英国《卫报》针对病毒的扩散,利用地图标注了西非地区现存的埃博拉病毒实验室的数量和所处位置,以及有条件治疗埃博拉病毒的诊疗中心。但是编辑并没有标注出相应的比例尺以及圆圈大小所代表的具体含义,整体内容传达信息模糊,数据的指向并不明显,更接近于信息图(Infographic)。

    《赫芬顿邮报》在同一日的数据报道中则覆盖了《卫报》报道中相对缺失的信息,特别用有差别的颜色区域对不同国家的受传染情况在同一张图上进行了标注,数据的关联性较《卫报》同类报道更强。

    症状预警:埃博拉的症状和传播途径

    媒体是公众获取健康信息的主要渠道,[16]而大众媒体对健康风险问题的报道会很大程度上影响公众对分享严重性的判断,[17]公众习惯通过从大众媒介获得的健康信息来帮助做出决定。[18]大型传染性疾病的流行,个体会加重对健康风险的判断,大众媒体便成为普通公众了解疾病预防和控制相关信息的最重要渠道。

    《南华早报》作为香港最大的英文报纸,在综合了美国疾控中心和加州大学的数据后,重点对疾病的症状和可能对人体器官产生的危害进行了细致解读。将症状的初期包括头痛、流鼻肌肉酸痛等,和症状加深后的征兆包括肾功能衰竭进行了严格区分。此外,作为香港本地媒体,它还将埃博拉与曾经在当地肆虐的SARS病毒在致死率、当前是否有成熟的治疗措施等进行了对比。

    《地铁报》作为美国都市媒体报纸,在展现同一类型数据时,重点强调了埃博拉病毒感染者在不同时间周期当中,症状和体温等易于识别的体征指数所产生的变化。这种议题的选择倾向,是由于8月1日首位美国公民感染上埃博拉病毒被曝光后,如何预防以及甄别埃博拉感染症状是美国民众最为关心的话题。

 

三、数据可视化对健康新闻的意义与启示

    密苏里新闻学院在一项针对全美健康新闻报道者的调查报告中指出,健康新闻专业性的提升,长期受制于从事该类报道的新闻记者,大多缺乏严格的公共健康领域的专业训练。这一方面体现在传递关键性信息时,由于报道者担心对专有名词的阐释不清,因此对信息的阐释选择性规避那些难于理解的部分;另一方面,大多数记者对于公众的健康素养的认知程度不准确,容易导致报道成为专有名词堆砌,或者是一味追求浅显,由于遗漏关键内容,容易衍生为谣言。[21]因此,对关键信息的翻译,尤其是将大众并不熟悉的专业性知识,转化为可供大众理解的信息,是影响健康新闻实现有效信息交流的关键。而左右“信息理解”这层横亘在专业数据提供着和公众之间的关键性因素便是数据。

    数据可视化则有助于提升专业新闻的“阐释”效果,《信息之美》一书的作者,英国《卫报》和《连线》杂志记者麦坎德利斯曾说,新闻与可视化的关系本身就很密切,两者同样致力于“信息优化”的目的。[22]新闻作品是经过对本文结构的设计和文本修辞的选择,对信息筛选、凝练,帮助读者形成清晰的概念,;同样,设计也是将大的话题分解为设计的元素和设计元件,就如同新闻作品中寻找最佳的逻辑线索和最合适的表达方式。

    在健康报道中推进可视化工作,需要合理利用“公开数据”。尤其在公共卫生领域,信息交流的过程中,数据扮演着相互理解的关键角色。公共卫生的监测数据经过多年的沉淀和发展,已经扩展到社会的各个层面和领域。[23]根据肖辉等人的研究,公共卫生领域的数据来源包括现场调查数据、社会经济类数据、疾病相关数据、自然环境数据以及实验室检测数据。不仅人的生活和行为当中蕴含着大量的数据信息,包括专业性社会组织如疾控中心、公卫科学数据中心等都面向媒体、公众提供有大量可供查询的权威数据可供参考。对健康信息尤其是专业信息的阐释,数据和图像比文字描述具有显著的优势。

    作为新闻报业中颇为资深的数据可视化实践者,麦坎德利斯认为用数据讲故事的关键在于背后的调查研究,在他看来,在数据可视化工作中只有百分之二十左右的工作是与设计有关。数据可视化的优势在于能够在单个作品中有效融合多维度信息,通过可视化工具展示事件的数据结构,因此需要通过足够的调查研究,实现新闻“数据分析”的价值,提高数据之间的关联性。例如《卫报》在2013所做的“禽流感”的可视化报道中,为了准确阐明H5N1病毒的衍生和来源,对有关的20多种相关病毒的危害性、是否传染给人类等信息进行了全面的解读。



[1]任永公,于戈(2004),数据可视化技术的研究与进展,《计算机科学》,31(12),92-96

[2]方洁,严冬(2013),全球视野下的“数据新闻”:理念与实践,2013-06,73-83

[3]Stryker, Moriarty, Jensen(2008), Effects of Newspaper Coverage on Public Knowledge About Modifiable Cancer Risks, Health Communication, 23: 380–390.

[4]参见http://www.theguardian.com/news/datablog/2011/sep/26/data-journalism-guardian

[5]参见http://datajournalismhandbook.org/1.0/en/introduction_1.html

[6]参见http://journalistsresource.org/skills/research/understanding-data-journalism-overview-tools-topics#

[7]喻国明等(2013).传播学研究:大数据时代的新范式,《新闻记者》,2013-06,22-27

[8]The Search for Malaysia Airlines Flight 370,Newyork Times, 2014-03-14

[9]王凯,贺丽,信息可视化设计,辽宁科学技术出版社,2013年5月第1版,15页

[10]美专机接两名埃博拉患者回国,《钱江晚报》,2014年8月3日,http://world.people.com.cn/n/2014/0803/c157278-25390919.html

[11]张自力(2008)健康传播的发展、现状和趋势,第六届亚太地区媒体与科技和社会发展研讨会论文集

[12]参见http://www.nytimes.com/interactive/2014/07/31/world/africa/ebola-virus-outbreak-qa.html?ref=health

[13]参见http://www.bbc.com/news/world-africa-28610112

[14]参见http://blog.thomsonreuters.com/index.php/ebola-outbreaks-graphic-of-the-day/

[15]参见http://www.telegraph.co.uk/news/worldnews/africaandindianocean/11000309/The-deadliest-Ebola-outbreak-in-history.html

[16]Johnson, J. D. (1997). Cancer-related information seeking. Cresskill, NJ: Hampton Press, Inc.

[17] Miller, B.M., Packer A.A, Barnett, Reporting Risk: Perceptions of Fear and Risk from Health News Coverage, Communication Research Reports, 28(3), 244-253

[18]任杰(2012),健康传播在疾病防治中的重要性研究,中国科技大学,博士学位论文

[19]参见http://www.scmp.com/news/world/article/1565340/ebola-outbreaks-explained

[20]http://www.metro.us/kharkivs/'kaoblast/'/news/national/2014/08/04/infographic-need-know-ebola-virus/

[21]Health Journalists Face Translation Challenge, Missouri Journalism Researchers Find, US Fed News Service, 2008.8.22

[22]龙心如,周姜杉(2014),信息可视化的艺术——信息可视化在英国,机械工业出版社,2014年1月第1版,63-67

[23]肖辉等(2013),公共卫生领域的数据挖掘,医学信息学杂志,34(12),2-5

 

分享到:
(责编:王培志、唐胜宏)

相关专题



注册/登录
发言请遵守新闻跟帖服务协议   

使用其他账号登录: 新浪微博帐号登录 QQ帐号登录 人人帐号登录 百度帐号登录 豆瓣帐号登录 天涯帐号登录 淘宝帐号登录 MSN帐号登录 同步:分享到人民微博  

社区登录
用户名: 立即注册
密  码: 找回密码
  
  • 最新评论
  • 热门评论
查看全部留言

24小时排行 | 新闻频道留言热帖