人民网>>传媒>>传媒期刊秀:《新闻记者》>>2015·第2期
人民网>>传媒>>正文

数据新闻何以重要?【2】

——数据新闻的发展、挑战及其前景

郭恩强/编译

2015年05月27日14:36  来源:新闻记者  手机看新闻

数据是一种战略性资产

传统纸媒的危机自不待言。在这种背景下,发行人和编辑们要决定哪些业务要砍掉,哪些领域要去投资,就变得更加谨慎。在数字化新闻环境下,尽管数据驱动新闻业有其前景和重要性,但一些媒体还是选择关闭其致力于数据分析的部门。例如,“数字第一媒体”(Digital First Media)在2014年4月关闭了其致力于生产视频和数据产品的“霹雳”(Thunderdome)项目。

2014年,数据新闻业进入了主流媒体。纳特·西尔弗(Nate Silver)在“娱乐与体育节目电视网”(ESPN)开办了全新了的“五三八”(FiveThirtyEight)网站,《纽约时报》开办了“结局”(The Upshot)网站。这些新入行者能否实现商业上的成功仍是未知数,但是,对于数据新闻业而言,除了广告以外有更多的商业模式。从能够提供关于世界的洞见这一意义上看,数据可以被认为是一种战略性资产。专有数据是能够驱动巨型公司的商业模式的宝贵资源。在华盛顿特区,从硅谷到华尔街再到情报机构,数据科学家被当成热门商品,这是有其原因的,那就是他们能够从公共的和私人的海量数据中创造有价值的知识。类似的,对冲基金公司使用《信息自由法案》(Freedom of Information Act)去购买政府数据也是有其理由的,因为对于投资管理而言,数据是有用的商业情报。

我们将自己看成一个在新闻领域打拼的科技公司

当数据驱动的超本地新闻和数据报道的收入模式,处于可能繁荣也可能夭折的不明朗之时,非营利机构如ProPublica和《得克萨斯论坛报》(Texas Tribune)却将目光放在了利润之外。论坛报如今是在线媒体中闪亮的一员,聚焦于报道本州事务。凭借其在交互式体验和数据可视化方面的成功,它如今成为美国数据新闻重要的典范之一。

目前论坛报拥有超过200个可视化产品和工具,其中包括一项公立教育检索工具和一项高等教育检索工具。后者收集和公布了得克萨斯州每个高等公立院校的财政、人员和教育表现数据。

论坛报收集数据的范围广度和精细程度,确实让人印象深刻。它的在线流量和公众对产品反馈的兴趣,使之成为研究新闻业未来的重要案例。尤其是,在论坛报受欢迎的产品中,数据产品占了大部分。其中,论坛报的数据图书馆和公职人员列表贡献了大部分的流量。类似的数据图书馆在新闻界还是少见的。

“我们将自己看成一个在新闻领域打拼的科技公司,而非一个使用科技手段的新闻媒体。”论坛报的首席创新主管罗德尼·吉布斯(Rodney Gibbs)解释说:“我相信,这个信念让我们轻装上阵。我们的科技团队并不大,有4个全职的开发人员加上一个行政专员,他们就足够维持我们的主要网站、数据APP和每月发布的可视化工作了。另外,我们两个数据记者在整个编辑室内进行巡回工作,所以即使不是数据通的记者,也可以为他们的故事搭配数据和可视化工具。换言之,这里的人无需坚信数据的价值,因为点击量和受众反馈已使我们所有人都成为数据的信徒了。”

ProPublica在2014年2月推出了自己的数据商店,免费发布原始数据,同时也出售给那些愿意额外付钱购买其他附加值数据的客户。克莱因写道:“在数据商店,你可以找到我们在报道中使用的数据,而且数据量还在增长中。如果是原始数据,比如我们从政府来源得到的数据,你会发现一个免费的下载连接,只需对一份简化版的使用条款表示同意。如果是需要在政府网站上下载的数据,我们简单地将其链接到原网站上,来保证你快速得到最新数据。”2014年4月,ProPublica网站宣布,将数据商店的范围扩展到报道中使用到的所有数据,此举引发强烈关注。“如果你观察诸如美联社、路透社和彭博社这样的新闻室,会发现他们的核心内容是数据产品,其中一些真的非常挣钱”,克莱因对《哥伦比亚新闻评论》 (Columbia Journalism Review)表示,“无疑,对很多新闻编辑室来说,销售数据产品是个创富机遇”。

数据新闻助力机器人新闻业

数据在其他冒险事业中也将扮演一定角色,也许将为“机器人新闻业”提供助力。如“叙事科学”(Narrative Science)公司提供的一种自动编写新闻的服务。2014年3月,有关洛杉矶地震的第一篇报道就是机器人写就的。它的开发者是《洛杉矶时报》的记者和程序员肯·史文切克(Ken Schwencke)。这不是首个“机器人记者”(roboporter),在此之前,基于类似算法,他们还开发了一个有关谋杀报道的新闻机器人。

由自动编写的软件来完成本地交通、天气、高中运动会、警方通报等的新闻报道,看来是不可避免的趋势,尽管人类编辑仍需在机器人记者写的文章上起作用。“当了几年的本地新闻记者,我可以说,编写简报,统计诸如谋杀、地震、火灾这些文章,本质上就像是疯狂填词(Mad Libs)游戏,完全可以让机器来干”,威尔·瑞摩斯(Will Oremus)写道,“……但同时,地震机器人(Quakebot)也清晰地揭示了自动化编写程序的局限。它无法评估地面的损失,不能采访专家,无法辨别故事中相对有价值的角度”。

短期内,这类新闻机器人(newsbots)的最大用处,可能是充当编辑记者的早期预警系统,在一片杂音中寻找新闻线索做好标记,好让记者们去分配任务,调查核实。这种类型的数据新闻能挑拣和抓取信息,发出警报,很可能会受到城市新闻编辑的喜爱。此类自动化已经得到广泛应用,从政府问责到金融报道都有所涉及。“我们希望赋予这种监控和预警功能更多东西”,阿隆·菲尔霍夫表示,“我们每年都会收集上百万条有关竞选捐助与支出的信息。举例来说,如果一个国会成员遇到麻烦,你会在法律服务那栏看到标记着相关变化的情况。此时,系统会向报道国会新闻的记者发去提醒。这样就能运用科技,提高记者的工作能力”。

也许有一天,情况会发生改变,正如“叙事科学”的联合创始人和首席技术官克里斯蒂安·哈蒙德(Kristian Hammond)对史蒂文·列维(Steven Levy)说的那样:

相信随着“叙事科学”这个软件的成长,它编写的故事会位于新闻产业链的上端——从产品新闻(commodity news)到解释性新闻,甚至是细节丰富的长篇报道。也许在某种程度上,人类和程序可以合作,各自完成自己的强项。计算机,凭借其无瑕的记忆能力和对数据的抓取能力,也许可以充当人类记者的助手。或者相反,人类记者可以采访一些对象,整理出遗漏的细节,然后发给电脑让它来完成文章。随着电脑越来越完善,能取得越来越多的数据,它们作为故事讲述者的局限性将被打破。“人类确实具有令人无法置信的复杂性和丰富性,但它们是机器。也许20年内,将不再存在‘叙事科学’不能写出报道的领域。”

(作者系:华东政法大学科学研究院助理研究员,法学在站博士后。)

(本文编译自亚历山大·本杰明·霍华德(Alexander Benjamin Howard)撰写的《数据驱动新闻业的艺术与科学》(The Art and Science of Data-driven Journalism)研究报告的第三部分,该报告由哥伦比亚新闻学院TOW数字新闻中心发布。)

上一页
(责编:汪倩(实习生)、宋心蕊)



我要留言

进入讨论区 论坛

注册/登录
发言请遵守新闻跟帖服务协议   

同步:分享到人民微博  

社区登录
用户名: 立即注册
密  码: 找回密码
  
  • 最新评论
  • 热门评论
查看全部留言

24小时排行 | 新闻频道留言热帖