人民网>>传媒>>传媒专题>>传媒期刊秀:《今传媒》>>2014年·第7期

数据驱动新闻的技术化迷思

石 磊

2014年07月25日13:53    来源:今传媒    手机看新闻

摘 要:数据驱动新闻是大数据技术与新闻业结合的新兴概念,旨在利用科学的算法,从海量的数据中,发现新闻线索。但这一新兴的技术构想存在与新闻人文价值追求的不匹配之处,譬如概念的泛化、数据基础的缺乏,以及数据的真实性和灵活性问题。作者认为,数据驱动新闻只是一种工作方法的改良,并不能从根本上改变新闻的本质;盲目迷信数据的价值,只会迷失新闻的人文追求。正如人的幸福是数据所不能精确描述的领域,“数据驱动”的发展面临从理论到现实的多重制约。

关键词:数据驱动新闻;技术偏见;数据可靠性;数据科学;人文取向

“大数据”是近年来传媒领域的热点,一种最具代表性的说法,就是“数据驱动新闻(Data-Driven-Journalism)”(或称“数据新闻”)。最早开展数据驱动新闻实践的包括了英国的《卫报》和美国的《纽约时报》,时间是2009年。其后不久,一群芬兰新闻学者发布了《数据新闻趋势》研究报告,欧洲和美国一些从事数据新闻实践工作的探路者在互联网上合作编写《数据新闻手册》,正式在世界范围内掀起了一股数据新闻热潮。

从概念上讲,数据驱动新闻强调利用数据科学发现新闻。目前最广泛传播的观点认为,数据驱动新闻是一个基于开放数据和开放工具的分析和过滤大规模数据的过程[1]。从新闻业务的流程来看,数据驱动新闻是深入挖掘数据的一个过程,包括收集、筛选和结构化数据,依照特定报道目的实现信息过滤,通过可视化技术实现信息呈现[2]。

从技术操作的效果看,数据驱动新闻有利报道者发掘新的观察视角,挖掘独家报道内容;荷兰数据新闻记者Henk van Ess提出,这种报道的过程“倾向于展现问题的各个方面,而不是解释问题”[3]。香港学者祝建华提出,数据驱动新闻所用数据是公开的,所用工具资源也是共享的,这是数据驱动新闻的一个特质[4]。

而从最终的信息呈现来看,数据驱动新闻就是要把事件发生背后的趋势和意义以融合的方式完整的呈现给受众[5]。也有学者分析了数据新闻报道的趋势性特征,比如文卫华提到,区别于一般以文字叙述为主的新闻报道,数据新闻是以数据为中心,密切围绕数据来组织报道[6]。又如彭兰提出,在大数据等技术支持下,新闻中所需要的信息资源,将发生结构性变化,新闻中的事实、要素、背景等信息越来越多地通过自动的方式进行采集,并通过相关的技术进行过滤、分析[7]。

综上所述,数据驱动新闻体现了大数据技术对新闻业务流程的改造,使新闻生产效率和新闻呈现形式都发生了重大的变化。但这一新兴的技术构想如同所有技术化的迷思一样,仍存在与新闻人文主义价值追求的不匹配之处。

一、概念的技术化

通过对以上概念回顾可以发现,“数据驱动新闻”这一概念的核心是处理已有数据,而不考虑数据的来源;只谈技术可行性,这种定义方式从一开始就打上了深厚的技术论印记。

数据驱动的说法忽视了新闻传播中人的主体地位,将人视为数据的搬运工和盲从者。有人认为,“数据正变得越来越重要,这并不是因为数据的量大,而是我们拥有了工具和能力去分析数据,找出模式、结构并揭示趋势。[8]”此说法不正确。人类使用技术的动机,并不源于技术的可能性,而来自人类社会解决新问题的需求。我们没必要把技术的优越性当作技术的合法性。大数据技术之所以产生作用,其原因在于,过量的信息阻塞了我们信息处理流的“出水口”,让我们对新闻与一般事实的区别产生了偏差。而大数据技术就是帮助我们理清数据的工具。换言之,“驱动”的概念是将新闻视作被动的商品,把大数据技术放大成拯救这一商品的灵汤妙药,这是置新闻活动主体的能动性于不顾。

数据驱动新闻并没有从根本上改变新闻的本质。正如刘建明所说,“大数据……不具有崭新的时代特征。”刘建明认为,大数据作为一种海量信息的处理分析方法,仅仅是诸多信息技术的一个子集;从根本上说不具备物质生产和社会管理的革命性[9]。从历史的角度看,数据驱动新闻与20世纪中叶在美国风靡的精确新闻思潮有继承关系,精确新闻强调在报道中数字信息的罗列,在深度报道中有广泛的应用,是对文字叙事的补充。由此看来,与其说数据驱动新闻是新闻业的技术革命,毋宁讲是新闻实践的工具改良。

二、技术先进性不等于合理性

大数据仅仅是数据驱动新闻的前置条件,数据的多少并不能保证数据应用的真实有效,恰恰相悖的是,过多的数据会增添应用的复杂程度,加大伪数据存在的风险,增添无关的干扰。新闻人有必要看到这一两面性。从数据的采集来看,数据不如人灵活、主动。在大数据的思维框架下,人与信息的关系不是双向的实践与认识关系,而是单向的对应关系。也就是说,事物只有经过了数字化处理,被一个数字化符号所代替,这件物品才在数字的世界具备了意义,否则,就是不存在。而问题的关键就在于,我们今天生活的世界并不是完全的数据世界,还有比如尚未解决温饱的农民、缺乏主动能力的婴儿,他们的思想和行为没有数字化。但对数字世界而言,他们就是不存在的;以至于他们的情感、思想、灵活性以及创造力都得不到尊重和认可,这实在是指鹿为马,是数字化的“种族歧视”。任何一种情感的表达不是一种媒介就能独立承载。传媒人要防止这种数字的简单化,减少社会弱势群体和少数族群的数字失落感。从数据的使用来看,数据也不是越多越好,以维基解密为例,其提供大量未核实、缺少语境的报道,所引消息也多来自没人能见或无法证实存在的匿名者。因此这些数据本身就夹杂着含沙射影、公开偏见和曲解,其本身并不能自我说明[10]。

三、数据科学不保证人文价值

顺着以上的思路,如果退一步讲,即使所有的数据都是合理与有效的,传媒人的主观能动性也保证发挥,是不是就能够确保新闻报道的人文方向呢?笔者认为,还不行。应该看到,数据科学的精密性追求和新闻学科的人文性导向本来就是两个不同领域的问题,两方之间并不直接相关。客观的数据仅仅有助于我们求真;而对社会的求善与求美毫无帮助,就如同我们无法理解“80%的善”到底是怎样的善。新闻本身就是意识形态,本身无法量化;如果非要通过机器数据假装采取某个“客观”立场,就会忽略新闻应有的权力和态度倾向,使新闻报道浅尝于表面,显得滑稽可笑。

从新闻属性看,新闻兼有商业、事业双重性,不能完全以消费者的需求为导向。正如付玉辉所说,“专业化媒介组织不应该成为社会公众在大数据传播环境下所呈现的各种内容需求的奴隶[11]”新闻的本质是给予受众知的权利,而不是满足普通人的消费欲望和对廉价商品的挥霍快感,特别是在漫天的商业广告将每一条新闻的售价降到不能再低的时候。在编辑独立的基础上展开自主经营,这才是新闻区别于其他文化产品的一个关键。而大数据这个概念是商业领域和技术行业的舶来品,从一开始就是一个不可更改的、包裹着商业逻辑和营销目的的工具性概念[12],这种以是否产生效率价值、产生多少效率提升的判断标准与新闻的两性标准并不完全契合。过度强调统计规则的运用、需求的服从,将打破新闻编辑与经营的对立平衡,无法保障新闻作品人文性的发展方向。

四、数据思维限制新闻人的创造性

英国作家胡斯曾提出这样的疑问:“为什么节省劳动力的机器没有带来更多闲暇?”“为什么工人拥有的东西越来越多,他们对生活和工作的主宰权却并不见扩大?”[13]。大数据技术给新闻人带来职业变革,数据化思维正在降格新闻业百年的经验智慧,剥夺记者在新闻中的主导作用。把数据作为新闻的核心驱动力量,就意味着用放在机房里的数据公式替代亲历现场的记者的判断力,把效率至上的机器和自动系统作为社会价值判断的基准,使缤纷多彩的新闻事件同质化。更进一步的是,由于算法相较于新闻事件的滞后与刻板,记者的新想法将不能如编辑室里弹性机动的争论一样被迅速的接受或采纳,而只能依靠一套删繁就简的规则被草率的判定,这就打击了记者的积极性,也减少了报道的多样性。比如美国一家名叫Narrative的公司,就声称可以利用机器以每30秒一篇的速度自动生成棒球比赛新闻稿[14],这就是把新闻报道与流水线上的披萨饼等同了,使记者的工作和拼装工厂里从事机械劳动的机械手臂相等同。

容忍世界的间断和不完美是新闻人的基本素养,它与借助数据实现新闻的透明、客观并没有太大的关系。有一个比喻十分恰当,“我们不停谈论信息革命,但很少言及记者,就好像医疗卫生领域取得的进步让医生变得多余一样”[15]。记者永远不会多余,大数据技术不应排斥记者的作用。总的来看,我们不要以为只要与新技术相关联,就会有新的报道形式出现;需知一味的追求技术应用,将导致我们失去与现实的联系。诚然,今天的新闻业,面临来自互联网和资本市场的压力与诱惑,已经很难保持传统严肃新闻的清高。在可视化图、海量数据面前,单一文字报道的视觉吸引力已大不如前。但正如之前所讨论的那样,新闻不是一般商品,而是社会文化的价值体现,正如《新闻业的怀乡病》所说的,“对于一个以‘致富’为惟一生存准则的时代,丛林法则和达尔文主义的盛行似乎是一种必然。但是,总归要有那么一些人去呵护住最后那点理想的火星。”在数字新媒体狂欢的今天,我们需要新闻剥开技术的迷思,用夸张和尖利的声音引导时代精神的方向。

(作者系:武汉大学 新闻与传播学院)

参考文献:

[1] Wikipedia.Data-Driven-Journalism[EB/OL].http://en.wikipedia.org/wiki/Data-driven_journalism#Definitions,2013-08-16.

[2] Mirko Lorenz. Data driven journalism: What is there to learn?[J] IJ-7 Innovation Journalism Conference, 7–9 June 2010, Stanford, CA.

[3] Van Ess, H. Handboek datajournalistiek[EB/OL].http://www. boomlemma.nl/communicatie-media/catalogus/handboek-datajoumalistiek-1.

[4] 祝建华.数据驱动新闻 大数据时代传媒核心竞争力[EB/OL]. http://media.sohu.com/20120718/n348442131.shtml,2012-07-18.

[5] 祝建华.什么是“数据驱动新闻”(DDJ)[EB/OL].http://media. people.com.cn/n/2012/0718/c120837-18543914.html,2012-07-18.

[6] 文卫华,李冰.大数据时代的数据新闻报道—以英国《卫报》为例[J].现代传播,2013(5).

[7] 彭兰.大数据时代新闻信息资源的结构性变化及其影响[J].中国广播电视学刊,2013(7).

[8] 方洁,颜冬.全球视野下的数据新闻—理念与实践[J].国际新闻界, 2013(6).

[9] 刘建明.“大数据”的迷思与新闻媒体的应对[J].中国广播电视学刊,2013(7).

[10] 克利福德·克里斯蒂安.论全球媒体伦理:探求真相[J].北京大学学报(哲学社会科学版),2012(6).

[11] 付玉辉.大数据思维与新媒体演进[J].中国传媒科技,2013(6).

[12] 徐偲骕.传播研究与学术公共性:“大数据”热潮的冷思考[J].东南传播,2013(3).

[13] (英)胡斯著.任海龙译.高科技无产阶级:真实世界里的虚拟工作出版社[M].北京:北京大学出版社,2011.

[14] 彭兰.社会化媒体、移动终端、大数据:影响新闻生产的新技术因素[J].新闻界,2012(16).

[15] (法)吴尔敦著.宋嘉宁译.信息不等于传播[M].北京:中国传媒大学出版社,2012.

分享到:
(责编:董慧(实习生)、宋心蕊)




注册/登录
发言请遵守新闻跟帖服务协议   

使用其他账号登录: 新浪微博帐号登录 QQ帐号登录 人人帐号登录 百度帐号登录 豆瓣帐号登录 天涯帐号登录 淘宝帐号登录 MSN帐号登录 同步:分享到人民微博  

社区登录
用户名: 立即注册
密  码: 找回密码
  
  • 最新评论
  • 热门评论
查看全部留言

24小时排行 | 新闻频道留言热帖