人民网
人民网>>传媒>>人民网奖学金>>北大2015

从生产者到挖掘者:大数据时代新闻媒体的角色转变

姚怡云
2016年03月31日11:09 | 来源:人民网研究院
小字号

摘要:随着信息技术和计算机技术的不断发展,新闻界刮起了大数据之风。面对大数据带来的影响与冲击,如何积极应对并合理布局成为摆在媒体机构和专业记者面前的一大难题。大数据极大丰富了新闻采写的内涵,也冲击了媒体机构与专业记者在新闻采写中的主体地位,本文在阐述大数据对新闻采集来源、生产方式、写作内容以及“把关人”角色带来的影响的基础上,探讨传统新闻媒体在大数据浪潮中如何重新定义自己的位置,并结合案例分析新闻媒体如何调整采写方式,实现从“生产者”到“挖掘者”的转变,为大数据时代专业记者的新闻采写工作提供创新性对策。

关键词:大数据  新闻采写  数据挖掘  生产方式

维克托在《大数据时代》一书中将新闻业看作是“夕阳产业”,新技术对传统新闻业的采写过程、组织方式和内容呈现带来了巨大的冲击。但是,大数据时代新闻业是否会走向没落却存在争议,在信息爆炸的时代,公众对高质量的新闻与信息的需求也在增加。大数据在对新闻业现有格局带来大变革的同时,也会为传统的新闻采写注入新的活力。

关于大数据的定义,徐子沛指出,“大数据是指那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。”[1]2001年,著名的高德納咨询公司(Gartner)在一份研究报告中指出,数据的爆炸是“三维”的,是立体的。这三个维度主要体现在以下三个方面:一是同一类型的数据量在快速增大;二是数据增长的速度在加快;三是数据多样性,即新的数据来源和新的数据种类在不断增加[2]

对于新闻领域来说,大数据应用的背后究竟是什么力量在推动?从技术上看,存储、解析和利用大数据的技术客观上在不断成熟,Web2.0时代使得社交网络、物联网和移动互联网提供了极为丰富的数据;从经济上看,大数据可以让传统媒体更好地投放广告和满足受众需求,一些新兴的网站和客户端也希望借助大数据改变新闻生产格局;从政治上看,用大数据决定的科学主义方式决定比威权主义更符合政治民主化的进程,哈贝马斯提出的“公共空间”正在以新的形态呈现。大数据的应用势不可挡,以爆炸式方式增长的大量数据带来了新闻生产的巨大变革,不同平台之间流动性的增强又提升了大数据时代的新闻采写的融合性。下文将讨论大数据对目前的新闻业格局造成的影响,及其对传统的新闻采写方式的改变。

一、变革与融合:大数据对新闻采写的影响

(一)新闻的采集来源更多元

大数据时代,首先新闻采写主体发生了变化,伴随着社会化媒体和移动终端的兴起,专业记者不再是新闻采写的唯一主体。一方面,越来越多的互联网用户拥有了“自媒体”,“众包”方式在新闻界的反映尤为明显,渠道开放使得公众掌握了更多的话语权。

另一方面,物联网的建立使得物体的状态数据可以由它们自身所携带的装置向互联网传送,这些数据也将成为未来新闻报道的重要来源。[3]伴随着各种随身设备、物联网和云计算存储等技术的发展,人和物的所有轨迹都可以被记录,移动终端通过位置、生活信息等数据可以更快、更准确地收集用户信息,改变了传统新闻采写的时空观。

(二)新闻生产流程趋于数据化

新闻记者的地位受到冲击,这也意味着传统的新闻媒体作为新闻生产的组织者其主体地位也受到了冲击。在维克托看来,数据比有经验的记者更能揭示出哪些是符合大众口味的新闻。[4]

越来越多的博客类网站和个性化的阅读应用如“Circa”等培养了一大批互联网和手机移动终端的忠实用户。数据化的新闻生产使得传统媒体的专业优势风光不再,因为传统新闻媒体具有自身的立场,在取舍新闻的时候凭借的是新闻理论与专业精神的判断,有时也会受到政治权力与商业利益的左右。

这种带有威权主义色彩的新闻生产面临大数据浪潮一定会受到冲击,平民文化正在兴起,大数据一定程度上改变了新闻评判的标准。新闻网站通过综合分析用户分享数量、新闻受欢迎程度、新闻评论质量等数据,可以筛选出哪些是热点新闻,这种方式生产出来的新闻弱化了新闻媒体的主导作用,提升了用户在新闻生产中发挥的主动性。大数据思维与技术是实现这一转变的桥梁,也是实现网络民主的重要推力。

(三)预测性和调查性的新闻写作增加

预测性新闻将成为一种趋势,互联网既有历史上的可回溯性又拥有实时性,而大数据的核心是预测,通过云计算等分析处理手段可以得出数据之间的“相关关系”进而实现预测。如美国著名报人专栏作家李普曼所说,记者应当“像站在船头的瞭望哨,他决不止注意眼前的表象,而是要洞察气象的变化,预测航行安危”。[5]除了预测性新闻外,基于大数据的调查性新闻又将掀起新的热潮。UGC(用户自制内容)和物联网上的数据会成为重要的新闻资源,公共门户的衰落将会带来个人门户的兴起。此外,谷歌搜索、Facebook的帖子和微博消息使得人们的行为和情绪的细节化测量成为可能。以数据驱动为主的深入调查报道将会得到越来越多的重视。

(四)“把关人”角色的重新定义

机器动摇了新闻媒体与专业记者作为“把关人”的坚固地位,大数据会提升技术在新闻生产中的地位。机器新闻会大量出现,进而也会改变读者在新闻生产中的地位。

传统的新闻生产由专业记者和编辑、媒体领导作为“把关人”决定什么是受众需要的新闻,他们的选择会受到传统的思维模式影响,也会有特定领域隐含的固有偏见。但是,建立在大数据基础上的分析与选择可以有效避免这一问题,给用户更加客观与精准化的信息服务。数据不仅可以作为新闻报道的内容,更可以作为了解受众的依据。通过数据对受众的心理、需求以及行为习惯等进行分析,可以提供更符合受众需要的新闻报道。[6]

数据库可以转化成任何形式的新闻写作,以可视化的形式对新闻创建清晰的描述。讲故事的元素既可用来说明事件的结果,也可发现记者先前判断的疏漏或误导。大数据重新定义了新闻采写过程中传统的“把关人”角色。

二、从生产者到挖掘者:新闻媒体的角色转变

(一)新闻媒体挖掘大数据的潜力

1. 明确利用大数据的目标

新闻媒体利用大数据首先要明确自己的目标,才能不至于盲目跟风。第一,从新闻采写方面,大数据为新闻生产提供了更多的原料以及新的解析新闻的方式、内容呈现方式,互联网用户可以贡献自己的内容,维基经济学将在新闻生产领域有更多的应用。

第二,在满足用户需求方面,读者的大数据也蕴藏着巨大的尚未被挖掘的价值,通过分析行为数据可以让新闻媒体了解读者的喜好,并得到他们的及时反馈。传统媒体的传播对象的认知经历了从受众到用户的转变,他们建立和完善用户数据库,并实现其与内容数据库的深度整合,可以开发出适合用户需求的产品、关系和体验。

第三,在广告投放方面,新闻媒体可以利用大数据来优化广告的配置,可以将广告与网站上的内容挂钩等。目前泰晤士报网络版已经有一套名为“快递(FAST)”的智能软件系统。现在泰晤士网络版有75万篇文章(已删除了一些老的)可供这种分类和广告配置。这样,就可以进一步提高广告效果,这也是探索赢利模式的一种思路。

2. 探索大数据产业链两端的位置

在大数据的价值产业链上,有资源指向、技术指向和大数据思维指向三个类型的公司前景良好。对于新闻媒体来说,也可以从这三个角度思考发展的契机。技术不是新闻媒体的传统优势,新闻媒体主要依靠和专门技术公司合作获取技术支持,“云计算”服务将会让互联网告别软件,将数据集合在一起。因此,新闻媒体主要是从产业链的两端入手,在资源和创新思维上获得生机。

新闻界是大数据的重要应用者,互联网时代要求新闻媒体从生产者到挖掘者的转型。在内容生产上,传统媒体是内容制造的主力,它的内容生产、节目品质仍是一流的,它是一流的内容提供商。从团队上看,传统媒体的团队多半经过专业培训,是职业的新闻工作者和媒体工作者,他们有实力可以持续地为受众提供优质内容。但是,社会化媒体的出现一定程度上解构了传统媒体的威权主义,新闻媒体面临对新技术认识不足、投入不够,存在体制局限、转型困难等问题。传统媒体要让大数据为己所用,扬长避短,一方面做好已有数据资源的挖掘,另一方面实现大数据采写思维的突破。

(二)如何做好已有数据资源的采集?

大数据最值钱的部分在于它自身。从资源上看,媒体行业拥有庞大的数字资源。IDC曾经发布一项调查数据显示,在美国,拥有大数据最多的前三个行业分别是离散式制造业(966PB)、政府行业(848PB)、媒体行业(715PB),这说明媒体数据资源之庞大。这些资源来自于传统媒体的数据积累和新媒体的自媒体互动。[7]

媒体要利用好已有的数据资源,加快将优质内容资源数据化的过程,建立自己的媒体资源数据库,目前大的新闻媒体比如BBC、CNN等都在着手进行媒体资源的数字化,数字化只是开始,以量化分析为导向的数据化将会更多地挖掘媒体资源的价值。BBC于2006年提出为期6年的“创造性未来”计划,为了更好地整合数据库,BBC针对新搜索引擎的特点对其内容进行数据化处理和数字化归档。利用已有资源建立数据库是第一步,在此基础上要完善检索功能,创造性地利用数据库是最高追求。BBC有令所有竞争对手望而生畏的逾40万小时电视节目储备库,通过对元数据进行重新分类,用户可以再BBC庞大的节目资源科中扎到所需内容。

同时,媒体可以利用官方网络和与社交网站的互动获取一手资料。比如英国《卫报》报道2012年美国总统大选时,不仅从政府公开的数据库获得二手数据,还积极利用官方网站进行用户调查。比如针对刚刚出炉的大选结果向全球用户征询意见,其后根据收到的用户态度反馈数据,专门制作《奥巴马再次当选美国总统:全球民众的态度》等动态数据地图,获得广泛好评。

三、记者提高利用大数据采写的能力

(一)对已有新闻采写理论的冲击与完善

大数据一定程度上丰富了新闻价值的评判标准,真实性、准确性、时效性这些专业记者的职业基石仍将发挥着重要作用。但是,大数据时代的新闻并不意味着越“快”越好,从针对性和个性化看,移动互联网的发展使得在合适的时间、合适的地点提供合适的新闻成为可能,;从宏观性上看,大数据因为大量数据的混杂有时会放弃一些精准性,但它更能从宏观视角和概率学方法上预测事件的走向;从可读性上看,大数据的呈现方式更为多样,对互动性与形象化的要求增加。

传统的新闻采写有几条“金科玉律”。比如第一条是“选择典型事实说话”,这一点在大数据时代受到了冲击。传统方式下新闻采写倾向于用典型事实说话,但是典型是记者主观选择出来的,这种方法与抽样调查一样在小数据时代有存在的合理性,采样分析是信息缺乏、流通受限制以及技术不成熟时期的产物,适用于小数据时代以最小的数据获得最多的信息的要求。但是,在选择样本的同时我们自动忽略了大量细节,而细节往往对于发现和解决问题起着重要作用。大数据时代,《大数据时代》的作者维克托认为“样本=总体”,新闻采写的典型性要求受到一定程度冲击。

第二是“用背景材料说话”,这一点与大数据时代新闻采写的思路相吻合,只是大数据下的“背景材料”内容更庞杂、数据更丰富、更新更迅速。举例来说,对于数据挖掘的重心,国外媒体行业更多是用于新闻事实的准确还原,新闻内容的准确到位,新闻呈现方式的活泼亲民。比如2011年伦敦骚乱发生后,《卫报》的“解读骚乱”数据团队通过分析260万条twitter信息,制作骚乱发生地图,帮助受众更好地理解了事态的进展以及骚乱背后的原因,并因此做出了两大现实贡献:让“骚乱与贫穷无关”的政治话语不攻自破;纠正了“社交媒体煽动骚乱”的错误言论。

第三是“通过再现场景说话”,这一点在大数据时代有了新的含义。互联网有可回溯性,除了网上如社交媒体、搜索引擎上的数据外,也可以收集有关部门的数据,大数据时代的“再现场景”不仅可以通过采访,更可以通过用户的大数据分析和采集。大数据能够再现故事,特别是提供个性化的细节。戈夫曼的“拟剧论”表明人们的行为有很多“前台表演”的成分,要想揭示真相,提高新闻报道的客观性和透明性,利用大数据可以验证场景和故事,通过数据源、数据集、数据质量和数据格式的检查,可以发现事件可能包含的虚假部分。

新闻写作曾被称为“一种受限制的写作”,大数据让一些时间、空间方面的限制大大降低。传统的新闻教科书上认为,“最佳的新闻写作包括一整套技巧,它们使事实、概念、思想、情感的发布变得平易流畅,水到渠成。”[8]从新闻采写的技巧上看,大数据时代水到渠成的铺垫与论证可能会受到影响,有时候数据分析结果不是记者可以用固有的新闻理论和技巧解释清楚的,这个时候只要将结果呈现给读者或观众就可以,需要的只是白描,不是工笔画。

(二)如何提高记者的大数据修养

传统的新闻采写理论要求记者加强政治修养、知识修养和思维修养,大数据时代对专业记者提出了增强“大数据修养”的要求。从认知、利用、分析、批判等层面可以对大数据修养进行阐述。

1.综合认识大数据

大数据的原则是“一切皆可量化”,物联网等技术的发展使得越来越的信息将会被数据化。在维克托看来,“数据化”是指“把一种现象转变为可制表分析的量化形式的过程”,而“数字化”是指“把模拟数据转换成用0和1表示的二进制码”。数字化带来了数据化,但是数字化无法取代数据化。举谷歌的数字图书馆为例,数字化只是让传统纸质图书以电子版的方式呈现,但是“数据化”通过对图书内容的加工、处理和分析,可以实现检索、引用和链接等多种方式的应用。记者在认识到大数据的概念与巨大能量的同时,也要认识到任何一种工具都是有边界的,大数据不是万能的,现实生活中一些网络水军的行为已经严重干扰了数据的准确性,这实际上大大降低了数据的价值,记者要认识到数据存在质量参差不齐的现象。

2.多元利用大数据

大数据这一方面可以帮助记者在采写过程中得到更多的信息来源,以便通过多种渠道验证信息的可靠性;另一方面,也对记者的新闻伦理与规范提出要求,内容编造、抄袭等不道德的行为将更加容易被发现。2013年10月22日,谷歌推出了“谷歌媒体工具”的网站,以吸引各大媒体记者,为他们提供一站式的平台来访问和学习众多谷歌服务。该工具不仅包含了谷歌搜索引擎和地图等常规工具,还能为记者提供更多细节信息,帮助其利用谷歌来丰富各种话题的报道。利用数据只是为了更好地挖掘事实和呈现新闻报道,大数据提供的是参考答案,而非标准答案。

3.谨慎分析大数据

身处信息时代的记者比以往任何时候都更加需要对大量数据进行核实、分析和整合。记者要对数据保持怀疑的态度,不能有盲目的数据崇拜。2011年度普利策调查性报道奖得主佩奇·约翰强调:“所有的数据必须有来源,并经过交叉检验”。面对海量数据,记者首先应评价数据的质量与意义,需要认真考察数据的来源是否可靠、数据是采用何种目的以及用何种方式收集而来的、处理数据的模型是否科学等。大数据治理需要创建可靠的元数据,避免出现窘境,在此基础上数据分析模型是否可靠是一个十分关键的问题,错误的前提导致错误的结果,要避免出现假相关或者是伪相关的问题。除此之外,数据利用过程中要去除干扰性数据。

4. 培养怀疑和批判能力

大数据背后也有风险与担忧,要挤掉大数据泡沫。首先关注隐私权的问题,互联网侵权无孔不入,媒体和记者必须坚持自己的职业道德和操守,捍卫自身的公信力。其次,在利用网络数据进行分析时,要严格遵守隐私保护的法律和规范,比如在利用社交媒体进行数据分析时,要注意匿名性与一定情况下征得用户同意的问题。然后,在数据开放问题上,目前在中国大量的数据仍处于被雪藏的状态,并没有通过合法渠道公开。一些政府部门和大企业由于掌握大量的数据资源,容易引起数据独裁的问题。

除此之外,媒体的媒介审判问题也令人担忧。大数据会让预测性新闻的比重提升,但是这种预测基于他之前的行为与其他方面的表现,忽略了个人的主观意志力因素,本身就具有风险性。目前,新闻媒体作为“第四权力”有时会滥用话语权,借着舆论的便利对新闻当事人和团体进行媒介审判。而当事人是否有罪应当由司法机关通过法律程序来判决,大数据时代的新闻媒体和记者更需要自律,掌握好自己行动的边界,积极推动司法建设的进程。

大数据、物联网、云计算以及移动终端绝不只是一些新鲜的名词,它们将彻底改变我们看待数据和利用信息的方式。大数据技术正在渗透到新闻生产的核心环节,英国《卫报》、美国《纽约时报》等新闻媒体已经开始利用大数据生产新闻的尝试,深刻理解大数据的内涵及其特点是新闻媒体跨出的第一步。社交媒体逐步替代传统媒体,LBS应用让科技更智能,移动终端成为人体的延伸器官,人机交互产生了大数据。

新闻报道的内涵被不断延伸,收集网络上的实时信息也成为一种采访,网络上的表现可能比说出来的话更能反映出一个人真实的心理和状态。从新闻采写的过程看,以往“先采访、后写作”的方式将会受到冲击,因为大数据具有实时性特点,采访和写作有时是同时进行的。总体上看,过去新闻强调“用事实说话”,现在对新闻采写的含义不断扩充,大数据时代的新闻采写要能听见数据的声音,“让数据说话”。基于移动终端和社交网络的大数据挖倔对新闻采写产生了深远的影响,新闻媒体要实现从生产者到挖掘者的转变,专业记者也要提高大数据修养与大数据的应用能力。

参考文献

蔡雯:《媒体融合与融合新闻》,北京:人民出版社,2012年版

刘建明:《“大数据”迷思与新闻媒体应对》,《中国广播电视学刊》,2013年第7期,第6-8页。

彭兰:《社会化媒体、移动终端和大数据:影响新闻生产的新技术要素》,《新闻界》,2012年第16期,第3-8页。

齐宇杰:《大数据时代媒体行业数字资源研究》,《中国传媒科技》,2013年6月。

徐子沛:《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》,桂林:广西师范大学出版社,2013年版。

[美]罗伯特?M?奈特:《最佳写作要领》,北京:新华出版社,1999年版。

[英]维克托?迈尔-舍恩伯格、肯尼斯?库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,杭州:浙江人民出版社,2013年1月第1版。



[1] 徐子沛:《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》,桂林:广西师范大学出版社,2013年版,第57页。 

[2] 同上书,第55页。

[3] 彭兰:《社会化媒体、移动终端和大数据:影响新闻生产的新技术要素》,《新闻界》,2012年第16期,第7页。

[4] [英]维克托·迈尔-舍恩伯格、肯尼斯·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,杭州:浙江人民出版社,2013年1月第1版,第180页。

[5] [美]赵浩生:《倘若斯诺今天写中国》,载《人民日报·海外版》,1988年6月29日。

[6] 彭兰:《社会化媒体、移动终端和大数据:影响新闻生产的新技术要素》,《新闻界》,2012年第16期,第5页。

[7] 齐宇杰:《大数据时代媒体行业数字资源研究》,《中国传媒科技》,2013年6月,第75页。

[8] [美]罗伯特·M·奈特:《最佳写作要领》,北京:新华出版社,1999年版,第10页。

 

(责编:王妍(实习)、宋心蕊)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部