摘 要:本文旨在以正在兴起并迅速发展的大数据为背景,以新闻报道为观察对象,从动态的新闻报道生产环节和静态的报道风格两个角度出发,阐述大数据为新闻报道带来的变化和创新机遇。同时也明确,大数据作为一种新兴事物,目前更多地是为新闻报道提供了新的思路和报道手段。不论是技术层面的限制,还是新闻报道具有的自身发展规律,大数据对新闻报道产生的影响都不宜高估。本文试图从新闻报道这一新闻生产活动看到大数据时代的到来对传媒领域产生的影响,探讨媒体应如何应对大数据在新闻报道的活动中带来的机遇与挑战,为新形势下媒体的创新和转变、新闻报道的发展提供理论参考。
关键词:新闻报道;大数据;数据处理;创新
前 言
大数据时代的到来不但对计算机、经济、管理、医疗等领域产生了较为明显的影响,也为传媒领域带来了更多值得思考的课题。在新闻报道等新闻生产活动中,大数据正 在逐步渗透到生产环节、风格特征、观念转变等各个方面。
随着“大数据”概念的提出,其兴起和发展给传媒业带来了巨大的冲击和挑战。通过数据发现问题,总结问题,让数据渗透到新闻报道的各个环节之中,运用数据化的技术手段,可视化的叙事结构进行社会意义的阐释,使其呈现在以数据库新闻为主的新闻报道里,这些新闻生产活动对媒体从业的观念转变和报道创新提出了新的要求。
王武斌等学者提出,媒体应视数据为重要资产和生产资料,[1]多角度、多方面地辅助报道。比如,大数据的处理技术、数据的可视化叙事等可以把媒体报道的范围和创造性提升到新的水平,从新闻从业者的新闻理念上进行渗透影响,并以实践活动的开展不断进行理念上的创新和发展。但是,面对每天呈爆炸式增长的大数据资源,媒体也应及时看清形势,积极应对大数据带来的新的新闻理念和应用手段的改变的同时,也要看到媒体本身是否具备进行大数据新闻报道的条件与准备,理性看待大数据为新闻报道的创新带来的机会和挑战。
一 从动态到静态:新闻报道的创新之机
大数据的出现为新闻报道提供了新的思路和操作手段,具体影响可以分为动态和静态两个方面。
从动态上来看,大数据技术渗透到新闻报道的各个生产环节之中,新闻来源的选择、新闻采编和受众的定位与反馈都在大数据的影响下出现创新之处。从静态上来看,大数据对新闻报道的整体呈现风格上也产生了不可忽视的影响,以数据新闻为代表的大数据新闻报道的出现,运用可视化的叙事结构将具有社会意义的数字等整合分析的同时,也进一步反映和推动了社会事务的公开化、透明化。大数据的出现,在动态和静态两个层面上为新闻报道提供了创新的机遇。
(一)生产环节:数据技术的应用
从技术的角度看,大数据对新闻报道带来的创新和影响主要体现在生产环节这一动态的过程中,尽管在新闻生产的过程中,人工操作仍是不可替代的,但是大数据的挖掘、收集、分析和存储能力会在一定程度上完成新闻生产的部分环节,利用大数据的处理手段,从数据中发现新闻,数据辅助采编新闻,依靠数据分析受众等都将成为未来新闻报道的一个发展趋势,数据驱动型和趋势预测型的新闻报道分量将有所增加,整个新闻生产流程在大数据技术的影响下都有着较为深刻的改变。
1.新闻来源:数据新闻化
大数据为新闻生产提供了一个浩大的资源库,数据新闻化,即从数据中找新闻,变数据为新闻,将海量的数据信息经过挖掘、筛选、分析等过程,从中发现有价值的数据信息,或者当某种数据的相关数据数量足够时,便可形成有价值的数据组合,这类的数据有一定的新闻价值,作为新闻来源,记者可以以此为依据,进行针对性地或者延伸报道,相对于记者的自身判断,数据所呈现出的问题和新闻价值将更加直观和精确。
这类数据的获取可以是多种渠道的。一方面,政府事务的公开,机构统计数据的公布,使得具有广泛社会意义的数据和公众间建立直接的获知通道变得更为可能。另一方面,碎片化的数据信息则更多地依靠网络获取。移动终端和物联网发展,意味着物体的状态数据可以由其自身所携带的装置随时与互联网相连,打破时间和空间的限制,通过网络即可实现任何物体的信息传送和获取;而社会化媒体则为普通用户提供了信息数据的生产平台。一组名为“互联网上的一天”的数据显示:一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多,相当于美国两年的纸质信件数量;发出的社区帖子200万个,相当于《时代》杂志770年的文字量。[2]由此可见,个体生产的内容是一个巨大的数据来源,目前需要利用大数据解决的就是,如何将这种碎片化的信息资源收集、整合和分析,从而找出有价值的数据,使之成为新闻报道的来源。
2. 新闻采编:新闻数据化
新闻数据化发生在新闻生产环节的新闻采编阶段,即在新闻报道的过程中,通过相关数据信息的加入和应用,使报道更加客观准确、简单直观。以数据说明新闻,这种方式在新闻采编环节早已开始运用,20世纪的精确新闻和计算机辅助新闻报道的先后发展就是数据在新闻采编过程中的一种应用。随着大数据时代的到来,对新闻采编中的数据应用提出了更高的要求,利用大数据处理技术,将互联网、物联网上海量的数据信息加以总结分析,使新闻报道整体不再流于表面文字,以事实说话,坚实可靠。
同时,从新闻采编的主体记者的角度而言,作为生产新闻的个体,任何一个记者对于事物的观察都是基于其自身的认知和立场,所报道的新闻也必然或多或少地掺杂着个人的主观认识和看法,但数据化的新闻最大程度避免了这种现象的出现。每一个数据都是经过整理和分析得到的,基于海量的存在与社会各个角落的数据信息将新闻采编过程中主观色彩的添加降到最低。
3.受众选择:定位与反馈
作为媒体新闻生产内容的接收者,受众的定位选择及其反馈,对于媒体来说有着重要的参考价值和意义。
从受众定位的角度而言,传统的受众分析大多采取抽样调查的手段,样本数量受到限制,覆盖范围广,但针对性不强,媒体更多地注重作为受众的“人群”的媒介使用习惯,而非个人的媒介使用行为。
在大数据技术的支持下,媒体可以通过搜集、分析作为个体的用户的媒体使用行为,分辨出用户的行为习惯、新闻消费倾向,以及这些行为习惯在他们的生活中扮演的角色,从而发现用户的日常新闻消费倾向及影响和被影响的程度,为受众提供更有针对性的个性化服务,使用户跳离出大量庞杂的信息,节约时间的同时加强传播效果,培养受众的忠诚度。
从受众反馈的角度看,这种基于用户日常行为习惯的数据分析在一定程度上更能体现出受众的自身意愿和对新闻事件的真实看法,使这些反馈的价值得到更好的发挥与利用。以数据分析为基础的个性化的信息服务逐渐成为门户网站和移动终端发展的一个手段,大数据技术对受众的观点和反馈的分析也为新闻报道提供了重要的的参考价值,使媒体在反映与传达民意方面的功能进一步增强。
(二)数据新闻:报道风格的转变
从数据的应用来看,大数据在新闻报道中的影响主要体现在报道风格这一静态事物的转变上,基于大数据的新闻报道最大的创新之处就是数据新闻的出现和发展。不同于计算机辅助新闻报道中有限的数据使用,数据新闻面向的对象是海量的大数据,在计算机辅助新闻报道中,数据的收集和使用只是新闻报道的一种辅助方式,而在数据新闻中,大数据的挖掘、筛选和分析则是贯穿于新闻生产的整个环节,不但在整体上加强了新闻报道的客观准确程度,也使新闻更加具有可视化等特点,生动形象、深入透彻地反映新闻事实。
1.可视化叙事结构
数据新闻的报道方式通常结合了图形、表格、地图、动画等表现手法,运用可视化技术来叙述和传递新闻数据信息,这种可视化的叙事结构在一定程度上满足了受众的视觉需求,在吸引其注意力的同时,也使受众更加简单清晰地了解新闻事实。
英国《卫报》在2012年总统大选的报道中,有50余 篇的报道都是通过静态的数据图表和动态的互动方式整合而成的。以《交互式导引:2012 美国总统大选结果一览》[3]报道为例,该篇报道以网络为平台,收集、整理选民投票信息。民众通过电脑操作,可以在美国的地图上获得有关大选的实时新闻。比如用户移动鼠标至地图上的各州,就可以通过不同颜色看到该州民主党和共和党目前分别的投票数量以及增长的动态,信息一目了然,清晰直观。
新闻事件的数据化处理,使得新闻报道具有了可视化的叙事结构,报道更具说服力和准确性。美国总统选举作为一个新闻事件,自古至今有着多种的新闻报道方式。在2012年的总统大选中,英国《卫报》利用它的数据化处理手段,收集整合网络用户的党派信息、投票信息、地理位置等,处理分析海量的数据内容,以动态、实时的形式为受众呈现出美国总统大学每个时段的不同新闻信息,使新闻具有极强的实效性和准确性,以可视化的叙事结构为受众呈现出简单而丰富的新闻信息。
2.社会化意义生成
数据新闻面向的社会各个领域产生的海量的大数据,通过数据的收集和分析,从中发现具有社会意义和新闻价值的新闻事实。数据分析和数据对比是数据新闻报道过程中一个重要的部分,如果说, 进行数据的纵向分析,可以发现事物的发展变化过程,那么选择合适的数据进行横向比对,则可以显示出事物在某一时间和空间下具有的当前社会意义和问题。
从2013年8月21日开始,中央电视台推出了一组系列报道栏目《数字十年》,在《新闻联播》等节目中连续播出。以8月22日播出的《我国粮食总产量创历史“八连增”》为例,新闻报道中提到 “……到2011年,产量较2004年增加2800亿斤,相当于每个中国人每年多了200斤粮食。目前,我国粮食总产量为5.1亿吨,占世界粮食总产量的五分之一……”
这个新闻报道将十年来我国粮食领域涉及到的各类数据加以收集、整理、分析,以数字形成文字新闻,配以动画的方式形成画面,在纵向的发展上,简单清晰地将我国十年来粮食发展以及和经济、民生等领域的关系呈现出来。而数据的横向对比则让人从理性和感性两个角度体会出数据背后的社会意义。提到“产量增加2800亿斤”的时候,报道中进一步解释——“相当于每个中国人每年多了200斤粮食”,同样的,提到“我国粮食总产量为5.1亿吨”时,也选择了另一个数字——“占世界粮食总产量的五分之一”,来帮助受众更好地理解,为受众对比地阐释了两个数字背后所代表的社会意义。
3.透明性事务公开
不论从大数据自身还是大数据下新闻报道所需要的社会环境,透明与开放都是必然的,由此产生的新闻报道才能以客观、真实的角度呈现出来。
同样以中央电视台系列报道《数字十年》为例,该系列报道收集、分析海量的数据信息,运用动画、图表等方式将其以数字的形式呈现出来,总结了我国十年来政治、经济、文化、民生、教育、科技等多个领域的变化和发展,使人们可以清晰地看到我国各个领域、省份的发展现状,通过这种数据信息的整合和公开,充分、全面地对周围的社会环境有一个真实的认识。这就意味着,此类数据新闻的出现,首先是以社会各领域的信息开放为前提的。政府、机构、企业等组织的事务公开程度和处理数据能力的提高,使得数据新闻的制作和传播有了依据和环境的支持,这种环境所带来的一个结果就是透明与开放。
社会上各类组织所储备和提供的数据信息,大多来源其业务的存在和发展,这些数据资源的透明与开放,无疑为从事新闻报道的媒体提供了庞大数据信息资源,媒体从这些数据中进行挖掘和分析,数据处理过程贯穿于新闻生产的各个环节,这种数据新闻的形成将进一步公开社会事务,将组织内部的业务水平、发展脉络透明化,在新闻报道中以不同的表现方式呈现出来,反映社会现实。这种情况下,不论数据新闻报道的本身,还是新闻数据背后所反映的社会问题都将进一步暴露在公众面前,一目了然。
二 从存储到处理:大数据转型的创新挑战
大数据时代的到来在动态的新闻生产过程和静态的新闻报道风格体现上都逐渐产生影响,这种对新闻报道从生产到产生的全程的影响是潜移默化、不断深入的,媒体要及时意识到大数据时代的到来为新闻报道的丰富和转型带来的创新机遇,在报道理念和采编过程中及时补充新的知识和观念。但同时,传媒行业也应该认识到,大数据目前对新闻报道等新闻生产活动的影响仍然是有限的,这种基于大数据处理技术的提高才能随之跟进的发展目前更多地仍是集中于计算机等IT层面上的讨论。
可以说,大数据为新闻报道提出了一个新的思路和操作手段,同时也对从事新闻报道活动的主体——媒体,提出了新的要求。大数据为新闻报道带来的创新机遇目前仍受到诸多技术层面上的限制,媒体应重视大数据的精神内涵和技术应用,而不宜认为大数据将会对新闻业务等方面产生变革性的影响。
(一)大数据存储:亟待建立的媒体品牌资源
大数据存储库的容量多少才能称之为“大”,这恐怕是每个媒体都要思考的问题。我们现在所处的社会,组织和个体,每天通过社交媒体、移动终端、探测器等平台会生产大量数据。据统计,作为拥有全球上亿用户的视频网站,YouTube每秒就有一个多小时的视频上传,每个月有大约十亿用户的言语行为会作为数据保存下来。这些数据的存储可以看做是YouTube大数据库中来源于自身数据资源的一方面,另一方面,在建立自身数据库的同时,针对不同需求,面向其他媒体网站和行业领域的数据挖掘和处理也将成为网站大数据资源和媒体品牌的一部分。
但必须强调的是,现在很少有媒体拥有如此广泛的用户信息资源,并能够将这些以秒为单位的、来自不同时间和空间的信息最终以数据的形式保存下来,形成自己的大数据资源和媒体品牌。以传统媒体为例,作为中国最大的电视台,中央电视台据称拥有近40万小时的节目资源,年播出总量为23.0248 万小时。[4]目前央视的写稿和节目管理系统尚可维持其内部,以及和新华社等媒体间的普通检索与应用。但这种仅局限于国内传统媒体间共享的数据资源远远不及YouTube等全球化的社交网站所拥有的信息量,也不足以称之为拥有大数据资源。
面对海量的大数据,积累数据资产,每个从事新闻报道的媒体亟待思考和解决。历史信息的保存和原创内容留底,构成了媒体数据资产的核心部分,建立内部的数据存储系统的同时,还可以通过自由抓取、购买和合作等方式获得外部的数据信息,共同组成媒体本身的数据存储系统,为新闻报道的素材查询、版权保护、内容管理等提供完整、可靠的大数据库。
这种数据存储系统的建立,除了保证为数据资产提供存储空间,还应该建立媒体自身的品牌特点,使自己所具有的数据资源成为市场化的品牌象征,为新闻报道等生产活动提供市场化的支持和分享。应该看到,大数据存储库的建立将会使新闻报道中大数据的应用更加便利和准确,也为大数据的处理提供了常规化的操作和支持。
(二)大数据处理:尚未成熟的数据收集分析
从大数据的定义来看,其本身就是无法被目前已有的主流软件进行多种处理的数据规模。这种尚未成熟的技术水平为新闻报道中大数据的使用带来了不便和阻碍。
从大数据收集来看,其本身的质量无法保证。以网络大数据信息为例,网络的数据资源是增长速度最快的大数据资源,但由于网络本身的虚拟性和不确定因素,“僵尸”、“水军”等群体的存在等原因,大数据信息本身就存在不真实、不准确的可能性。媒体在新闻报道的过程中,如何甄别和筛选海量的数据信息仍是一大难题。
从大数据分析来看,传统的编码等文本分析方式仍为主要的分析手段,难以支撑海量的大数据信息分析,且人工部分对记者自身的素质要求较高。比如在分析某一事件的舆情监测过程中,关于网络中大量相关帖子的获取和文本分析软件的使用依靠传统方法即可获得,但对于帖子的倾向性等具体内容依然只能依靠人工编码等传统手段进行,这就使得文本数量有限,获得结果的过程不但漫长,而且不能保证具有足够的代表性。这种分析手段的滞后为大数据的分析带来阻碍,新闻报道的时效性和准确性也因而不能保障。
而对记者来说,在新闻报道活动中,如何将收集到的数据信息进行分析,剔除多余和庞杂的信息,评价其真实性以及具有的新闻价值和社会价值,整合相关的数据信息,形成一个完整的数据组合,这种数据分析的过程对从事新闻报道记者的业务水平和对数据的敏感度提出了较高的要求。如何在海量的数据中挖掘所需信息,如何在其他数据内容中寻找新的新闻报道的角度和实践,如何通过分析得出数据的准确度和相关性,都是记者的自身素质和使用的技术手段在大数据时代面临的挑战。
(三)大数据合作:仍需拓宽的高效创新手段
大数据的兴起是存在于多个领域的,主要集中在政府服务、经济、商业、计算机和一些公用服务行业,在传媒行业,尤其在新闻报道等新闻生产活动中运用数据资源,媒体还要面临着诸多问题。目前媒体对于新闻报道中大数据的使用多是从单次的新闻生产行为出发,零碎而简单,获得的数据和分析也不尽完善。提高新闻报道的质量和效率,还需要通过不同媒体间的合作和不同领域间的合作共同完成,而且这种合作不应该是只发生在某次单独的行为中,而应在媒体和媒体、传媒和其他领域间建立从技术到业务多层面的合作,为新闻报道等多次、具体的行为提供常规化的相关支持,这种合作创新在目前来看还没有铺开。
每个媒体都有其自身的媒体资源和受众群体,针对媒体资源和受众群体所产生的数据内容完全可以同合作、交换等方式实现共享,媒体间数据资源的交换和流动,在保证足够的数据信息源的基础上,可以进一步在数据信息的准确度核对、涉及范围的代表性等方面提供保障。
更为重要的是,媒体在大数据的存储、收集、分析与呈现等处理过程中需要同技术、管理、营销等不同领域进行有效地合作。有限的技术的应用水平和人才的储备能力都对媒体提出了更高的挑战,利用跨界合作的方式,整合外部力量,创新合作领域,弥补自身技术水平的短板,提高新闻报道中数据处理的效率和质量,成为媒体应该思考的问题。
三 结论
大数据时代的到来,对新闻生产活动产生的影响正在潜移默化地发生着,新闻报道面临的创新体现在技术应用、报道风格和思想观念等领域的方方面面,不论是从动态的生产过程,还是从相对静态的新闻呈现,都开始受到大数据带来的不同程度的影响,作为贯穿这一过程的新闻报道观念也正在随之转变,对海量的大数据的收集分析成为媒体工作者有意识的行为活动,这对于新闻报道领域的创新起了关键性的作用。
不可否认,大数据在为新闻报道等新闻生产活动带来重要的观念和行为上的创新的同时,也对媒体的数据应用水平和记者的数据使用能力提出了挑战。限于传媒行业的技术发展水平,其自身数据处理能力,与其他领域的合作范围等都使得新闻报道活动受到技术问题等更大的外部制约。提高对大数据的认识和操作能力,成为媒体进行新闻报道等活动的过程中需要尽快进行的思考内容和创新培养。
与此同时,对于大数据对新闻报道所能产生的创新之处,作为媒体从业者要有一个清醒的认识。大数据为如今的新闻报道提出了一个新的思路和操作方式,充分利用大数据技术和大数据本身可以充实新闻报道,为新闻报道的发展注入新鲜的血液。然而,大数据对新闻报道所能产生的影响也不应被高估,技术的限制固然是一方面,但新闻报道还应遵循其自身的发展规律,对大数据带来的创新之处有所吸收的同时,注重其他新生事物的影响,融合多方面优势,不断充实新闻报道内容,随着时代的发展更好地满足受众的需求。
[1]王武彬:《大数据浪潮中的传媒业——兼谈大数据讨论的若干误区》,《新闻记者》,2013年,第6期,第28页
[2]吕晓东:《大数据时代,媒体如何转型》,《编辑之友》。2013年,第6期,第8页
[3]文卫华,李冰:《大数据时代的数据新闻报道——以英国<卫报>为例》,《现代传播》,2013年,第5期,第141页
[4]王武彬:《大数据浪潮中的传媒业——兼谈大数据讨论的若干误区》,《新闻记者》,2013年,第6期,第30页
参考文献
[1]方洁、颜冬:《全球视野下的数据新闻:理念与实践》,《国际新闻界》,2013年,第6期。
[2]李国杰、程学旗:《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》,《中国科学院院刊》,2012年,第6期。
[3]李明:《大数据时代新闻采编人员职业能力培训》,《中国出版》,2013 年,9 月(上)。
[4]吕晓东:《大数据时代,媒体如何转型》,《编辑之友》。2013年,第6期。
[5]涂子沛:《大数据》,广西师范大学出版社,2013年。
[6]文卫华、李冰:《大数据时代的数据新闻报道——以英国<卫报>为例》,《现代传播》,2013年,第5期。
[7]文卫华、李冰:《从美国总统大选看大数据时代的数据新闻报道》,《中国记者》,2013年,第6期。
[8]王斌:《大数据与新闻理念创新——以全球首届数据新闻奖为例》,《编辑之友》,2013年,第6期。
[9]王武彬:《大数据浪潮中的传媒业——兼谈大数据讨论的若干误区》,《新闻记者》,2013年,第6期。