人民网>>传媒>>传媒期刊秀:《传媒》>>2015年11月上
人民网>>传媒>>正文

大数据对收视率调查的影响及思考

郑维东

2015年12月02日14:06  来源:人民网-传媒频道  手机看新闻

电视接入“互联网+”,也意味着要接入大数据。大数据主要体现为用户行为数据,收视率虽然不是大数据,但作为电视观众行为数据,其和大数据之间的比较、关联、互动、融合却极为关键。在电视收看通往视频消费的转型与升级轨道上,大数据固然重要,但是还不能取代收视率;研究大数据,也非常有必要研究其对收视率的影响。

收视率不是大数据,大数据也很难直接转换出收视率

虽然对于多大体量的数据才能叫大数据并无定论,但可以肯定的是,行业内目前通用的收视率数据并非大数据。收视率数据是在传统抽样调查的基础上产生的,来源于有限的确知样本。这种既没有巨大体量,也缺乏多样性(也称多变性)和高速率(指数据输入输出的速度)特征的数据,与大数据的任何一个特点都不相符,但如何利用大数据开展收视率调查,继而形成完整、规范的流程,已成为业界关注的热点和未来的可能趋势。

传统的收视率数据完整地反映了用户收视行为的3W要素,即:谁在看(Who)、什么时间看(When)和看什么(What)。目前实行的收视率调查是建立在一套被行业内认可的、完整的技术和运维方案基础上的,在采集到观众收看电视节目的3W相关变量后,进行统计计算和报告而得到的最终结果,这也是收视率数据能够成为行业通用货币的基础。因此,在采用大数据生产收视率过程中,也必须建立一种科学的流程思维,并在这种思维指导下形成一套科学的大数据采集流程。

在当前电视生态系统范畴内,能与收视率产生联系形成大数据集的数据多种多样,包括电视机顶盒和基于移动终端视频消费的回路数据、社交媒体上视频分享和讨论的数据,以及与在线视频服务有关的ISP 服务器后台数据等各种与视频相关的数据,如何把这些大数据转化和生产成收视率数据,还需要增加一些必须的手段和环节。

首先要确定收看对象——Who。这个谁不是大数据中已包含的IP地址,而是通过二次抽取和定位后所形成的一定数量的固定样组。其过程实际上就是把大数据还原成了小数据,同时还补充了收视率调查须有的观众个体信息及结构性变量,再反推至大数据总体。这个过程要求二次抽取固定样本的方法极具科学性和代表性。

其次要确认收看时点——When。做到能获取到任意收视行为的发生时间点及其持续时间长短的数据。前面所提到的大数据或多或少都存在一些问题,如有些系统已经建立了时间维度的变量,但往往只有时点数据而缺少时长信息,有些在统计时间变量方面甚至采取断面拍照的方法,导致数据的时间颗粒度不够精细,这使从大数据中生产出合格的收视率数据受到阻碍。

最后要核实收看内容——What。要识别用户收看的视频内容,就要有高质量的内容库编码系统和用户端内容识别系统。但当前视频服务各方的大数据体系都缺少高效、统一的标准和技术方案,也缺少广泛应用上的识别功能,这可能是从大数据中生产收视率的一个最大障碍。

即使技术上的问题都能够得到解决,但要促成各大数据所有者开放自己的数据,在业内形成信息共享,仍然是一个无法回避的问题。各大数据方如果坚持基于自身体系发布所谓收视率数据,势必会出现一个市场上有多套数据主体的状况,这些数据主体互相无法涵盖,彼此不能验证,难免就会造成利益争执和纠葛的局面。但如果强制要求分享数据,又将触及到大数据机构参与市场竞争和保护商业利益的底线。

可见,在行业不融通、数据不分享的情况下,要从大数据中生产收视率数据是非常困难的。从收视率方面看,基于有限数据的跨屏监测来扩张传统收视率调查是当下最为有效的方法。但从大数据机构对收视率数据的需求看,也许传统收视率本身所具备的功用已远远不能满足当下视频市场对多元数据和价值评估的需求,因此是否一定要有个通用收视率,也是值得商榷的。在收视率与大数据的交互轨道上,收视率将何去何从,未定之数尚多,还待时日观察。

从点播量到收视率:寻求一种大数据转换收视率的估算方法

网络视频的点击量也称点播量。点击量(page view,PV)是衡量网站流量的一个指标,通常一个IP地址或者cookie对应一个独立的访问者。在默认情况下,访客在30分钟内没有任何浏览或点击动作,则该次访问将被认为已终止。例如,2015年2月26日起,在北京卫视和上海东方卫视联合播出的电视剧《平凡的世界》,同时也在乐视网独家供网民点播。乐视网发布的数据显示,2月26日—3月25日,该剧在乐视网每天更新2集,共发布56集,与电视台保持同步播出安排。截至2015年3月31日,该剧网上点播量共计3.6亿人次,其数值之大远超出我们通常熟知的收视率数据表现。

事实上,网络点播量与收视率是不能简单做比较的。网络点播量反映的是收看的人次数,而节目收视率是收看人数(到达率)和收看时长(忠实度)的累积,表现的是人时数,而不是人次数。收视率指标体系中的毛评点(GRP)以到达率和暴露频次进行计量,更接近统计人次数,并常被用于反映短时长的广告内容的收看情况收视率。

考虑到PV计量的30分钟法则,可以把一集电视剧在网络上的投放视作一支电视广告的播出,同一集电视剧在同一天的投放只记作一次播出(这是最保守的假定,事实上同一集电视剧在一天内可以重复播放,从而相当于多次投放,使总投放次数更多),那么56集电视剧在34天内的总投放次数共计1148次,即2×(34+33+…+7),3月26日至3月31日6天没有新投放。

如果以全体网民作为网络视频的潜在总受众,截至2014年底这个数字是6.49亿。如此推算56集《平凡的世界》在互联网播出34天后的平均收视率可估算为3.6/(6.49×1148)×100%=0.05%。如果不是以全体网民为分母,而是采用所有电视观众人数(约12.8亿)作为潜在总受众规模以便和电视收视率对比,那么这个网络播出56集电视剧的平均收视率仅为0.02%。

另外一个例子是关于电视剧《何以笙箫默》,该剧由江苏卫视和上海东方卫视于2015年1月10日在电视上联合首播,并在网络视频平台同期播出。互联网的流量统计显示,截至2月1日共获得网络视频点击量超过50亿人次,这期间该剧每天播出2集,至1月27日播完,共上线播出36集。按照上述同样算法,该剧在网络上23天内合计投放次数为522次(1月28日至2月1日5天没有新投放),则其在全体网民中的平均收视率可估算为50/(6.49×522)×100%=1.48%,在所有电视观众中的网络平均收视率则为0.75%。

基于CSM全国网收视率调查数据可知,《平凡的世界》首播在北京卫视的平均收视率为0.47%,在上海东方卫视的平均收视率为0.28%,二者合计0.75%,同等口径下是网络视频播出收视率的37.5倍。同样电视剧《何以笙箫默》首播在江苏卫视的平均收视率为0.91%,在上海东方卫视的平均收视率为0.58%,二者合计1.49%,同等口径下则是网络视频播出收视率的2倍。两相比较,显然电视剧《何以笙箫默》在网络播出的收视水平远好于《平凡的世界》,《何以笙箫默》在电视和网络两个播出平台均取得了较好收视效果。

上述分析说明,电视仍然是电视剧获得观众收视的主要平台,而网络则起到一定程度的补充功能。当下是一个数据满天飞的时代,其中一些数据既不乏泡沫,也经不住细算,不能被动辄几亿、几十亿的点播量数据所迷惑,还是要秉持一点科学的精神,从纷繁的数据中寻找既有的逻辑,尽可能还事物以本源。

大数据推动收视率调查升级:从“互联网+”到“收视率+”

媒介融合时代,基于互联网平台和数字技术背景下的多屏化、社交化、移动化等应用方式,在分流电视观众的同时,也在积极推动着电视开辟新的价值增量空间,这一过程被称为电视的“互联网+”。同时,以电视端直播收看为对象的传统收视调查在反映电视增量价值上亟需拓展创新,这一过程则可称为“收视率+”。一定意义上说,电视的“互联网+”和“收视率+”互为因果。因为有了“互联网+”,所以亟需推动“收视率+”;反过来,及时、科学、规范的“收视率+”也非常有助于电视的“互联网+”升级和发展。

电视的“互联网+”也可以简称为“电视+”。“电视+”的融合发展远非节目多屏传播这么简单。电视购物、互联网电视、互联网金融、电子商务、社会化媒体营销,乃至3D打印、社交游戏等,都可以连接为“电视+”,所以“电视+”是个大格局,以视频的跨平台、多终端、个性化、互动化传播为纽带,绽放出面向以互联网创新为动力的新经济、新生活的电视大时代。

所以,电视观众调查需要为电视传播提供与时俱进的价值量化工具,推动电视增量价值的变现。从方法和技术路径上探讨,这一过程可以分解为六大环节。一是进一步完善电视直播收视测量,这仍是视频媒体传播的价值核心。二是利用好基于增强互动电视(包括数字有线电视、IPTV和OTT电视)传播形成的回路数据,展开对基于电视屏幕的长尾和碎片化收视行为的归总与精细化测量。三是对户外电视收视行为的监测,这仍然只涵盖电视屏幕。四是测量电视节目延伸到互联网个人终端包括电脑、PAD和智能手机等屏幕上的收视行为。五是围绕电视节目传播与社交媒体讨论之间的互动关系,定量研究社会化电视及其营销价值。六是建立电视节目传播与互动的即时入口,连接电商和互联网金融,通过即时互动营销,打通收视、广告与消费。

以上前三环节可并称为TTV(即Total TV Viewing),指基于电视屏幕的总收视;前四个环节合并称TVV(即Total Video Viewing),指视频总收视;加上第五环节并称STV(即Social TV Viewing),称社会化收视;再加上第六环节并称CTV(Consuming-connected TV Viewing),即消费化收视。由此,在电视升级与转型的轨道上,可以说:“无电视不视频,无视频不消费。”

实际上,在国内收视率抽样调查中,广泛应用于数字电视、IPTV等收视行为调查的音频采集和匹配技术还只是原有体系中的技术升级。真正的“收视率+”是在多屏调查、多元数据融合领域的拓展与创新,与“电视+”及其价值延展相映衬。目前的电视收视数据抽样虽小,精细度也有限,但更能反映真实情况;而大数据由于在行业内数据不融通、不分享,还处于只反映局部情况的阶段。所以,混合调查是目前国际上较为通用的解决方案,即采用小数据反映收视市场全貌,大数据反映局部场景。

媒介融合进程对收视率调查的发展起到了重要调控作用。“收视率+”的进程没有完美的一揽子解决方案,从混合到融合的渐进式发展路径不可跨越。大数据能否在收视率调查中发挥更大的作用,取决于行业大数据共享机制与应用规范秩序的建立。只有这样,才能实现真正意义上的数据价值流动,造福于电视的“互联网+”。

(作者系央视—索福瑞媒介研究有限公司副总经理)

【本文系《传媒》杂志供稿】

(责编:赵光霞、宋心蕊)



我要留言

进入讨论区 论坛

注册/登录
发言请遵守新闻跟帖服务协议   

同步:分享到人民微博  

社区登录
用户名: 立即注册
密  码: 找回密码
  
  • 最新评论
  • 热门评论
查看全部留言

24小时排行 | 新闻频道留言热帖