人民网
人民网>>传媒>>人民网奖学金>>复旦2018

大数据时代新闻生产新模式:新闻推荐平台的理念、实践与思考

——以“今日头条”为个案

李晗
2019年01月08日18:51 | 来源:人民网研究院
小字号

1995年,舒德森在《新闻的力量》中设想了这样一个世界:政府、企业、政党候选人、游说团体、教会与社会运动通过家用电脑将信息直接传递给公民,公民则通过电脑网络连接他们需要的任何信息来源。在20多年后的今天,舒德森设想的世界早已实现,我们进入了人、机、物高度融合的网络化的大数据时代。[ 李国杰,程学旗,大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考,战略与决策研究,中国科学院院刊,2012年,第27卷,第6期] 大数据与社会化媒体、移动互联网、物联网、人工智能、云计算等技术应用紧密相关,其所具有的5V(Volume,Variety,Velocity,Value,Veracity)的优势现已得到普遍的认可,并在不同的学科领域得到理论的检视和实践的应用。在技术变革日新月异的当下,大数据的发展状态可以说是业界的实践在引领,学界的研究在追逐。[ 喻国明,王斌,李彪,杨雅,传播学研究:大数据时代的新范式,新闻记者,2013年,第6期] 而近年来,在新闻传播领域,基于大数据的推荐系统正在对传统的新闻生产模式带来颠覆性的变革。因此,本文将以“今日头条”(目前国内最大的基于数据挖掘的新闻推荐产品)为个案,对“新闻推荐”兴起的背景、其对传统新闻生产模式带来的变革以及目前存在的问题和挑战进行探讨。

一、“新闻推荐模式” 的兴起

1. 大数据技术驱动产业创新

2017年6月,腾讯调整了网络媒体部门架构,取消频道制,成立内容生产部与资讯运营部,将内容生产与运营分发分离,这标志着腾讯成为又一个向“今日头条”技术模式屈膝的新闻门户网站。而早在2006年,由赫芬顿邮报创始人Jonah Peretti 创办的Buzzfeed已经开启了聚合大量新闻来源,向用户推荐新闻的信息分发模式。“新闻推荐模式”的兴起首先以技术的发展为依托。技术性的力量不仅深入媒体“腹地”,甚至在以科技之名“改造”着媒体,而其中的一个核心,是内容分发平台的再定义。[ 彭兰,移动化、智能化技术趋势下新闻生产的再定义,新闻记者,2016年,第1期] “个性化”的新闻推荐的实现以数据挖掘、算法分发、机器学习等为其背后的技术支撑,可以说是有着根深蒂固的“互联网基因”。

基于大数据的“新闻推荐模式”充分地利用了大数据作为一个信息系统所内含的强大容量和丰富度,使其成为一种可资利用的收集、分析、报道新闻的机制。自互联网兴起以来,国内外的纸媒都受到很大冲击,纷纷向互联网转型;而自以今日头条为代表的“新闻聚合和推荐”平台兴起以来,传统新闻媒体的门户网站和客户端也受到了明显的冲击,形成了以原创内容为核心的商业模式向技术模式转型的趋势。在今日头条的创始人张一鸣看来,目前传媒行业发生的变革,是技术进步带来的社会分工的进一步细化,是一个行业工业化程度提高的必然结果。[ 张一鸣,机器人与客户端的个性化追求,中国记者,2015年第4期] 从一定意义上讲,数据与算法正在重塑新闻业的整个生态系统,无论是新闻的采集与生产、还是新闻的分发与消费。因此,当人工的“采编发”在与机器的较量中不断处于劣势时,基于大数据的“新闻推荐模式”的兴起与媒体的“算法化”潮流则成为行业发展的趋势。

2. 信息过剩与受众注意力资源稀缺

在大数据时代,如何快速有效地从海量的、繁杂的数据中获取有价值的信息成为人们关注的问题。信息匮乏并非是信息在数量上的缺乏,而是信息中缺乏受众所需的、有价值的内容。因而,基于大数据的“新闻推荐模式” 成为解决“信息过载”与受众注意力资源稀缺问题的有效方法。

根据CNNIC的统计[ CNNIC, 第40次中国互联网络发展状况统计报告,2017年7月],截至2017年6月,中国手机网民规模达到7.24亿,网民中手机上网人群占比高达96.3%,移动互联网主导地位正在强化。而手机互联网应用的使用情况显示,手机网络新闻的使用率达到82.4%,仅次于手机即时通信的使用率(92.3%)。手机网络新闻的高使用率体现了用户对新闻信息的需求,但与此同时产生的用户黏度的下降和对用户需求的精准定位成为了媒体工作者面临的挑战。

在今天,UGC(用户生产内容)已被视为是新闻生产的重要资源。而在传统新闻生产的流程中,UGC被收集利用的方式主要是人工的,需要媒体人主动地收集、分析和把关,只能将非常有限的内容用于新闻报道中。随着人类行为产生的可存储、可运算的数据量的不断增大,算法解决的核心问题正是如何识别、筛选和分发信息。重视与用户建立有效连接,把握用户个性化需求是新闻生产在未来的必然趋势。用户的个性化信息需求将由两个维度驱动:一个是基于个体偏好的需求;另一个是基于空间或情景的需求。[ 刘义昆,赵振宇,新媒体时代的新闻生产:理念变革、产品创新与流程再造,南京社会科学,2015年第2期

] 对以关系为纽带的社会网络的挖掘和利用、对社会生活的广泛嵌入性以及对信息的规模化处理是向用户推送“符合偏好”、“符合时宜”的内容的基础。因此,基于大数据的“新闻推荐模式”的兴起是“硬性的”技术发展与“软性的”社会需求二者共同的结果。

二、对“今日头条”的个案分析

创办于2012年8月,根据第三方移动数据监控机构QuestMobile的数据显示,截止2017年底,今日头条已经累计有超过6亿的激活用户,月活跃用户(MAU)高达2亿。而截至2017年6月,今日头条的用户平均每人每天消费46条资讯,平均每篇资讯被用户在其他平台二次传播37次。作为国内目前最大的内容创作与分发平台,对大数据和算法的应用是今日头条得以在短时间内获得巨量用户和高用户黏性的根本所在。在创办之初,今日头条的理念是“我们不生产新闻,我们是新闻的搬运工”,将产品定位于一个新闻的聚合与分发平台;而随着今日头条内部的不断变革,其于2013年推出的“头条号”则成为一个开放的内容创作平台。在清华大学新闻与传播学院新媒体研究中心和今日头条共同发布的“智能时代的新内容革命——2017新媒体发展趋势报告”中,“新内容革命”是指随着智能化技术进入内容行业而带来的各环节的全面升级,即“智能化驱动的内容生产2.0+算法为核心的内容分发2.0+个性化与社交化交织的内容消费2.0”。因此,在网络新闻应用呈现出资讯聚合平台化、跨界竞争激烈化和技术核心化三方面趋势的当下,传统媒体如何在这一浪潮中实现“革命”,今日头条是一个可资借鉴的的成功案例。

1.聚合内容:“今日头条” 如何生产?

今日头条在创办之初对传统媒体带来的最颠覆的影响是今日头条的团队中没有一名采编人员,60%的员工都是产品技术人员。而今日头条平台中海量的资讯内容主要来源于两部分:一是具有成熟内容生产能力的PGC平台,二是UGC用户内容。PGC平台以“头条号”为主要内容来源。截至2017年7月,“头条号”平台的账号数量已超过80万个。这些“头条号”包含了媒体、国家机构、企业、社会团体、社交媒体意见领袖等,其目标是增加平台的优质内容,帮助内容生产者在移动互联网上高效率地获取更多曝光与关注。将用户生产的内容纳入信息来源,在开源的同时提升了原创和独家内容的比例。

今日头条还通过平台联动扩大内容源,其推出的“同步发文”功能,通过与其他互联网平台的联动获取用户的大数据,将内容生产者在其他平台发布的内容同步到今日头条。而用户在使用社会化网络时产生的大量实时数据也更新着流行事件,反映了新闻热点的变化。针对内容创作者,今日头条还推出了一系列内容补贴计划,2015年9月,今日头条推出了“千人万元计划”和“新媒体孵化器计划”。在2016年3月,今日头条成立了2亿人民币规模的内容创业投资基金,同时启动了“头条号创作空间”。2016年9月,在“头条号”创作者大会上,今日头条再次提出,投入10亿人民币补贴给“头条号”上的短视频创作者。

今日头条虽然不参与主要新闻内容的生产,但其基于互联网生产逻辑的信息聚合已对重构新闻业态产生了革命性的改变。截至2016年,全国传统媒体客户端仅为231个,而与今日头条合作签约的新闻媒体超过了2800家,每日生产20万篇新闻。[ 李珍晖,朱婷婷,信息扩散与内容生成:个性化新闻平台发展研究,现代传播,2017年第3期] 今日头条打造的内容生态平台抓取互联网上各种渠道的信息,整合到其网站和客户端,聚合了海量内容的生产与提供方,使由用户、专业内容生产者、广告方与投资者组成的多元主体实现了互利共赢。今日头条的创始人张一鸣认为,今日头条是在连接人、信息与服务,是内容生产者与内容消费者之间的桥梁。在传媒产业链的内容生产这一端,今日头条将内容生产模式从机构垄断转变为社会协同[ 王卉,张文飞,胡娟,从今日头条的突破性创新看移动互联网时代内容产业的发展趋势,科技与出版,2016年第6期],变革了传统的新闻生产模式。

2. 个性化传播:“今日头条” 如何分发?

2017年4月开始,“今日美国”改版其手机端,通过大数据挖掘用户阅读兴趣、推送差异化内容。仅一个月后,每篇文章的阅读时间从25秒增加到45秒,增加了75%。此外,文章的完整阅读率和二级页面点击率都有显著提高。这标志着“今日美国”的信息分发机制从编辑推荐向算法推荐转变,这也是国内外新闻网站和移动端变化的大趋所势。[ https://mp.weixin.qq.com/s/aF-Tbjtx3aM_xOjWcfkaSQ] 国内新闻分发模式的改革则可以追溯到“今日头条”开创性的算法推荐机制,即将“个性化推荐功能”作为其核心产品运营,以传播方式作为个性化的表征。

内容分析和对用户标签的挖掘是“今日头条”搭建推荐系统的基石。推荐系统运转的核心则是一套由代码搭建而成的算法。“今日头条”的算法通过整合三个维度的变量:内容、用户特征(社交+个性)、环境特征(移动互联),记录用户在今日头条上的每一次行为,通过主动的机器学习,在海量的资讯里知道目标用户感兴趣的内容,甚至知道其可能感兴趣的内容,为用户推荐相同主题的内容,实现信息的精准和个性化推送。对用户进行兴趣“画像”的方式使不同层面的受众需求得以细分化、定制化,达到信息与受众个人兴趣的高度匹配。

因而,在以“今日头条”为代表的媒体进入基于大数据的算法分发模式时代后,千篇一律的布局已经成为过去式,每一个用户都拥有属于自己的个性化的新闻浏览主页。机器算法在一定程度上决定着信息的意义、信息的流向,以及受众对信息感知的方式。[ 陈昌凤,王宇琦,新闻聚合语境下新闻生产、分发渠道与内容消费的变革,中国出版,2017年第6期] 多样化的推荐模式也反映了全新的受众信息接受生态,融合人工智能的匹配算法使搜索引擎能够理解内容,围绕用户属性、习惯和兴趣标签提供个性化的主动推荐。因此,通过算法推荐的信息流模式,正在替代用户的一部分主动搜索行为。“所谓个性化推荐,本质上不需要用户做出任何选择,只有让用户越方便,越偷懒的应用,才能体现出真正的个性化推荐。”[ 张一鸣,机器人与客户端的个性化追求,中国记者,2015年第4期]

三、“新闻推荐模式”对传统新闻生产的变革

1.传播者的变革:传播权力的更迭

拉斯韦尔的经典5W传播模式中,传播者处于传播链条的顶端,影响着传播内容的生产、传播渠道的选择、受众的接收以及传播的效果。在传统媒体时代,新闻生产长期被组织化的媒体机构垄断,记者、编辑扮演着“把关人”的角色,拥有发布和解释新闻的权力。而“把关”过程本身常常受到包括政治、经济、社会文化、组织惯例、技术、传播者个人等在内的因素的影响,因此传统的新闻生产的特点体现在它的组织化与专业化程度,但其也是相对封闭的,在传播与控制之间维持平衡。

而“今日头条”等新闻聚合平台则呈现出与传统媒体截然不同的新闻生产逻辑,主要体现在新闻生产的来源已发生结构性变化,非专业媒体人甚至非人工采集的信息将占有越来越大的比重。[ 彭兰,大数据时代新闻信息资源的结构性变化及其影响,中国广播电视学刊,2013年第7期] 算法背后的生产者不仅仅有传统的新闻媒体,更包含着政府部门、社会团体、自媒体以及普通公民。传播的权力从单一的组织化的媒体机构转移到多元化的传播主体手中。尤其是UGC内容的聚合使原创自媒体内容正在获得与专业化的传统媒体内容相匹敌的受众数量,甚至是更大的吸引力,挤压传统媒体的生存空间。

融合时代的新闻生产将对传播者产生更高的要求,如何获取受众有限的注意力资源,在报道内容的速度与深度之间保持平衡将成为未来新闻生产变革的趋势。新闻生产应成为动态的过程,不断地采集、不断地补充、不断地更新。[ 邵全红,移动聚合类新媒体对传统媒体新闻生产的颠覆与再造——以“今日头条”的新闻生产模式为例,新闻爱好者,2017年第1期] 新闻生产也应成为开放的过程,将内容生产模式从机构垄断转变为社会协同。[ 王卉、张文飞、胡娟、从今日头条的突破性创新看移动互联网时代内容产业的发展趋势,科技与出版,2016年第6期]

2.传播渠道的变革:从单一组织到平台化

从新闻媒体诞生之日至今,新闻的分发渠道主要经历了如下三个阶段的变革。

在传统的精英时代,新闻内容的生产与分发通常是一体的,媒体对内容的分发渠道往往垄断式地占据。而在社交时代和今天的算法时代,新闻生产者与其内容的发布渠道在一定程度上发生了分离,媒体之外的分发渠道对内容生产者的影响越来越大。社交媒体平台实现了非专业人士对媒体内容的分发与扩散,而算法的应用则实现了非人工的内容分发。

内容分发的竞争是传播者对于渠道控制力的竞争。在内容分发的2.0时代,今日头条、Buzzfeed等已经对媒体内容分发形成强大控制力。这些基于移动端的内容分发平台,将搜索、个性化推荐、社交等合为一体,减少了用户在新闻、视频、直播、问答社区等不同平台之间切换的成本,而这些方面都是传统媒体的“短板”。技术性公司借助其平台优势,成为媒体内容的新型 “营销商 ”。[ 彭兰,移动化、智能化技术趋势下新闻生产的再定义,新闻记者,2016年第1期]

而基于大数据的推荐系统在电商、搜索引擎等领域取得显著成效后,也在近年来实现了与媒体的“联姻”。通过算法完成的信息/产品/服务与用户之间的关联,对于媒体平台而言,体现在内容与读者的匹配。在内容端与用户端连起的网络减少了信息的冗余,实现了多媒体内容?多平台渠道?多元主体的分发链条,提高了内容的分发效率。

3.传播内容的变革:从新闻到资讯

新闻是传统媒体生产与传播的主要内容,而陆定一提出的“新闻是新近发生的事实的报道”可以说是对“什么是新闻”的经典界定。在这种背景下,新鲜性、重要性、接近性、显著性以及趣味性成为衡量新闻价值的关键要素,是媒体从业者进行新闻生产的依据之一。而以今日头条为代表的媒体聚合平台所分发的并不是狭义上的“新闻”,而是广义的“资讯”。

随着技术的发展,数据新闻、传感器新闻、机器人新闻等业界实践的开展不断革新传统的新闻形态,带来了新闻信息资源的结构性变化。[ 彭兰,大数据时代新闻信息资源的结构性变化,中国广播电视学刊,2013年第7期] 多元的新闻产品满足了碎片化的受众的个性化需求,通过为细化的受众量身定做符合其需求的内容实现更好的传播效果。上文已经提到,受众的个性化需求基于两个维度:一是个体偏好,二是空间或情景的需求。因而,在移动互联网时代,移动社会化网络数据和基于位置的GPS数据成为了重要的数据,构成了新闻内容的一部分。

尽管新闻的形态、传播的渠道、受众的需求都因技术的更新而发生变化,但“内容为王”依然是媒体实现竞争力的关键。“今日头条”推出的“头条号”和针对内容创业者的计划正体现了其对优质的新闻内容的追求。在新闻资源日益丰富化的当下,同质化也成为媒体面临的困境。因而公民新闻与专业新闻之间不是替代关系,而是一种优势互补的关系。整合PGC与UGC内容,依靠内容和质量获得公信力是未来媒体应该依靠的路径,而不再是作为信息的唯一提供者。[ 刘义昆,赵振宇,新媒体时代的新闻生产:理念变革、产品创新与流程再造,南京社会科学,2015年第2期]

四、“新闻推荐模式”面临的问题和挑战

1.“信息茧房”与“过滤气泡”的形成

“信息茧房” 和“过滤气泡”两种现象都是针对媒体产品的用户提出的。“信息茧房”是指随着注重社交性的信息聚合平台的兴起,信息的分发很大程度上取决于用户的社交链。因而用户容易在自身周围形成“茧房”,沉浸在与自己的兴趣和立场相同的内容之中,而将与自身价值观相悖的信息排除在外。“过滤气泡”(filter bubble)的概念则是伊莱·帕里泽于其2011年的著作《过滤气泡:互联网没有告诉你的事》一书中提出的,即互联网过滤器具有记录功能,能够根据对用户行为的记录建立不断完善、更新的预测机制,从而实现对用户网络使用习惯的定位。因此,我们在媒体平台上获取的信息是算法推测出的信息和用“过滤气泡”过滤后的产物,未必是用户真正需要的信息。

“信息茧房”和“过滤气泡”的形成对个人和社会会带来三个主要问题:一是使用户接收的信息窄化。对用户个人价值偏好和阅读习惯的过度关注会导致信息传播的偏向,使个性化传播成为“信息孤岛”。二是“今日头条”等媒体致力于打造的“千人千面”的媒体平台,使得没有两个人收到完全相同的新闻推送,[ 王茜,打开算法分发的“黑箱”——基于今日头条新闻推送的量化研究,新闻记者,2017年第9期] 削弱了传统媒体的议程设置功能,威胁了新闻在社会中所发挥的整合作用。三是算法本身固有的弊病。基于大数据的算法所推荐的信息未必是用户真正需要的,用户真正感兴趣和需要的信息反而可能被排除在“过滤气泡”之外。长此以往,将会降低用户的使用率和黏性。

2.“把关人”缺失,优质内容稀缺

2017年底,国家互联网信息办公室,针对“今日头条”、“凤凰新闻手机客户端”持续传播色情低俗信息、违规提供互联网新闻信息服务等问题,责令其暂停其停止违法违规行为。今日头条的多个频道暂停更新了24小时。国家对今日头条的媒体平台的内容整治体现了“把关人”弱化所导致的内容质量的下降。

“今日头条”等内容聚合平台依靠大量的UGC内容,其中良莠不齐。为了达到吸引眼球的目的,有些内容必然会成为“标题党”或者走向低俗化、“煽色腥”的老路,引发用户的审美疲劳和反感。“今日头条”在近年来多次陷入的“版权纷争”也体现着内容来源的不可控。优质新闻内容是媒体的核心资源和宝贵资产,更是新闻行业健康有序发展的关键。如何在“吞吐量”、“多元化”和“优质”中达到平衡,是未来的媒体所面临的艰巨挑战。

3.大数据与个人隐私

大数据凭借其开放性和整合性形成了“数据化民主”的趋势,被经济学家和技术专家认为是现代社会进步的体现。但大数据同样也是一把双刃剑,个人数据的开放将对个人隐私带来严重的侵犯。基于大数据的推荐系统往往依赖于对用户社会化数据的收集、分析和预测,一旦用户将社交媒体账号与媒体聚合平台绑定后,其个人信息将完全曝光于计算机算法。

而“今日头条”、Facebook 等超级媒体平台因其聚集的海量用户,已经具有相当的垄断色彩,主导着全球的用户数据,明察每个内容消费者的行踪。以此方式实现的对用户隐私的侵犯往往是隐蔽的和长期的。用户数据的泄漏对于媒体巨头和投资商而言是赚取广告费、实现盈利的方式,但对用户个人乃至社会的信息安全则存在巨大风险,将是大数据产业发展中不可回避的问题。

五、总结与思考

以“今日头条”为代表的新闻聚合和推荐平台,凭借技术的革新和社会的需求而兴起并成为行业转型的潮流,在传播者、传播渠道和传播内容等方面较传统媒体产生了巨大变化。传统媒体无论是在传播理念、技术手段、内容呈现还是体制机制方面都与新型的媒体聚合平台存在客观差距,原有的传统媒体发展逻辑是难以为继的。[ 喻国明,互联网逻辑下传媒产业转型升级的关键与发展近路,新闻与写作,2014年第7期] “人、机、物”的融合使新闻生产和分发进入了人机协同时代。[ 王佳航,数据与算法驱动下的欧美新闻生产变革,新闻与写作,2016年第12期]

随着新闻生态发生的颠覆性转变,我们正在离开信息时代,迈入推荐时代。[ 喻国明,大数据对于新闻业态重构的革命性改变,新闻与写作,2014年第10期] 但在对技术高歌的同时,我们也应该看到当下的“新闻推荐模式”所产生的问题和媒体行业所面临的严峻挑战。如何在内容的专业性与个性化模式之间达到平衡,如何在数据、技术决定论与传播权力之间达到平衡,如何在公共利益与商业收益中达到平衡是实现从生产、聚合到分发的多方共赢的生态系统的关键,只有这样才能将媒体的竞争力真正释放出来。 

(责编:尹峥、赵光霞)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部