人民网
人民网>>传媒>>人民网奖学金>>华中2015

机器新闻发展的市场进路及反思——以Autamated Insights公司为例

李苏
2016年03月10日14:40 | 来源:人民网研究院
小字号

摘要:新闻生产自动化已经进入新阶段。数据和算法是驱动Autamated Insights公司机器新闻生产的基本动力;“人机合作”的机器新闻发展理念影响着新闻编辑室原有的分工,并对新闻记者的职业技能提出新要求;垂直开发模式成为Autamated Insights公司开拓机器新闻市场的主要途径。反观Autamated Insights公司在新闻市场上的拓展思路和方式,技术的局限、新闻竞争乏力、盈利模式模糊等问题还需进一步思考和研究。

关键词:机器新闻 Autamated Insights公司 数据 算法 垂直开发

2014年3月,美国加州发生一次小地震,《洛杉矶时报》在事发后3分钟就迅速通过网站对此事进行了报道。事后,这篇出自机器人之手的报道,引发了很多网民的讨论和好奇。事实上,机器参与新闻报道活动在新闻业内早已不是新鲜事。产生较大反响的事件就有:2002年,美国将机器人记者投入到阿富汗战场,辅助记者采访;2006年Thomson Reuters集团宣布使用算法来为它的网站编撰财政新闻;2007年,美国第一家自动化生产新闻的科技公司Statsheet(Autamated Insights公司的前身)宣布成立。随着传统知名媒体如洛杉矶时报、美联社、福布斯、卫报等相继将新闻自动生成系统引入新闻编辑室,机器新闻的生产开始超越兴趣爱好和技术创新层面,指向广阔的新闻市场。

关于机器新闻可从广义和狭义两个层面来理解。从广义上来看,机器新闻又称为机器人新闻(robot journalism),或自动化新闻(automated journalism),是指人工智能技术在新闻写作、采访、编辑、主持等新闻活动中的具体运用,如美国Autamated Insights公司运用Wordsmith自动运动写作软件进行的批量信息生产,美国西北大学运用智能软件Narrative science主持的一档“7点新闻”项目,日本仿真人电视主播播报电视台新闻、主持新闻发布会以及正在兴起的无人机新闻等。狭义层面的机器新闻则仅指机器写作的新闻(machine-written news)或计算机生成新闻(computer-generated news),它是基于数据统计和机器学习,运用计算机自动算法从可识别的数据中提取具有新闻价值的信息,形成新闻报道角度,自动选择语词样本、新闻报道模板生成的新闻故事。本文关注的是狭义层面的机器新闻。

随着机器自动处理庞大数据的能力日益增强,不少科技公司和媒体组织表现出运用机器自动生产新闻信息,降低成本,开辟市场的热情。本文以Autamated Insights公司的机器新闻生产为例,从机器新闻生产的一般原理出发,思考机器接入新闻业的方式及其业务开发模式,反思机器新闻的发展思路和拓展方式,以期为新闻业的数字化转型提供参考。

一 Autamated Insights公司及其新闻自动化生产

1、关于Autamated Insights公司

2007年,艾伦罗比创办了美国第一家利用机器人生产新闻的公司——StatSheet。2011年,公司进行改组,成立Autamated Insights公司。此后四年时间,Autamated Insights公司服务的对象迅速拓展到雅虎、美联社、福布斯、三星、微软等著名品牌,具体业务涉及新闻报道、数据分析、写作程序开发等业务。

目前,从Automated Insights公司官方网站公布的生产数据来看:Automated Insights公司开发的Wordsmith生产平台在2013年共计生产了3亿篇各类形式的报告,平均每秒钟生产新闻故事约2000篇;2014年报告的产量超过10亿篇,通过Wordsmith平台为超过2000个移动应用提供内容产品。数据库建设方面,Autamated Insights公司仅体育方面的专有数据就多达二十多亿,公司拥有的独特内容和页面100多万个,每月还在以15000——20000篇的速度不断增加各类原始文章[1]。就Autamated Insights公司的财务情况来看,Autamated Insights公司主要依靠投资者以及与之达成主要业务合作协议的美联社、雅虎等的支持。据其官方网站公布的2009到2014年间发生的几笔较大募集金额来看,Autamated Insights公司共募集资金1084.7万美元[2]。其具体营收情况如果按Autamated Insights 公司的CEO艾伦在一次公开发表的谈话中所提到的每篇报告8美元推算,2014年该公司超过10亿条报告将带来约80亿美元的收入[3]。2015年Autamated Insights公司宣布转投私募股权投资公司Vista Equity Partners,成为(领先体育信息技术公司)STATS LLC旗下的一家子公司[4]。此举一出,虽引起不少人对其财务情况的猜测和担忧,但显然Autamated Insights公司谋求新闻自动化生产的发展热情仍在延续。

2、Autamated Insights的新闻自动化生产

与Autamated Insights公司惊人的生产能力紧密相连的是其锻造的完全自动化的新闻生产流程。从生产流程来看,该公司主要借助数据库、人工智能和数理统计基础,依靠计算机程序将一些数据融入结构化语言来实现新闻报道的自动化批量生产和推送服务。以该公司开发的Wordsmith生产平台为例,该平台生产一则机器新闻大致要经过五个操作步骤:消化数据;计算出数据中的新闻价值;明确相关角度,并对之进行优化选择;将角度和叙事模板连接起来;输出文本[5]。在这一基于数据和算法的自动化新闻生产实践过程中,从计算机运用算法软件在海量数据中寻找规律、相关性和关键见解,到用简单的英语进行叙述,形成叙事报告,都是通过植入算法程序独立完成。

二 Autamated Insights机器新闻发展的市场进路

Autamated Insights公司将机器全面接入新闻生产流程,借助规模化数据和自动算法形成内容生产优势,描绘了“人机”合作的美好蓝图,以垂直开发的模式开辟进攻新闻市场的主渠道,谋求机器新闻发展的市场进路。

(一)数据和算法是驱动Autamated Insights公司进攻新闻市场的基本动力

传统媒体的新闻生产受资源的稀缺性和成本的约束,与众源、UGC等信息生产增长模式相比,传统媒体在内容规模和生产速度上明显处于弱势。而借助规模化数据和自动算法,机器新闻的自动化生产对部分传统媒体的内容生产正形成明显的可替代优势。

1、数据是机器新闻生产的“原油”

1968年,美国明尼阿波利斯《明星论坛报》的编辑兼出版商Otto Silha在一次公开演讲中,构想了一架未来的编辑机,这架编辑机能“用数值确定故事中每个单词的价值,并通过数学公式确定故事中最重要的是什么,然后按照指示,重新生成故事。”这一构想的重要意义在于Otto Silha较早地认识到“数值”转变在自动化写作中的重要性。今天,正是来自商业报道的财报、体育报道的赛事、医疗的临床数据、天气预报的气象指标、教育的升学和就业指数、交通路况的行车流量等不同领域的信息,经过数据化处理后成为驱动机器自动撰写新闻报道的不竭“原油”。Autamated Insights公司的机器新闻生产实践中,将开发的Wordsmith自动化写作平台与数字比较敏感的相应平台连接,即时获取数据,实现迅速完成数据自动处理和信息发布的工作。美联社2014年7月开始使用该软件自动撰写部分财报,季财报数量迅速从300篇上升到4000-5000篇不等,给美联社带来了明显的营收增益。

机器之所以能运用数据快速进行自动化新闻生产,不仅取决于Wordsmith之类的自动写作软件已具备对数据进行快速处理的能力,更重要的是数据本身具有规模化、操作透明化、获取开放性等“媒介性”[6]。当Wordsmith数据处理平台自动获取大规模数据,运用算法进行处理,以图形、数据为基本呈现符号,以长文本叙事、短模板公告、可视化、推特文和头条等多种形式输出,并实时推送至任何屏幕上时,这为Autamated Insights公司的机器新闻赢得了进入读者市场的绝佳机会。

2、算法是机器自动生产新闻的“引擎”

一般而言,一种算法是指为解决一个特定的问题或得到一个明确的结果而进行的一系列步骤[7]。在计算机信息处理过程中,算法就是一个信息转换的过程,其突出优势是自主决策,也即只要程序员用数据将算法运算的原则动态、灵活地表达清楚,算法就能在信息处理过程中自动作出决定。因此,一种运算法则往往成为开发数据,获取信息价值的基本逻辑。

目前,算法在新闻报道领域中的运用主要表现在通过数据分析实现新闻信息的快速聚类、编排和个性化推送。如由谷歌首席工程师克里希纳?巴拉特(Krishna Bharat)领导研发的一款web新闻聚合器,也就是谷歌新闻(Google News),其后台就是采用聚合算法来实现对Google新闻的首页更新和新闻推荐。在我国算法运用也在新闻报道中蔓延,如国内风头正健的数据挖掘推荐引擎产品“今日头条”,就是通过算法解读使用者的兴趣,从而向读者进行精准的阅读内容推荐。这些运用大都只实现新闻编辑、发布、推送环节的自动化,而以Autamated Insights公司为代表的机器新闻生产中,算法运用则贯穿整个新闻生产流程:数据获取和消化要通过算法对网络、移动设备和社交媒体的数据进行自动聚合和过滤;从海量数据中提炼写作角度要借助算法软件来作出决定;合成读起来通顺,且具有一定基调的自然语言需要运用语言处理算法。概而言之,Wordsmith生产平台就是建立在以算法为中心的数据分析和机器学习的程序设计之上,算法是驱动其进行信息高效生产的“引擎”。

(二)“人机合作”是Autamated Insights公司发展机器新闻的基本理念

机器新闻依靠庞大的数据源,功能强大的算法回应新闻市场对低成本、大批量、个性化信息的需求,其“人工合作”的发展理念不仅影响着新闻编辑室工作的再分工,还对新闻工作者职业技能的提升提出了新要求。

1、“人机”合作对新闻编辑室的再分工施加了新影响

从Autamated Insights公司近年来与部分新闻编辑室的合作方式来看,主要有两种:一种是媒体机构将部分数据获取程式化、模板稳定的新闻写作任务分离出来,交给Autamated Insights公司来生产,媒体机构负责提供数据资源和发布平台。较为成功的如,美联社2014年7月开始与Autamated Insights公司就财报生产达成合作协议,采取将财报业务完全委托Autamated Insights公司来完成,使得财报数量迅速上升,有效压缩生产成本,财报记者也一定程度摆脱了处理财报数据的繁琐。另一种较为常见的方式是科技公司负责依据媒体报道或信息咨询服务的需要,开发相应的自动化写作软件,植入数据平台,自动实现数据的追踪、收集、整理、撰写和发布。如Automated Insights联合美国最热门的健身网站开发一款叫“Bodyspace”的应用软件,将算法直接植入健身网站,追踪、分析和整理用户数据,以此实现运用信息服务协助用户强化健身计划的目的。

虽然Autamated Insights公司的机器新闻写作尚处在人与机器如何接入生产流程的探索阶段,但将“机器能胜任的收集、整理、推送和撰写工作交由机器完成”[8]的“人机合作”理念正日益影响一些知名新闻编辑室工作的分工,如洛杉矶时报、雅虎、福布斯等知名的媒体机构正在获得将机器引入新闻生产线的新共识。随着人机合作程度的不断演进,新闻编辑室工作的进一步分解将继续,新闻工作者职能也将面临更清晰的界定。

2、“人机合作”对新闻工作者的职业技能提出了新要求

当机器新闻能代替专业新闻工作者完成部分信息收集和传播工作,并且能通过算法读懂受众需求,提供个性化服务时,新闻工作者的职业角色或许将不再由其拥有的技能来决定,而是由其与机器取得联系,共同完成的新闻任务来决定[9]。甚至有研究人员认为未来的“人机”合作趋势是将人更好地设计到技术生产线中去[10]。无论如何,“人机合作”的理念引入到新闻生产中势必对新闻专业工作者职业技能提出新的要求。

2012年,2014年国际颇有影响力的两大媒体研究中心——哥伦比亚大学Tow Center和波因特研究院先后就新媒体时代记者应具备的技能进行调查,结果显示熟悉数据和统计知识,具备基本的编码知识正被纳入新闻记者核心技能培养体系。显然,随着以机器自动化生产为代表的数据处理技术在新闻业内的成功实践,新闻业内越来越清醒地意识到机器自动处理数据并不意味着人在机器新闻生产流程中可以缺位,相反机器新闻生产的兴起对促成机器自动化生产的“元作者”将有特定的要求。举例来说,如果Autamated Insights公司要创建一台可报道某场体育比赛的写作机器,那么至少需要这样一些“元作者”参与:记者——为机器准备该行业常见的句子;程序员——编写程序。在这些“元作者”的帮助下,机器能通过接受写入程序的“培训”,运用算法学习数据库中的赛事评论文章,了解赛事的常用词汇,撰写出诸如“Kenny of Wins Gets Massive Upset over The Wedding is Over ,Moves to Second Place”(婚礼结束后,肯尼赛场失利,移到第二位)之类的文章。这类机器新闻的出炉,记者和程序员是名副其实的“把关人”,他们才是寻求互联网时代那一小段优秀“DNA”的真正植入者。当然,“元作者”也不是某一独立行动的个体的指称,而是一个合作团队,这一团队将与机器共同完成工作的分解和分工,重新勾画新闻工作者的职业边界和技能要求。

机器写作替代新闻记者的部分信息收集、整理的职能,对新闻记者而言,并非敲响了其职业丧钟,而是将记者从繁琐、重复率比较高的新闻工作中解放出来,腾出更多的时间专注于更复杂的深度报道和目击者报告(Lou Ferrara.2014)[11],这种“人机”合作的方式其目的是实现新闻报道和服务质量的提高。

机器新闻生产促使新闻编辑室工作的再分解,新闻记者职业技能的提升,其实质是利用当代传播技术对包括人在内的各种媒介元素的再整合。这种整合不仅显示出Autamated Insights公司这样的企业在市场机构中所具有的竞争地位,还揭示了新闻编辑室面临的将不再是如何人为地捍卫新闻生产领域的霸权地位,而是解决如何将自身更好地接入新闻市场,通过自身的产业行为和绩效给新闻市场结构带来新调整的问题。

(三)垂直开发是Automated Insights公司开辟新闻市场的主要途径

关于垂直开发的理念,近年来不断延伸。一般而言,垂直开发是指注意力集中在某些特定的领域或某种特定需求。就新闻信息开发而言,就是提供有关这个领域或需求的全部深度信息和相关服务。目前,Automated Insights公司提供的服务虽广泛涉及新闻报道、行业报告、信息咨询、个体服务定制等与数据分析相关的领域,但从其主业拓展的思路来看,仍以垂直开发为主。

就Automated Insights公司而言,体育赛事报道是该公司做的第一个垂直项目,也是该公司目前做得最成功的业务。2010年10月,该公司推出了一个连接345个网址,提供关于NCAA(全国大学体育协会)每年一次的大学篮球项目的深度报道网站。这是第一个完全由高质量自动内容驱动的网站。通过不断积累,该公司目前连接的网址已扩展到417个,提供覆盖每一个学院专业团队和学员的排名、预览、分享等信息[12]。随着发展,该公司提供的报道形式也愈加丰富,业务动向更加清晰,比如2011年10月,Automated Insights宣布发起STAT.US Twitter体育运动网,利用STAT.US上的一些体育运动团队和运动员账号及时报道 NFL、MLB、NBA和NCAA大学足球和篮球的情况,探索与社交媒体绑定,及时将各种形式的体育赛事报道向移动终端推送的方式,这些创新不仅进一步充实了该公司的数据库,也进一步优化了其信息服务方式。2011年9月Statsheet正式更名为Automated Insights后,公司采取一方面继续巩固和发展体育赛事报道的强项,另一方面将具有广泛适用性的创新技术向金融、房地产和天气等数据密集型领域做垂直渗透。这一发展策略的调整标志着Automated Insights将机器自动生产革命进一步瞄准一些极富潜力的领域,在战略上进行深度调整。

与此同时,通过网络营销建构机器新闻生产的口碑形象也是Automated Insights公司成立以来一直着意经营的重要方面。Automated Insights公司先后建立了两个以stat sheet 和automatedinsights命名的网站,主要呈现重点客户、软件运用、产品开发、销售策略、反馈信息等相关情况。其目的是通过在线互动、链接建立或维持客户关系,协调满足公司与客户之间交换概念、产品和服务的目标。

三 机器新闻发展带来的思考

2015年2月,Automated Insights宣布转投Vista Equity Partners,成为专注于做体育数据深度分析的STATS公司旗下的子公司,不管Automated Insights公司的未来前景是否如声明中所预期:“加入Vista和STATS将可令Wordsmith平台以前所未有的速度改造其他一些行业,如商业智能、营销、健身和体育等。”审视Automated Insights科技公司成立近8年来的市场拓展思路和方式,不难发现,Automated Insights科技公司的新闻自动化生产仍遭遇来自技术局限、新闻竞争、盈利模式等方面的限制,如何突破这些发展瓶颈还需进一步思考和研究。

1、技术局限影响着机器新闻的快速发展

首先,数据资源的获取受到操作技术的限制。这些限制主要包括数据存储、提取、消化和呈现过程中出现的数据变形失真或失去意义、数据滥用等。机器新闻生产对结构化数据的依赖,数据库配置的要求则从外部约束了数据的来源。因为,只有那些对数字比较敏感的领域,如天气、金融、政治选举、交通、体育等领域的数据才易于被标准化,容易清洗,变形的概率较低,可能提取出有价值的信息。这些技术局限在全球数据开放的进程不一,数据供应商尚未专业化,各信息单位的数据结构化尚在起始阶段,数据处理尚未形成一个统一的公开标准的情势下,数据资源获取的局限愈加凸显。

其次,信息价值的发掘受制于算法工作的逻辑。Wordsmith平台可以读取APIs,XML,CSVs,spreadsheets等各种形式的数据,但算法程序并非读取数据后都能有效发掘信息价值,且算法程序提取数据时机械地将数据与其关联的场景分开,或将微妙的情绪类行为数据简化,这些都将直接影响到信息的阐释。此外,机器新闻写作的新闻线索发现和新闻撰写角度的选择完全依靠算法得出的数值变化进行自动取舍,这种方式对记者的写作模板和公式化的语词样本库依赖性较大。在快速、大批量生产机器新闻的后面,这一生产方式不可避免地带来垃圾信息、错误信息、同质化信息、信息版权以及私人信息安全等问题的争议,也势必会遭遇来自信息法规、社会责任和伦理道德多方面的制约与诘问。

2、新闻竞争乏力限制机器新闻的市场扩张

从机器新闻的营销口碑与受众接受程度来看,机器新闻尚未获得受众市场的普遍认同。一方面,机器新闻偏向于从生产规模和时效上与媒体组织建立市场沟通,与受众群体的互动不清晰,以致Automated Insights的机器新闻让部分受众惊讶不已,却离形成口碑效应还有较远距离。另一方面,Automated Insights的Wordsmith生产平台利用语料库批量产出的报道,虽有文章基调,但仅限于满足用户的轻量化阅读,要带给用户以“悦读”体验还有很多工作需要完善。Automated Insights的机器新闻聚焦了部分数字敏感领域的垂直开发,尚不能完全替代这些特定领域的信息生产。归根结底是因为机器新闻并不能生产出与人工新闻报道相抗衡的产品,或者说机器新闻产品不具备明显的差异竞争优势。

另外,在大数据语境下,数据价值正为越来越多的人所认识,随着数据资源的获取、使用日趋便捷,许多媒体机构正向人人都会处理数据的全平台时代发展,比如,《卫报》的Ophan内部分析平台,不仅所有员工都会使用,而且新闻编辑室自己就能制作图表。再如,《纽约时报》的“Upshot”能将智能分析、写作、数据可视化与个性化相结合形成自有的利用数据和分析来报道新闻的方式。如果将机器新闻与这些知名媒体组织和个体爱好者开发的数据新闻在全平台上展开竞争,数据新闻的表达方式和开发模式无疑更具竞争力,也更受涌入数字媒体的新资金的青睐。机器新闻市场扩张的捉襟见肘则不难想象。

3、盈利模式模糊左右着机器新闻的独立发展

Automated Insights科技公司创办以来,资金来源一直以投资者提供融资为主,其自身的盈利模式尚不清晰。在市场大环境整体低迷,传统盈利模式仍主导媒体市场发展的情势下,Automated Insights科技公司在新闻业务方面的收入也因之间接受到传统媒体营收模式的影响。一方面,在当前形势下,新注入到新闻行业的资金更关注于维护主业生产和培养新的报道方式,以保障与读者更紧密、更及时的联系。因而,没有哪一家媒体公司可能短时期内将过多资金投入机器自动化生产新闻中。另一方面,作为科技创业公司,Automated Insights科技公司虽相对而言无需受制于新闻人才、编辑部建设等传统基础设施的限制,因此节约了成本,但同时也因为开发和维护技术而产生了新的成本。所以,当Automated Insights科技公司在依赖投资者提供融资和取得与部分实力雄厚的传统媒体合作的基础上开辟市场时,极易放大其在激烈市场竞争中的资金风险。2015年Automated Insights科技公司的转投似乎验证了这一问题。

结 语

以美国Automated insights为代表的科技公司抓住网络媒体对海量信息的需求这一痛点,以快速、高效、批量生产和发布信息的机器自动化生产方式冲击传统新闻编辑室的运转,并对专业工作者的职业技能提出新要求,尝试开辟自己在新闻领域的耕作园地。然而,机器新闻生产并没有形成一个垂直的产业通路,对“元作者”的依赖,对数据资源和算法技术的依赖,对媒体渠道和终端的依赖,使之不仅受制于技术偏见的影响,还面临信息法规和社会伦理道德的挑战,纵使机器新闻在内容生产上具有相对的优势,目前仍无法实现完整地占据市场一角的可能。从长远来看,随着各信息单位数据结构化大势所趋,机器新闻生产引领的下一代新闻生产革命不可避免,但从目前来看,机器新闻仍需解决市场占位的尴尬处境。

参考文献

[1]Automated Insights官方网站对其Wordsmish平台的介绍:http://automatedinsights.com/,2015年5月2日查询。

[2]同[1]。

[3]How this Artificial Intelligence CEO makes sure his daughter doesn’t become obsolete

http://www.bizjournals.com/newyork/news/2015/06/12/automated-insights-artificial-intelligence-robots.html

[4]机器写作软件Automated Insights把自己卖了http://tech.qq.com/a/20150213/004700.htm,2015年5月7日查询。

[5]同[1]

[6]Frédérik Lesage , Robert A. Hackett.Between Objectivity and Openness—The Mediality of Data for Journalism.Media and Communication, 2013 ,Volume 1 :Pages 39-50

[7]http://www.merriam-webster.com/dictionary/algorithm ,2015年5月10日查询。

[8]Arjen van Dale.THE ALGORITHMS BEHIND THE HEADLINES.Journalism Practice, Vol. 6, Nos 5 6, 2012, 648- 658

[9]同[8]

[10]Shyam Sankar 在TED的演讲视频“人机合作的崛起”中的观点。http://v.163.com/movie/2012/7/C/B/M92TD3G7N_M92TDAFCB.html,2015年5月2日查询。

[11]JOE POMPEO.At SXSW, a positive review from A.P. on robot-written news

http://www.capitalnewyork.com/article/media/2015/03/8564101/sxsw-positive-review-ap-robot-written-news(accessed26 MAY 2015)

[12]同[1]。 

(责编:王妍(实习)、燕帅)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部