人民网
人民网>>传媒>>人民网奖学金>>清华新闻2019

比较视野下的机器新闻写作研究

――以腾讯 Dreamwriter 和美联社 Wordsmith 体育新闻为例 

王雨佳
2020年01月08日13:46 | 来源:人民网研究院
小字号

摘要

新闻业的发展史也是科学技术的发展逐渐影响新闻生产方式的历史,当前人工智能技术的开发与利用正在改变着新闻业。人工智能技术在新闻领域的最热门应用就是机器新闻,即由机器基于算法进行数据的收集与加工处理,然后自动生成完整的新闻报道。关于机器新闻的特点、影响及未来发展也一直是学界热议的话题。

本研究将着眼机器新闻,首先通过概念的界定明确其准确范畴,然后在借鉴前人研究的基础上,创新建立一套新闻评价体系以进行新闻文本评价。选取国内媒体腾讯Dreamwriter和国外媒体美联社Wordsmith的体育新闻报道,将同主题的机器新闻与人工新闻作为研究文本,基于新闻评价体系对其进行文本分析,探讨机器新闻如何更好地媲美人工、如何更好地服务受众以及机器新闻将引发的行业变革。

关键词:机器新闻;人工新闻;新闻评价体系;未来变革

一、研究背景

新闻业的发展史也是一部技术进步影响新闻生产方式的历史,当前对人工智能技术的开发与利用正在改变着新闻业,促其进入“智能时代”。与新闻相关的人工智能技术包括了机器人、视觉信息处理、语音处理、自然语言处理等。

多年来,人工智能在新闻写作方面的实践一直是学界热议的话题。最早的相关研究出现于 2001 年,随后相关研究逐年递增,尤其在 “大数据元年” 2013 年之后各方面研究成果更有“井喷”趋势。

在国外,机器写作出现非常早,二十世纪八十年代,耶鲁大学就意识到了机器在写作方面的可能性,于是提出了“故事写作机器算法”的概念。机器写作的新闻作为报道的实例,则是首次出现于2006年,从那一年起,美国开始尝试其写作新闻来取代原来的记者写作。其实,虽然计算机辅助新闻”在形式方面已有了更多的优化,出现了“算法新闻”、“自动化新闻”和“新闻机器”等应用,但是它到现在也并没有得到完全的支持。 关于人工智能在新闻界的实践与启示也一直是国外学界热议的话题。

在国内,机器新闻的写作首先在2015年出现,腾讯网的财经频道用Dreamwriter自动生成了关于中国CPI数据的消息。该机器自主写稿完成《8月CPI同比上涨2.0%创12个月新高》,并且发布到网上,虽然不到一千字,而且基本上都是导语类的内容,但是这些内容的真实性得到了极大的保障,展现出机器新闻本身所具备的一些特色。

在机器新闻这一科技生产力量进入新闻界并带来传媒业生产方式大变革之际,本研究将着眼机器新闻,首先界定概念明确其准确范畴。基于大量文献对比国内外发展现状,进而希望着眼国内媒体腾讯Dreamwriter和国外媒体美联社Wordsmith的体育新闻报道,对比分析同主题机器新闻与人工新闻写作文本质量,最后对机器新闻的未来发展前景做出期待。

二、研究意义与概念界定

(一)研究意义

机器新闻的出现对于整个新闻业来说,即是机遇,更是挑战。

综合当下相关研究来看,学者们对于机器新闻展开了争论和探究,对于其特色和优势做了阐释,对于其不足也进行了详细的分析,并且刻画了一个标准化的机器新闻画像,同时留下了比较刻板的整体评价:认为机器新闻的优势在于生产速度快、处理内容多以及推送个性化等;认为机器新闻的劣势在于报道领域有限、公式化缺乏温度、无法采访缺乏深度、不具备创新能力以及涉及可能有侵犯用户隐私的伦理问题等。

当然,记者也有机器所不能超越的专业性,机器新闻可以被广泛使用,但也无法彻底取代人工新闻。未来的新闻生产方式应当是人机共生的,机器主要提供写作辅助工作,比如选题的一些整理和搜集,相关写作内容的数据和资料的整理等。在这些方面机器有着天然的优势,能够体现出人所不具备的效率,展现出机器在写作辅助上的特色;而人则在深度叙事、批判分析中可以发挥自己的特长。

因此,机器新闻的存在大有意义,其发展不可限量。它将使得新闻生产流程更加高效便捷,也将改变媒介生态以及商业模式,它还会对未来新闻从业人员的培养提出更高的标准。

(二)概念界定

由文献综述不难发现,对于“人工智能技术在新闻领域的应用”这一事实,存在多种表达方式,因而本文在此需要明确对于“机器新闻”的界定。

外文文献中对于机器新闻的表达也有多种方式:机器新闻(robot journalism)、机器撰写的新闻 ( machine - written news) 、自动化生产的新闻 ( automated journalism) 、计算机生成的内容 ( computer - generated content ) 、算法新闻( algorithmic journalism) 等,但都是指由新闻机器自动搜集、分析数据信息,发现有价值的新闻事实,并套用既有的新闻模板自动撰写而成的新闻。

中文文献涉及的相关词汇包括:机器新闻、自动化新闻、大数据新闻、机器记者、智能新闻与算法新闻。其中,智能新闻指的是学界对于计算机自动写作和编辑新闻的定义, 也是对于应用了人工智能技术的新闻的一种统称。其中不仅包括新闻的撰写过程,还涉及新闻的传播与推送等;算法新闻是对使用了大数据技术或自然语言生成技术等包含算法过程的计算机技术的新闻的简称;机器记者则为机器新闻的其中一种形象化表述。综合来看,最需要进行区分的是:机器新闻、自动化新闻与大数据新闻。

首先说明机器新闻与自动化新闻的区别:一方面从形式上看,机器新闻强调存在机器这样一个实体,或是肉眼可见的一个科技产品;自动化新闻并无较高的产品形式要求,生成新闻的依赖是抽象的计算机软件、代码或数据。另一方面,从内容上看,机器新闻的外延更广,强调新闻生产需从新闻采集一直延伸到新闻产品呈现的全自动。而从当前的实践情况看,自动化新闻只需根据相关人员更新的数据,在相应的数据库中搜寻符合某种算法的数据进行新闻生产,对新闻的采集与分发无具体要求。其次来看大数据新闻与自动化新闻的关系,它们两者并非简单的产生与被产生或产生震荡影响的强关系,而是预测性思维的相对弱关系,大数据的核心是预测,这种预测是大数据带给自动化新闻的最大贡献。

综上,本文所指的机器新闻为:使用一套软件或算法语言,自动采集数据,然后撰写成人类可读的内容。

三、国内文献综述及机器新闻发展现状

(一)国内文献综述

笔者在CNKI上分别搜索关键词“机器新闻”、“自动化新闻”、“大数据新闻”、“机器记者”、“智能新闻”、“算法新闻”的文献,搜索结果数量繁多,且各类文献大都在大数据元年2013年后出现爆发式增长。

纵观众多文献,目前我国学者对于机器新闻的研究主要集中在以下方面:

第一,对机器新闻的定义与算法介绍。这里提到的“机器”,是指以辅助写作为目的而完成的一系列相关的软件。由此可以看出,“机器新闻”就是在这些软件的帮助下,实现了信息搜集、选择和整理等工作,最终生成了特定的新闻,相比于人的写作,其将整个的写作过程大幅度的加速,展现出在新闻方面的独特的优势,体现出的是未来辅助写作的广阔的前景。

机器新闻写作过程主要体现在这些流程中:(1)搜集和整理信息,对信息进行选择,并且构建相应的模型;(2)以编写好的软件作为支撑,以写作主旨为核心,提出特定的行文规范;(3)提出各类不同的程序中的新闻模板;(4)以模板为基础和平台,对于句式和词语进行规范;(5)完成新闻写作,并且自动发布。

第二,对于国内外使用现状的描述与介绍。此部分在各篇文献的综述部分中提及。

第三,机器新闻对新闻生产的挑战与影响。机器新闻主要存在化约简单、容易犯错、易被操纵以及需要提高透明度的挑战。带来的影响主要有三方面:从专业生产到“专业生产+用户生产+机器生产”、从流水线生产到个性化定制以及从内容为王到全产业链运作。 而且未来在人工智能、物联网、V R / A R等新技术的推动下,媒体将出现智能化趋向,它的特点主要体现在万物皆媒、人机共生、自我进化。

(二)国内机器新闻发展现状

纵观机器新闻在我国的发展,虽然时间上有些落后,但是速度非常快,表现出良好的趋势。现在,表现突出的主要是如下几家:腾讯财经Dream writer、新华社“快笔小新”、第一财经的“DT 稿王”以及今日头条的Xiaomingbot。

2015 年 9 月,腾讯成为中国第一家拥有写作机器人的企业,Dream writer发布了我国的第一篇机器撰写的新闻《8 月 CPI 同比上涨 2%,创 12 个月新高》。新华社也紧随其后,其“快笔小新”作为写作机器,主要为体育部门和经济类报道提供帮助,它在体育和财经方面的新闻写作上比较有优势。第二年,第一财经也有了自己的机器新闻,即“DT 稿王”,它主要侧重于逻辑和数据相关领域的写作,并且有着较好的表现。不久之后,《今日头条》也有了自己的写作机器Xiaomingbot,它具备更强的针对性,主要服务于赛事直播的相关报道,为赛事直播提供更加全面的支持,通过文字报道,为体育爱好者带来帮助。Xiaomingbot在体育方面展现出了独特的优势。

腾讯Dreamwriter从2015年9月发布至今,经历了四个版本的迭代。目前在进行第五个版本的探索,致力于开发大数据服务新闻生成和机器智能算法写作。新华社“快笔小新”能够收集多位金融专家的微博,采集其相关言论并对相关内容进行关联分析,其分析结果作为素材为记者采写深度稿件时使用。下一阶段将结合User Generated Content新闻来源认证技术,逐步扩大机器采写新闻的范围,更好地为记者服务。

四、国外文献综述及机器新闻发展现状

(一)国外文献综述

机器新闻写作最早起源于美国,因而,西方媒体在相关实践有着更加丰富的经验。凭借实践上的优势,国外研究人员的相关研究也比较全面,形成了较为完善的理论研究系统。纵观他们的研究主题,主要集中在如下两个方面:

第一,以技术原理为基础的相关研究。在针对技术的研究中,有学者提出计算机编程是基础,算法是辅助,二者同等重要,在两者的保障下,机器最终完成了信息的搜集和文字转化的工作,实现了新闻写作。 从本质上来看,机器新闻应被视为一种技术,是在以算法为基础的技术帮助下将数据转化为文字信息,是一个程序实现的过程。 最前沿的研究显示当前技术已经可以进行叙述性描写,并且机器是不知疲倦的、不会遗漏信息的以及不会带有个人偏见的。

第二,机器新闻写作的影响力研究:2018年, Yair Galily指出技术已经引领新闻业走进新时代。 2017年Pew指出算法将成为未来生活不可或缺的部分,必然会为人们的生活和社会发展做出更大的贡献。他明确指出未来应当强化对算法使用的管控,这是保障发挥其积极作用的前提;2014年美国学者Adam Waytz认为即便是未来机器写作更加完善之后,它也不可能独立完成现有记者的全部工作,也就是说,人仍然是写作的主导,而机器提供的只是一些辅助工作,这才是未来发展的方向。 Jaemin Jung等人的调查研究结果显示,机器新闻比人工新闻更受欢迎。

对笔者的研究最有启发性的是美国学者Christer Clerwall的著作,他对于人和机器写作新闻进行了对比,并且总结了两者的不同之处。研究发现,机器新闻看似无趣,但是却更加符合事实。在此基础上,他分析了普通人对于两种新闻的评价,结果表明人类往往难以区分机器新闻与人工新闻。

综合国内外已有研究文献,目前没有综合国内外知名媒体的特定题材报道,针对机器新闻与人工新闻,基于统一的评价标准,对比其写作特点、叙事逻辑以及新闻可读性、专业性、准确性等的相关文献。这也就是本文的重点研究方向。

(二)国外机器新闻发展现状

机器记者于2006年3月首次出现,美国的信息供应方汤姆森公司运用电脑程序来代替人类记者。该公司宣布程序可以自动生成经济和体育新闻,且机器记者可以在新闻事件发生后0.3秒内获取有用的数据,并分析整合成一份完整的新闻报道。

2013年,美联社使用Automated Insights算法自动生成了3亿条新闻,是世界上所有新闻媒体所产新闻的总和。

2014年3月18日,《洛杉矶时报》网站的Quakebot记者在地震发生3分钟后发布地震新闻。

2014年下半年,美联社开始与科技公司Automated Insights合作,利用该公司的智能平台Wordsmith进行季度财经报道类新闻制作。后来包括美联社、雅虎、英国《卫报》在内的多家传媒巨头纷纷表示他们己经试图采用机器大量撰写每日新闻。

截至2014年年底,美联社已经通过"机器记者"完成了4400篇财经新闻报道。美国《福布斯》杂志也实施了自动写稿程序的大规模运用;2015年在法国大选活动中,《世界报》与科技公司合作,并利用机器记者成功报道了数千次选举的实时状况。

2015年5月,美国NPR商业记者ScottHorsley和NarrativeScience公司的新闻软件Wordsmith进行了一场比赛。他们就同一主题各撰写一篇新闻稿,记者用时7分钟而Wordsmith只用了2分钟。

Mapping the Field of Algorithmic Journalism中记载了截至2016年国外主要机器新闻写作软件开发公司及其应用情况。 最新的机器新闻相关消息显示,国外机器新闻有突出表现:如美联社机器新闻写稿开启了中立和真实的时代,很多经济新闻、体育新闻稿可以被直接使用。再如日本仿生机器人已经能够在电视上公开直播,与人类进行简单沟通。

综合比较来看,国外的机器新闻投入应用开始得比国内早,算法技术比国内更为先进,发稿量远大于国内机器新闻的发稿量。

五、研究方法与新闻评价体系建立

(一)研究方法——文本分析法

笔者选取全文由机器撰写的体育类机器新闻,并且找到对应题材的人工新闻用以对比。国内选取腾讯Dreamwriter,国外选取美联社Wordsmith,各选择三篇机器新闻与三篇对应的人工新闻。由于体育竞赛的激烈性、悬念性、高情感性,拥有极大的受众群体,体育新闻媒体突出竞技体育报道,也是为了满足这一受众群体的需求。机器人新闻除财经新闻占较大比重之外,则是体育新闻。体育新闻要求记者第一时间将赛事状况呈现给受众,对时效性要求极高,这也正是机器新闻优势所在。笔者将分析其生成稿件的技术含量以及稿件的质量,如写作特点、叙事逻辑以及新闻可读性、专业性、准确性等。新闻文本链接详见附录A。

(二)新闻评价标准

综合全部国内外关于机器与人工新闻的对比研究,笔者整理出以下4篇可借鉴文献:

Christer Clerwall在2014年首次给出了涉及文本可信度与文本质量考察的指标,建立了李克特量表进行问卷调查。研究不足是所选受众人数少且仅仅局限在了新闻专业的硕士博士生,而且对于所选样本,文章没有明确的类别区分,也不具有充分的代表性。

Caswell, David &Dorr, Konstantin在2018年首次使用了Blind taste test,即受众在评价前并不知道哪篇文章为机器所作,哪篇文章为人类所作。该研究的不足是没有建立客观的新闻评价体系。

于建华早在2005提出了一套网络新闻价值评价指标及标准,对于本研究的文本分析起到了指导作用。其评价内容涉及新闻主题、新闻内容、新闻来源、文本文字水平、技术因素与传播效果,十分全面。该研究的不足是该文章仅仅建立了评价体系,但并没有对该体系进行应用,也没有相应的使用评估,所以无法衡量该体系对新闻的评价效果。

贾宸琰、姚源、钟旺2017年针对中文特性,建立了包含阅读速度、理解程度及文本清晰度三个指标的李克特量表,并结合Word软件的弗莱施可读性分析工具对财经、地震和体育报道文本进行了人机对比。该研究的不足是没有涉及到语言专业程度与新闻准确性的判断。

综合以上文献新闻评价标准的优势和价值,笔者创新建立了一套较为全面的新闻评价标准,并将其应用到问卷调查、访谈与文本分析之中。

(三)新闻评价体系建立

依据于建华《网络新闻价值评价指标体系的建立研究》一文,新闻价值评价要涉及以下方面:新闻主题、新闻内容、新闻来源、文本文字水平、技术因素与传播效果。笔者认为文本文字水平可归入为新闻内容部分,而技术因素在本文中就是指机器新闻撰写技术。因此为了本研究开展的便利,笔者将新闻评价体系分为以下四方面:新闻主题、新闻内容、新闻来源与传播效果。

1.新闻主题

按照于建华的说法,新闻主题要考量真实性、客观性、时效性、新颖性和题材重大性。由于真实性与客观性可以在新闻内容中得到考量,笔者确定的新闻主题考察包含以下四方面:新颖程度、主题的意义、时效性以及新闻标题的质量。其中最重要的就是新闻标题,它是对新闻内容的高度提炼和概括,是衡量新闻优劣的主要尺度,也是吸引受众的关键。

2.新闻内容

在贾宸琰、姚源、钟旺的《自动化新闻的可读性研究》一文当中,文末作者指出判断新闻内容的好坏应当考察其可读性、专业性与准确性。结合Christer Clerwall的著作Enter the Robot Journalist中一系列对于文本内容的可靠性(credibility)以及质量(quality)的评价维度本文整理得到新闻内容的评价维度:可读性、专业性、准确性。

其中,可读性包含文本易读程度(文本清晰度、文本可理解程度、语言通顺程度)、语言标准程度(语言简练度、语言正确率)以及阅读感受(阅读速度、阅读舒适度、阅读欲望)。

专业性依据陈雪萍,朱金玉的文章《突发事件的媒体微博新闻专业性研究》,应当考量真实性、客观性以及一些伦理问题。 笔者认为Enter the Robot Journalist中对于文本质量的描述可以归纳为语言艺术考量,也是专业性的一个方面。它包括以下指标:语言吸引程度、趣味性、连贯性与创新性。

准确性,依据张艳黎的《新闻报道以准确性为第一》一文,新闻准确性应当包含三方面:事实准确、观点准确以及表达准确。 笔者认为事实准确同上文的真实性考察一致,表达准确同上文的语言正确率考察一致。因此对于准确性,重点考量观点的准确性。

3.传播效果

关于传播效果的测量,于建华认为应当包括三方面:点击率、信息复制率以及受众反响。但是笔者认为这个评价体系只适合网络新闻或微博新闻。对于本研究搜集到的为数不多的机器新闻和人工新闻而言,并不是每一篇报道都能得到明确的点击量、转发量、受众评论数据,因此并不适合作为本研究的测量指标。

综合见表格1新闻评价标准。

六、腾讯Dreamwriter机器新闻与人工新闻对比分析

机器新闻的生成过程经历了:获取数据、分析数据、提炼观点(identify insights)、结构和格式(structure & format)以及出版这五个步骤。 因此其内容生产是结构化的,甚至可能存在模版化迹象。

(一)新闻主题

研究对象均为体育新闻,由于体育竞赛的激烈性、悬念性、高情感性,拥有极大的受众群体,体育新闻媒体突出竞技体育报道,也是为了满足这一受众群体的需求。体育新闻要求记者第一时间将赛事状况呈现给受众,对时效性要求极高,这也正是机器新闻优势所在。

1.机器新闻

篮球比赛标题大致由队员得分、队员球队及球队胜负情况组成,都是将受众最为关注的比赛过程与结果放在标题上进行输出、传播,实现了时效性、真实性与吸引力的全面提升。从组织架构来看,其逻辑都是从某队员表现入手,然后以最终比分介绍球队胜负情况,有一定的模版痕迹。

机器新闻的语言运用上也较为灵活,对于胜负情况有多种表达方式,如“负方不敌胜方”、“胜方险胜负方”。令人欣喜的是,机器新闻的标题已经可以对标点符号进行恰当地运用,如“109-102!詹姆斯35分助骑士战胜猛龙”,感叹号突出比赛结果的振奋人心。

2.人工新闻

人工新闻的标题较之机器新闻最显著的特点是其信息量更大。比如可以加入对主客场战局的描述,队员得分也不仅局限于一名队员的名字。词语的使用也更加丰富,如“横扫”、“出局”这些形象化的表达。

(二)新闻内容

1.机器新闻

可读性方面,机器新闻完成了对与既有比赛结果数据的提炼,并且将其转化为易读的文本形式。这个转化面面俱到,把每一节各队的表现都向读者呈现出来,且没有表达错误。语言简练、通顺,以短句为主,句子成分可识别出“主谓宾”的结构特征,词语的使用也符合体育新闻报道的专业用语。

专业性方面,其内容真实客观,具有可信度。文内也会基于当前战况进行简单的描述性分析,如“打出流畅配合”、“极具篮板优势”等。行文逻辑直接明了,就是对比赛过程基于比分情况进行文字实况转述。

在多媒体的使用上,机器新闻以插入比赛视频的方式满足受众对于更多信息的要求,且新闻的发布兼顾了网页平台和移动端平台。

2.人工新闻

整体而言,机器新闻在内容报道上和人工新闻差别不大,都是对于比赛过程的文字转述。

可读性方面,文章语言清晰而流畅,介绍整个比赛经过,并且介绍了参赛队伍的基本情况,没有表达错误,便于读者理解。

专业性方面,文章真实客观。新闻内容严格呈现了时间地点人物事件等关键新闻要素,为读者提供丰富的信息量。词语的使用上更为多元灵活,如“三巨头”、“握手言和”等细节描述。此外,文内运用到比喻的修辞手法,如“保罗如闪电般划过”,这是机器新闻中没有的描述。

多媒体的使用上,人工新闻更加灵活,以插入图片或视频的方式丰富文内信息,并且可以为读者提供超文本链接,将阅读内容丰富扩展到NBA揭秘、技术统计等方面,这也形成了与读者的有效互动。这也体现了人工对于背景资料的掌握更多元。

七、美联社Wordsmith机器新闻与人工新闻对比分析

(一)新闻主题

同样地,研究对象均为体育新闻,由于体育竞赛的激烈性、悬念性、高情感性,拥有极大的受众群体,体育新闻媒体突出竞技体育报道,也是为了满足这一受众群体的需求。体育新闻要求记者第一时间将赛事状况呈现给受众,对时效性要求极高,这也正是机器新闻优势所在。重点做标题的对比。

1.机器新闻

机器新闻的标题同样注重了对于比分结果的描述,但是标题的模版化痕迹不明显,表述形式较为多样。值得注意的是机器新闻能够做到对于较长队名的简写,如将“North Carolina”简写为“UNC”。

2.人工新闻

人工新闻的标题语句更加灵活,断句方式不拘泥于主谓宾,也使用了标点符号逗号及同位语,且大胆使用俚语化的表达,如“last-gasp”、“ Spikes down Cyclones”,读起来更具吸引性。

(二)新闻内容

1.机器新闻

可读性方面,英文机器新闻同样完成了对于既有比赛结果数据的提炼,并且将其转化为易读的文本形式。这个转化面面俱到,把每一节各队的表现都向读者呈现出来,且没有表达错误。语言简练、通顺,以短句为主,句子成分可识别出“主谓宾”结构,动名词结构表伴随也是其常用句式。每一段落的语句数2-3句,读起来节奏感强,不易疲劳。

专业性方面,其内容真实客观,具有可信度。词语的使用符合体育新闻报道的专业用语,语句间存在较为简单的逻辑联系,连接词的使用如“However”、“While”等,而且可以使用简单的副词,如“similarly”。行文逻辑简单明了,每段落多以队员名字开头,基于比分情况和队员表现将比赛过程复现。

在多媒体的使用上,机器新闻以提供比赛详细数据为链接丰富文章内容,同时可以进行简单的配图。

2.人工新闻

人工新闻在可读性方面,最大的突出特点是注重了长短句结合,不仅仅有成分丰富的长句子,也有简短明快的短句穿插,使得阅读起来富有节奏感。同样每段语句不会超过3句,便于阅读,但篇幅较长。此外,部分文章对于重点名词或名字进行了文字加粗的排版设计,重点突出,交互性强。

专业性方面,可以确保内容真实客观。词语的使用上除体育比赛专用语外加入了更丰富的描述性话语或俚语,如“set-piece strike”,“ Blast-Off”等。人工新闻更大的特点在于加入了对球员的采访和直接引语,在比赛关键时节添加球员对于自己或对手的评价,趣味性增强,使得文章内容更加充实,不易使读者产生阅读疲劳。行文逻辑以比赛过程为顺序,辅以比赛细节或人物直接引语。

多媒体的使用上,插入图片和视频已成为固定搭配,部分文章会在文末加入更多相关新闻的超链接便于读者扩展阅读,增强用户粘性。

八、结论与讨论

(一)中英文机器新闻报道差异

首先针对新闻撰写对比一下美国媒体和中国媒体,美联社的机器新闻较为成熟,篇幅也更长;新华社的机器新闻语句简单,数字单调。由于美国的机器新闻技术兴起较早,投入很大,发展较快,所以美国媒体的机器新闻能够更大程度满足读者对于信息量的要求。中国的机器新闻发展较晚,所以目前呈现的新闻文本还有很大的进步空间。

值得注意的是,由于中文和英文的差异,中文的机器化产出会难度更大。因为中文的句式较之英文更为复杂,而且在表达当中中文会涉及比如成语、比如诗句这些很文学性的说法,这更加大了中文机器学习的难度,所以中文的机器新闻与人工新闻的差别就更加显著。此外,在新闻评论方面,机器不具有提出创新性建议的语言生成机制,而人工进行新闻评论则如鱼得水。由此来看,特别是在中文领域的机器新闻,短时间内可能无法超越人工新闻。

(二)如何让机器新闻文本更快地媲美人工

1、新闻主题

目前机器新闻在新闻主题的选择上较为局限,机器新闻更适合气象、体育、健康、财经等领域的报道。但是从受众的评价来看,即使仅限于这些领域的报道,机器新闻的主题同样可以做到富有意义。同样地,希望在选题的新颖程度上机器可以有所突破,争取写出更有创新性的报道。至于新闻标题,如何短小而切中要害,激发读者阅读兴趣,而不是简单地信息罗列,这需要更多技术投入。

2、新闻内容

新闻内容上的优化主要有两方面,一个是语言的优化,一个是多媒体新闻呈现。语言的优化上,应当丰富句式结构,加强语句间逻辑连接,学习更加文学性的表达,使得文本内容更有趣味性,更有创造力,进而更加吸引读者。多媒体呈现上,机器新闻应该多涉猎大数据新闻的可视化、视频新闻的创造、新闻直播的应用等更为丰富的新闻呈现形式。

3、传播效果

除了改进文本外,新闻发布平台的应用也十分重要。无论国内外,目前都没有专属于机器新闻的发稿机构,也就是说机器撰写的新闻没有独立的宣传窗口和渠道。为了适应新媒体时代的新闻宣传环境,建议机器新闻开通自己专属的发布页面,如开通Facebook账号、微博微信账号等等。这样除了扩大宣传外也为机器新闻传播效果的量化衡量做了贡献,研究者可以从点击量、信息复制率以及受众评论等维度进行新闻质量的判断。

(三)机器新闻如何更好地服务于受众

1、优化读者阅读体验

唯有好的阅读体验才能满足受众需求。优秀的新闻作品首先一定能够吸引人眼球,其次在阅读过程中不会给读者施压,语言清晰明快,丰富多样,巧用表达技巧。此外,为了迎合现代人类阅读习惯,适当减少文字量,增加图片、视频等更丰富的新闻表达形式可能会更好,而这些要求就对机器新闻提出了更高的期待。

综合来看,未来,是人机结合的未来。通过机器,为读者呈现更多数据收集与处理的结果;通过人工保证主流价值观的引导,丰富语言表达,增加线下事实的补充,扩充新闻评论和深度报道。

2、机器新闻与用户交互

机器推送新闻的个性化一直是大数据很大的用武之地,通过数据分析对新闻受众进行画像,然后为该用户匹配最适合的新闻。

除此之外,现在新闻的发布形式越来越多样,不仅仅止于文字新闻,还有图片新闻、视频新闻以及新闻直播等等多种形式。那么未来用户或许可以为自己预定新闻,选择在特定的时间收看特定地点所发生的新闻,而这个过程将由机器来实现。

个性化的用户交互体验至关重要,只有最人性化的服务能够带来优良的用户体验,这也是广告宣传的必争之地,由此带来的经济效益不可小觑。

(四)其他讨论

1、机器新闻与新闻教育

业界人士曾指出,设计人工智能的技术人员和使用它的记者之间存在的知识差距和沟通差距可能会导致新闻输出的弊端。除了有很高的写作能力要求,现在社会对于记者的期待已经不仅仅满足于写出优秀的稿子了,更多的还需要图片的制作、视频的制作、数据新闻的可视化处理等等更加专业的要求。

此外,在机器的辅助之下,程式化的事务性的工作都可以交给机器,那么记者就会成为一个更加高端的职业,需要人文情怀和技术素养的全面提升。 种种这些都对新一代新闻人的教育提出了更高的标准,他们不仅需要学习基本的新闻学、传播学教程,还需要进行编程的学习。

2、伦理与法规考量

机器新闻在道德使用和数据披露中面临种种伦理与法规的基本问题。

首先,针对用户,如何收集、存储、使用、分析和共享用户的信息十分重要。大数据时代,用户的任何网络足迹都会成为其个人信息的一部分,那么对于用户个人信息的哪种程度的抓取才是合理的,需要明确的法律法规进行规范。

其次,机器新闻撰写过程中对于网络资源的引用是否会涉及到知识产权的侵权也是值得讨论的话题;利用数据进行新闻报道时应用的算法要做到怎样的透明度;读者是否应该得到一个透明的方法论;造成不良后果应当建立怎样的合理问责制等同样值得热议。

参考文献

一、中文文献

1. 陈昌凤.工具性兼人性:技术化时代的媒介伦理[J].新闻与写作,2019(04):1.

2. 陈曦. 机器新闻写作的现实困境及对策研究[D].湖南师范大学,2018.

3. 胡素霞.机器新闻写作的特点及未来方向[J].新闻传播,2017(06):81+83.

4. 付松聚.我国首创机器新闻与人工新闻写作之实证性研究——以8月CPI新闻报道为例[J].传媒观察,2015(11):14-16.

5. 霍婕,陈昌凤.人工智能与媒体融合:技术驱动新闻创新[J].中国记者,2018(07):27-30.

6. 金兼斌.机器新闻写作:一场正在发生的革命[J].新闻与写作,2014(09):30-35.

7. 敬慧.机器新闻写作热潮下的传统新闻生产冷思考[J].科技传播,2017,9(20):5-6.

8. 李钰琪.关于机器新闻写作的文献综述[J].传播与版权,2018(07):13-15.

9. 刘松浩. 机器新闻写作现状与发展趋势研究[D].郑州大学,2017.

10. 仇筠茜,陈昌凤.黑箱:人工智能技术与新闻生产格局嬗变[J].新闻界,2018(01):28-34.

11. 涂佳焰.机器新闻写作研究现状[J].新媒体研究,2017,3(17):11-13.

12. 王玥.机器新闻VS人工写作对比分析——以九寨沟地震事件为例[J].视听,2018(03):190-191.

13. 燕道成,陈曦.机器新闻写作的内容生产困境[J].传媒观察,2018(06):24-29.

14. 杨言. 机器人新闻内容构建及语言表达问题研究[D].河北经贸大学,2018.

15. 杨言.机器新闻写作背景下记者角色的嬗变与升级[J].新闻世界,2018(02):65-68.

16. 余謦辰.机器人写稿对新闻传播业的影响——以九寨沟地震机器新闻写作为例[J].科技传播,2018,10(01):33-34.

17. 曾凡斌,阳婷.机器新闻的发展及对传媒业的影响[J].视听界,2017(03):69-73.

18. 曾振华.机器新闻写作带来的数据伦理问题[J].新闻与写作,2017(12):92-94.

19. 周佳玥.从NLG到机器新闻写作——机器新闻的发展与反思[J].今传媒,2017,25(10):18-19.

二、英文文献

1. Adam Waytz. How to Stop Worrying and Love the Robot That Drives You to Work. Retrieved (April 17, 2018), from: Kellogg Insight:https://insight.kellogg.northwestern.edu/article/how_to_stop_worrying_and_love_the_robot_that_drives_you_to_work.

2. Caswell, David; Dorr, Konstantin (2018)Automated Journalism 2.0: Event-driven narratives. From simple descriptions to real stories. Journalism Practice, 12(4):477-496.

3. Christer Clerwall (2014) Enter the Robot Journalist, Journalism Practice, 8:5, 519-531, DOI: 10.1080/17512786.2014.883116.

4. Einav (ed.), The New World of Transitioned Media, The Economics of Informati.n, Communication, and Entertainment, DOI 10.1007/978-3-319-09009-2_6

5. Emily Bell. The Robot Journalist: An Apocalypse for the News Industry. Retrieved (April 17,2018), from: The Guardian Media Blog: https://www.theguardian.com/media/2012/may/13/robot-journalist-apocalypse-news-industry.

6. Gali, Einav.(2015).The New World of Transitioned Media. Springer International Publishing.

7. Jaemin Jung, Haeyeop Song, Youngju Kim, Hyunsuk Im, Sewook Oh.(2017) Intrusion of software robots into journalism: The public's and journalists' perceptions of news written by algorithms and human journalists, Computers in Human Behavior 71 (2017) 291-298

8. N. Lemelshtrich Latar, Ph.D.?Springer International Publishing Switzerland (2015).65 G.

9. Yair Galily. Artificial intelligence and sports journalism: Is it a sweeping change?. Technology in Society(2018). 1-5

附录A

一、新闻文本-国内腾讯Dreamwriter

机器新闻1:

https://info.3g.qq.com/g/s?sid=&aid=sports_ss&id=sports_20170106023069&pos=&lpid=1&day=&rt=1&fr=&iarea=

人工新闻1:

https://3g.163.com/sports/article/CA3R64JV0005877U.html

机器新闻2:

https://sports.qq.com/a/20170508/002024.htm

人工新闻2:

http://sports.sina.com.cn/basketball/nba/2017-05-08/doc-ifyeychk7112788.shtml

机器新闻3:

https://xw.qq.com/cmsid/20170429016516/2017042901651600

人工新闻3:

https://www.sohu.com/a/137200461_458722

二、新闻文本-国外美联社Wordsmith

机器新闻1:

https://wordsmith.automatedinsights.com/gallery/soccer-games-recap

人工新闻1:

https://www.apnews.com/b12fca5a4ee1432b9ebed1d7322219c0

机器新闻2:

https://venturebeat.com/2016/07/01/associated-press-expands-sports-coverage-with-stories-written-by-machines/

人工新闻2:

https://www.milb.com/state-college/news/spikes-down-cyclones-9-8-in-wild-marathon/c-187060370

机器新闻3:

https://www.bbc.com/news/technology-34204052

人工新闻3:

https://www.espn.com/mens-college-basketball/recap?gameId=400587907 

(责编:刘扬、赵光霞)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部