对智能新闻若干问题的释疑

刘建明

2017年12月13日09:44  
 

来源:《新闻爱好者》

【摘要】目前对智能新闻技术的功能存在种种疑问,对它的多种称谓也值得商榷。多数人认为,智能新闻技术缺乏新闻敏感,可能漏掉有价值的新闻,很难写出有人情味的新闻,智能报道很难真实、准确,机器人更无法写出新闻评论。对智能新闻的种种疑虑,产生于对新闻自动化的机理缺乏全面认识。文章依据智能新闻技术的发展,探讨新闻思维器超越和改变记者的工作方式,这是电子媒介技术创新的必然结果。

【关键词】智能新闻;新闻思维器;新闻自动化的机理;新闻思维器的能量

最近两年,国内对西方机器人新闻做了介绍,同时也产生了种种疑虑。同欧洲学者一样,新闻智能化对国内学界和业界仍是陌生领域,对许多相关知识不甚了了。40年前,美国耶鲁大学的教授罗杰·尚克(Roger Schank)开始探索“新闻叙事的智能化”问题①,到今天,从概念、原理到技术应用,智能新闻已经展现出清晰的前景,但许多研究者却认为它离普遍应用还很遥远,对其功能的认识极为肤浅。

一、厘清智能新闻的称谓

学界通常把计算机自动写作和编辑新闻,统称为智能新闻。西方对它的叫法多种多样,一些称谓未必科学,但国内研究者全盘照搬过来,已经造成了对新闻自动化技术的种种错觉。早在1981年,美国麻省理工学院教授肖珊娜·佐伯芙(Shoshana Zuboff)在《计算机成为工作替代者》一文中,就对智能新闻提出了三个称谓,她写道:“不难想象,人类的记者在不久的将来将被软件取代。事实上,这种转变已经存在,编辑已由软件编辑替换。电脑编程故事将由机器人记者完成。数字化如何影响记者?多技能记者今后的处境怎样?他们将如何应对即将到来的令人不安的状况?什么是机器人新闻?为什么要使用算法新闻学?机器人生成什么样的文本?算法新闻会取代人类记者吗?自动文本要考虑哪些伦理问题?为保住饭碗,记者将做些什么……这些都需要做出回答。”②

佐伯芙提出的这些问题,今天的学界和业界正在认真思考和研究。令人惊羡的是,她几乎概括了智能新闻今天提到的所有称谓:机器人新闻、机器人记者、算法新闻、自动化新闻(自动化文本)。到2013年,以上这些称谓已经广泛融入西方新闻技术领域。

中文毕竟不是英文,我们不能机械地照搬英文词典的原意来翻译这些概念,正如我们不能把佐伯芙的Computer-Mediated Work这篇文章题目译成《电脑介入的工作》或《电脑介导工作》一样。国内对智能新闻的研究多给上述称谓注入晦涩的语义,让人陷入一知半解的误区。在汉语里,算法新闻(Algorithmic Journalism)是什么意思?无人能说清楚。Algorithmic Journalism应译成电脑程序新闻。“信、达、雅”作为翻译的基本标准,不仅要让读者明白其意,而且能理解原文的真正指意,而不是搬出词典对号入座就完事大吉了。在这里,Algorithmic是指电脑程序运作的机理和规则,不能译成“算法新闻”或“算法新闻学”。

自动化新闻(Automated Journalism)或自动化写手(Automated Writing)也是对智能新闻常用的两个称谓,但这两个概念正如“智能新闻”的提法,比较粗放模糊,不能体现智能新闻的枢要,没有凸显智能新闻的精妙含义。西方最常用的称谓是机器人新闻(Robot Journalism)、机器人记者(Robot Journalist),我国研究者也拿过来这样称呼,好像新闻是由机器人用手敲击键盘写出来的一样,事实上并非如此。一个机器人的手指即使万分灵活,也不可能在半秒或一秒之内敲击几千下键盘,写好一篇包含四五百个词汇的消息。正如美国芝加哥公共广播电台的一篇文章指出的:“那不是真的机器人。它实际上是一个软件程序。你喂它数据,它处理数据,它吐出一个新闻故事,把你给它的数字放到上下文中,就像你在当地报纸上看到的一样。”③

所谓机器人新闻,只是一种形象说法,它既没有头也没有手掌和手指,也无需敲击键盘,而是借助电脑程序来思维和构想。所以,对智能新闻最好的称谓是“新闻思维器”,即“用编稿软件和电子器件采集事件资料,进行智能加工,自动生成新闻文本和报道方式”[1]。智能新闻以“机器思维”处理文字和数据,完成新闻稿的写作与编辑,速度远远超过人类的大脑。美联社使用的新闻思维器叫“墨客”(Wordsmith),在1秒钟内就能生成一篇新闻。《华盛顿邮报》的新闻思维器叫做“吐真者”(Truth Teller),不仅会写作,而且在眨眼工夫能核查一条新闻。《洛杉矶时报》的新闻思维器叫“颤抖的肤蝇仔”(Quakebot),路透社的新闻思维器被称为“坦率的加来”(OpenCalais)……这些新闻思维器没有机器人的模样,却以惊人的速度完成了令人震惊的新闻故事。

作为智能程度极高的电脑写作程序,新闻思维器搜集、整理和加工客观事实,成为一架闪电般的高级大脑。《新闻学前沿》一书在2005年就指出:未来“全能电脑相当于人的大脑功能,人类的思索、分析、创作和设计都由电脑完成”[2]。新闻思维器是全能电脑技术发展的必然结果,具有整合、判断、概括和抽象等思维能力,使新闻的生成达到神速的地步。苏黎世大学教授康斯坦丁·尼克莱·道尔(Konstantin Nicholas DORR)认为,自然语言生成(NLG),完全可以代替一些现场记者的任务,自动化新闻的质量具有难以企及的竞争力,只要告诉软件你想要的主题,就可在几秒钟内或用更少的时间写出一条新闻。[3]

二、新闻思维器缺少新闻敏感与人情味吗?

一些研究者认为,新闻思维器很难从事件细节中洞见有意义的现象,对现实动态缺乏新闻敏感,将会错失有价值的报道。还有人强调,机器人写作的突破性在于“写”,但与记者相比,其劣势也在于“写”。读者看多了它的标准化、模板化的新闻会感到重复、生硬,缺少“人情味”。与人打交道,发掘人性之美,是机器人新闻无法胜任的。

加拿大学者K.马休斯对新闻思维器基本持否定态度,她认为:“电脑程序新闻将面对固有的道德挑战,这是机器人新闻不能完全取代记者的原因。自动化写作可能会制造无中生有的气氛,激发读者不必要的情感反应,例如它对人笑容的描绘可能会加剧副作用。机器人不会创意,不能面对面地采访、询问。我们知道探寻社会反应,机器人则不能。”[4]

在我国,很多人同马休斯持有相同的看法,仍被“机器永远是工具”的观念所禁锢,对智能新闻的功能严重估计不足。有人说:“人有思想和创造力,并不是所有的新闻机器人都能写。而且机器人也不会采访啊,一些细腻的东西还是需要人去发现……任何时候,它都是一个行业的辅助器。”[5]

在欧洲,许多学者和记者同上面的观点不同,他们既看到了新闻思维器当前的不足,又认为新闻的自动化报道在目前形势下非常有用,它们的未来更无可限量。伦敦大学的尼尔·图尔曼(Neil Thurman)、苏黎世大学的康斯坦丁·尼克莱·道尔(Konstantin Nicholas DORR)和路德维希慕尼黑大学的杰西卡·库耐特(Jessica Kunert)深入到记者中,让他们使用自动生成的新闻软件。经过体验,这些记者一致强调,机器人新闻当前是公式化和乏味的,容易错过真实的新闻,背离记者职业的自豪感。尽管它有很多缺陷,但进一步发展,它完全能胜任新闻工作,对媒体降低成本、减少新闻的人为错误和偏见会起很大作用。

新闻思维器正处于起步阶段,新闻写作由“人工模板+自动化数据填充”的模式来完成。网络数据库提供丰富的信息,新闻思维器根据编辑记者设置的程序,在数据库中检索高质量的事实,在汇集、梳理、排列、选择和强化相关事实后,开始快速地写作新闻。2006年,路透社用新闻思维器在0.3秒钟内就写出一篇公司财务新闻[6];2014年5月,英国《卫报》用新闻思维器率先报道热点新闻,《卫报》记者说,面对这样的报纸,感觉整个时代都变了。美联社的新闻思维器WordSmith在2013年产生了3亿篇各类形式的报道,平均每秒钟写出9.5篇。一些前沿创新公司如Automated Insights,也取得了令人瞩目的进展,它的机器写作平台被美联社、雅虎、三星、微软等著名媒体与公司广泛采用。

新闻思维器正在高速发展,越来越多的写作模板被设计出来,新闻风格也日新月异。新闻模板形成浑然一体的架构,不单是设置、安排材料,还包括记者对事实的思想统摄,把新闻变成了一种认识和展示世界的模式。[7]每种新闻模板都由关键词、新闻要素、篇章结构的特殊程序构成,提供对事实的解释方式和背景索引,引导新闻思维器从资料库中提取重要的事实与观点。写完新闻后,只要记者对它稍加调整,对词句进行简要的修饰,就能确保新闻风格的多样化。美联社有专门的编辑负责对自动化新闻的修改,以保证新闻内容的质量。现在,美国已经形成大数据掌控公司、大数据思维公司、大数据技术公司和写作模板的研究机构。[8]由此形成的产业链为解决数据收集、数据分析、程序设计提供了技术支撑。[9]

智能新闻技术很快将终结报道内容的刻板化和单一化,不会因为缺乏新闻敏感而错失有价值的新闻,也不会缺少“人情味”的报道。最近几年,新闻智能工具还将装上微型传感器(sensor,视听装置),记者每天带着它去采访,抓拍突发事件和各种要闻的现场画面。依据采访对象的语调、表情和所处场所,新闻思维器将在词汇库里选择生动、逼真的词语加以描述,呈现人们的喜怒哀乐,发掘人性的美丑。它同记者的其他穿戴式搜索器相连,对周围环境的监测极其灵敏,加之与卫星传感器和定位装置的信息交互,对全球各地发生的事件将一览无余。面对新闻思维器的鬼斧神工,记者的思维器官——大脑将要望尘莫及了。

三、智能新闻与人为新闻哪个更精准

在西方,许多受众怀疑自动化新闻的可信度,常常提出:“软件生成的内容同记者写出的新闻能一样吗?机器人记者的文章很难有客观性、可靠性、准确性和清晰度。除了无聊文章,这类新闻的可读性、信息性、文学形式、可用性、描述性和相关性,也许会给人带来快乐的阅读,但它们是否真实准确,就很难说了。”瑞典卡尔斯塔德大学传播学研究者克里斯特·克莱瓦尔(Christer Clerwall)在调查用户时搜集到这些意见的同时,还发现:“一些用户却有另一种认识,觉得软件生成的内容虽然是描述性或无聊的,但写出的许多新闻也是客观、准确和可靠的,有更高的质量,各媒体的报道更加一致……这说明软件运行良好,有益于记者做好新闻工作。”[10]

我国有的研究者同样认为,“传统编辑工作更侧重于信息、语法把关和编排;而机器人撰写出来的稿件通常不会存在信息差错和语法错误。后期编辑在把关和校对上并不需要投入太多的精力”[11]。智能新闻很少发生信息差错,其准确程度高于记者的判断。这个结论在美国圣路易斯大学传播学专业副教授马特·卡尔森(Matt Carlson)的文章中有所论证。他在《自动判断?算法判断、新闻知识和新闻专业主义》一文中强调,自动新闻使用的电脑程序判断,正在挑战新闻工作者的职业判断,因为人的主体性容易犯错误。电脑程序判断与新闻工作者的职业判断不同,它将代替人类的主观信念,在本质上是客观的,它的内容都来自实际和现实,因而取代人类判断的自动化新闻应有合法性。[12]

智能新闻的内容比记者的报道更精准,主要有两个机理。第一,新闻思维器的模板建立在“新闻粒子”的基础上,每个粒子都是新闻中最小的事实单位,所有新闻都以最小的单一事实作为分解点。电脑程序选择事实从新闻粒子入手,把那些最重要、最有意义的最小事象抓取出来,使新闻内容与结构纳入细密入微的状态。“新闻若干分解点的联系和离散状态,称作新闻的粒子结构。新闻写作划分新闻事实的粒子,娴熟地驾驭每个事实的节点,就像操纵魔方那样神速地拼组消息的结构,直至找到合适的事实连接形式。”“新闻粒子的长度与深度,体现为对客观事实取舍的繁简,但长度并不能决定新闻的质量,决定新闻质量的是单一事实的深度,即单一事实能够说明的问题。新闻粒子集结的数量与质量,构成了信息的影响强势,体现为中心粒子和辅助粒子搭配的能量。新闻粒子理论使记者的脑与手变得不可思议。”[13]现在,新闻思维器利用新闻粒子组合新闻内容,远远超过了人脑的选择与组合的精度,真正会出现不可思议的效果。

据清华大学教授彭兰介绍,《纽约时报》旗下的R&D实验室正在尝试一种“粒子化”(Particle,有媒体将其译为“积木式”)的新闻写作模式,即在每篇文章中,对可能被重复使用的每个知识点进行编码,使其成为一个“粒子”。一个动态事件的新闻可以分解成若干“粒子”,利用这些“粒子”便可生成一个可自动更新的报道。对“粒子”进行编码、提取与自动更新,不仅能获取数据并进行填充,还可使用“粒子”发现新闻线索,拓展新闻写作的深度或广度。[14]

智能新闻内容比人工新闻更精准的第二个机理是,它的客观报道来自资料库中的海量信息,能掌握全部事实而不漏掉重要事实,能抓住反映事物本质的核心事实。如果媒体设计的模板遵循信息平衡、信息全面的原则,新闻思维器绝不会偏于一隅来选择事实。网上数据库作为新闻生成的“资源包”,储存了几亿兆各类事实与观点,构成了新闻思维器采集和处理事实的平台。这些巨量信息对同一个事件有不同的描述和看法,对任何事物都包含多种对立的说法和意见,真实与谣言也往往纠缠在一起。一个有能力和精力旺盛的记者,终生都无法采集到或阅读完这些信息,他们对事物的看法只能建立在一部分信息的基础上。

新闻思维器却不同,它们在瞬间就能在信息海洋中找到它要报道的事实,依据信息高显律④的原理辨别事实的真伪,确定新闻的真相,依据模板的关键词完成报道文本,或把选择的事件影像编排成图像新闻。一旦事件当事人的声音进入新闻思维器的视野,新闻的真相将立刻大白于天下。由于新闻时效的严格限制,记者对许多重要新闻根本没有充裕的时间进行全面的实地采访和阅读大量相关资料,所以人工记者完成的许多新闻,总会出现一些差错和失实。

四、新闻思维器也能胜任评论写作

国内对智能新闻功能的另一个普遍观点是,机器人不可能胜任极具个性的新闻评论写作,因为新闻评论比普通新闻稿件要求更高,既要符合社会主流价值观的基调,又要有独到的理性思辨,结合媒体的立场、定位和目标受众的喜好,对新闻事件做出深度解读,这是机器人难以完成的任务。

这种看法过于简单,对新闻评论或深度报道也缺乏透彻的了解。新闻评论中的观点主要来自媒体和记者,但是也往往会插入新闻人物的看法,还可能引用其他人对新闻事件的评论。新闻思维器之所以能表达观点,对新闻事实做出评价,是由于在资料库中能搜集到人们对新闻事件的评价,经过提炼,可以把最重要的观点表达出来。这种客观展示新闻观点的机理与方式,不仅具有客观性和全面性,而且能提醒人们注意社会对新闻事件的主要看法。

重要的是,新闻思维器如何表达媒体及其记者的观点,体现社会的主流价值观。不言而喻,任何媒体的大量评论都遵循它的新闻政策、报道原则和意识形态,这些观念早已储存在该媒体的资料库中,新闻思维器进入媒体自身的数据库,针对眼前评论的新闻事件,可以寻找到它的“一贯立场、一贯理念、一贯说法”,用这些观念阐释面对的事实。问题的关键在于,评论编辑要科学、准确地设计写作模板,确定揭示最新事件的、独具个性的概念群。新闻思维器通过电脑的编程和语言程序,把那些概念连成句子,演绎出推理、论断和论据相契合的文本及其结构。

一篇好的新闻评论对事实的缕析,不单单是孤立地分析事实本身,而是以社会思潮、事件背景展示社会动态,引用政治家、学者以及普通民众的典型言论作为论证依据。对此,网络数据库恰恰能给新闻思维器提供源源不断的资源。网络数据库储存了世界各种意识形态、各种价值观、各种社会阶层和阶级对社会问题和新闻事件的观点;也有大量文章分析不同社会制度、各国发展状况和治理方针。新闻思维器依据评论模板不仅能够搜索到需要凸显的价值观、政治理念和人民的普遍呼声,而且能够寻找到确凿的事实做出深刻论证。即使评论的自动化写作有某些不完备之处,媒体编辑的最后加工仍能弥补这些缺陷。

那些重视理想信念的媒体和新闻人,如果想要保持自己特有的立场和批判精神,就会在评论模板中注入自己的观念,让新闻思维器在资源库中找到他们需要的事实和观点。这类事实能不能满足他们立场的需要,还要看铁的事实是否支持他们的立场。新闻思维器绝不会篡改和扭曲新闻事件和社会的普遍认识,也不会对新闻事实产生偏见,因为机器总是具有据实录制的机械性,媒体的倾向难以支配它们的推理。

五、新闻思维器将超越和改变记者

最近几年,中外新闻界出现智能新闻热,同时也发出一片哀叹:“写稿机器人上线,记者要失业啦!”“机器人写稿,传统记者的末日到了!”面对媒介技术的高速发展,新闻记者和编辑的岗位将会压缩,但编辑记者不可能大量被裁减,这是确定无疑的。电子媒介技术以几何级数的速度挺进,新闻创新进入加速度时代,对新闻界和广大受众来说,都是“点石成金”的历史机遇。我们要高举双手欢迎这个时刻的早日到来,以新的工作方式完成高智商的新闻报道。正如美国《赫芬顿邮报》副主编凯瑟琳·泰比所说:“我不仅不害怕失去我的工作,我认为自动报道新闻的推出,从长时间看,对记者是最好的事情。”[15]

在智能工具武装起来的媒体面前,社会不仅变得越来越透明,世界各地的新闻动态也逃不出新闻思维器视觉的放大功能,人的主体作用将真正得到释放。人作为万物之灵,是智能机器的创造者和驾驭者,但在信息时代,人类只有依靠智能机器才能认识世界,创造新的物质文明和精神文明。火车是人制造的,但人奔跑的速度根本无法与火车相比,将来火车、汽车不再由人驾驶,而是用极其安全的自动驾驶技术来驱动,远远超越人的能量。这就是规律:人类创造了科学,也需要驾驭科学。新闻思维器是人发明的,但今后记者编辑的能力已无法深刻认识这个复杂而到处充斥着高科技的世界,更不能迅速地整合地球和宇宙的所有信息。未来几年,新闻思维器不再是记者编辑的帮手,而将成为新闻报道的主角。我国的多数媒体目前似乎还没有这种变革的概念,根本没有启动同IT企业联手培训操作新闻思维器的新型记者和编辑。

一个关于“自动化新闻”的会议将于2018年5月22日—23日在德国慕尼黑举行,这次会议将推动新闻思维器顶尖技术的研发。不是在更远的未来,而是在5—6年后,西方新闻界就会发生令人震惊的变化,记者编辑不再是单纯的文字与图像的处理者,而是以思维与传感技术为主导的新闻写作的引导者和自动新闻文本的修补者。同今天学者预测的恰好相反,不是“新闻机器人”缺少思考能力和创造力,而是很多“真正的记者”缺少设计新闻思维器的开拓精神。他们的饭碗不会被自动化机器夺走,却能被不思进取、故步自封的陈旧工作方式所砸碎。(作者为清华大学新闻与传播学院教授)

注 释:

①Schank,Roger.Conceptualizations underlying natural language.In Computer Models of Thought and Language,R.Schank& K. Colby,eds.San Francisco:W.H.Freeman,1973.

②Shoshana Zuboff:,Computer-Mediated Work.Available at:http://america.pink/shoshana-zuboff_4023641,1981.

③NPR Staff,'Robot Journalist' Out-Writes Human Sports Reporter,http://www.npr.org/,April 17,2011.

④“信息高显律”表明,同一种信息大量、反复的出现证明该事物的客观存在,并显露出一定的规则。

参考文献:

[1]刘建明.新闻学概论(第2版)[M].北京:中国传媒大学出版社,2017:15.

[2]刘建明.新闻学前沿[M].北京:清华大学出版社,2005:371.

[3]K.N.DORR,Mapping the field of Algorithmic Journalism,Digital Journalism,Published online:7Nov 2014.

[4]Matthews,K.,10 reasons why robot journalism can’t top the real thing,https://muckrack.com/daily,19/08/2014.

[5]AI星球.关于机器人写稿,被传闻“哭晕”在厕所的记者们有话要说[EB/OL].http//news.vc.cn/a_151148296358059940801.

[6]Momus,Robots Wrote This,http://archive.wired.com/culture/lifestyle/commentary/imomus,08/07/2006.

[7]刘建明.新闻学概论(第1版)[M].北京:中国传媒大学出版社,2007:82.

[8]王云霞.美国传媒与文化产业发展现状及启示[J].南方电视学刊,2016(2).

[9]维克托·迈尔·舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:55.

[10]Clerwall,C.,Enter the Robot Journalist:Users' perceptions of automated content.Journalism Practice,8(5)2014,p.519-531.

[11]张海霞.机器人写作时代新闻从业者的应对[J].新闻战线,2016(11).

[12]M.Carlson,Automating judgment Algorithmic judgment,news knowledge,and journalistic professionalism,New Media & Society,2017(4).

[13]刘建明.新闻学前沿[M].北京:清华大学出版社,2005:1-16.

[14]彭兰.移动化、智能化技术趋势下新闻生产的再定义[J].新闻记者,2016(1).

[15]Catherrine Taibi,Should We Be Afraid Or Excited About Robot Journalism?Media,07/11/2014.

(责编:赵光霞、宋心蕊)

推荐阅读

升国旗唱红歌送祝福 盘点媒体国庆创意策划
  今年10月1日,中华人民共和国迎来了68岁的生日,不少人的朋友圈里也被各种各样献给祖国的祝福“刷了屏”。媒体们各出奇招,用MV、H5等新颖的形式“烹饪”出了不一样的国庆报道“大餐”。
【详细】升国旗唱红歌送祝福 盘点媒体国庆创意策划   今年10月1日,中华人民共和国迎来了68岁的生日,不少人的朋友圈里也被各种各样献给祖国的祝福“刷了屏”。媒体们各出奇招,用MV、H5等新颖的形式“烹饪”出了不一样的国庆报道“大餐”。 【详细】

庆祝建国68周年 重温媒体开国大典报道
  1949年10月1日,在天安门举行的盛大的开国大典,向全中国、全世界庄严宣告中华人民共和国的诞生。在庆祝建国68周年之际,让我们重温当时关于开国大典的新闻报道,再次感受那一神圣而又伟大的时刻。 
【详细】庆祝建国68周年 重温媒体开国大典报道   1949年10月1日,在天安门举行的盛大的开国大典,向全中国、全世界庄严宣告中华人民共和国的诞生。在庆祝建国68周年之际,让我们重温当时关于开国大典的新闻报道,再次感受那一神圣而又伟大的时刻。 【详细】