人民網
人民網>>傳媒>>傳媒期刊秀:《中國報業》>>2015年12月上

國外機器人新聞寫手的發展與思考

徐 曼
2016年01月05日13:09 | 來源:人民網-傳媒頻道
小字號

[摘要]機器人新聞寫手最早在美國起步,真正應用於傳媒領域是近幾年的事。與以往人工智能在傳媒業的應用不同,機器人新聞寫手最大的特征是新聞生產的完全自動化。在具體新聞寫作過程中,人工的參與並不是新聞產品產出的關鍵和決定性環節,新聞生產的主體實現了由人向機器的轉變。但隨著應用領域的拓展,也產生了一些問題。

[關鍵詞]機器人新聞寫手 新聞生產自動化 未來發展方向

所謂機器人新聞寫手(Robot Journalism或Automated Writing),其實是一個擬人化的說法,確切地說,是指運用算法對輸入或搜集的數據自動進行加工處理,從而自動生成完整新聞報道的一整套計算機程序。與以往人工智能在傳媒業的應用不同,機器人新聞寫手最大的特征就是新聞生產的完全自動化。除前期的技術開發外,在具體新聞寫作過程中,人工的參與並不是新聞產品產出的關鍵和決定性環節,新聞生產的主體實現了由人向機器的轉變。

機器人新聞寫手最早在美國起步,其作為一種技術出現的時間不長,真正應用於傳媒領域更是近幾年的事。本文簡要介紹國外機器人新聞寫手的發展歷程,包括技術的產生和演變、在媒體領域的應用情況以及未來的發展方向,並分享國外學界和傳媒業界目前對這一技術現象所提出的主要問題和思考。

技術發展演變史

關於機器人寫作的相關報道最早出現於2006年。當年3月起,信息供應商湯姆森金融公司開始運用電腦程序來替代財經記者,自動撰寫經濟和金融方面的新聞。湯姆森公司稱,它的機器人記者可以在公司發布信息后的0.3秒內提取有效數據,並分析整合成為一篇報道。當時,這項技術創新在贏得驚嘆的同時,更多引來的是一片質疑之聲。一些業內人士批評稱,“機器人寫作的新聞無法發現程式化的信息發布背后的細微差別,當然也無法更深入地揭示數據背后的含義”。

如今,在自動化寫作的技術開發領域,主要的競爭者包括美國伊利諾伊州的敘述科學公司(Narrative Science),北卡羅來納州的自動化洞察力公司(Automated Insights),以及總部設在美國得克薩斯州的一家歐洲公司Yseop。下面就讓我們以敘述科學公司為例,回顧一下機器人寫手技術的發展演變史。

2009年,美國西北大學開發了一個名為“Stats Monkey”的軟件,利用此軟件可以自動從網頁中抓取大學棒球比賽的數據信息,並在12秒內生成一篇比賽報告。次年,這個軟件的商業前景被發掘,兩名西北大學的教授和一名前網絡公司主管合作成立了敘述科學公司。

很快,敘述科學公司開發了一個名為Quill的系統,其最初的客戶是美國十大聯盟。這是一個以體育為核心的美國大學聯盟。從2010年起,該軟件撰寫了“十大聯盟”數千項大大小小體育賽事的新聞,它幾乎是在比賽中進行實時報道,稿件不管是在數量還是時效上都遠超以往。

成果是驚人的,不過問題也隨之產生:由機器人自動撰寫的新聞內容過於單一,常常是贊頌勝利者,批評失敗者。客戶對此提出要求,希望報道更加多樣化,關注勝利者的同時也要關注失敗者的表現並發現亮點。同樣,在報道美國少年棒球聯盟賽事時,家長們也要求報道盡量忽略失誤而聚焦於正面信息。於是,設計者針對這些應用中發現的問題對軟件進行了升級改造,使之更適應使用者的復雜需求。

為了更好地把數據通過算法轉化成文字,敘述科學公司雇用了一批“元寫手”,他們都是訓練有素的記者,有自己一套成型的寫作風格和手法。這些記者與工程師們一起“培訓”計算機,使其能夠從數據中發現各種各樣的“角度”,並教會計算機如何組織文章的“架構”。為了組建句子,算法中還包括由“元寫手”們匯總的相關分類報道的詞匯庫。此外,敘述科學公司的團隊還為客戶提供了報道語氣風格的多樣化選擇,“可以是一名神經緊張的財經記者從交易大廳發出的尖叫型風格,也可以是賣弄學問的老學究講課型風格”。

經過幾年的發展,敘述科學公司的技術有了更強大的提升。2014年3月,該公司發布了Quill Engage平台,也就是谷歌分析(Google Analytics)應用。這是著名互聯網公司谷歌為各種網站所有者提供的數據統計服務。這一應用的功能非常強大,隻要在目標網站的頁面上加入一段代碼,就可以提供豐富詳盡又簡潔明了的圖表式報告。它可以顯示人們如何找到和瀏覽某個網站,以及網站所有者如何改善訪問者的體驗,提高網站投資回報率,如何在網上獲取更多收益。它可以對整個網站的訪問者進行跟蹤,並能持續跟蹤營銷廣告的效果,使網站管理者了解,哪些關鍵字真正起作用、哪些廣告詞最有效、訪問者在轉換過程中從何處退出等等。總之,這是一個全面的分析軟件包,而它的主要功能就是由敘述科學公司的自動化寫作平台完成的。

媒體應用典型案例

目前,就傳統意義上的媒體新聞報道來說,機器人寫手還主要應用於以數據為基礎的程式化報道領域,如公司年報、股票市場簡報、地震報道、體育報道等。例如,《福布斯》雜志早已開始大范圍使用敘述科學公司的自動寫稿程序,並專門在網站上設置了由此程序所生成新聞的網頁﹔俄羅斯搜索引擎Yandex應用機器人撰寫天氣和交通報道﹔法國的《世界報》與Syllabs公司合作,在2015年的選舉活動中,用機器人寫手報道了數千條實時的各地選舉情況。當然,媒體應用機器人新聞寫手最為人們所熟知的,還要數美聯社和《洛杉磯時報》。

2014年7月,美聯社宣布,他們將使用自動化洞察力公司的寫稿軟件Wordsmith平台,自動撰寫有關公司財報的新聞。美聯社每個季度都會發布大約300篇此類新聞,此前,這類報道於人工來說是十分耗費時間的,而且記者編輯們在面對一堆數字時,出錯也常常難以避免。相比之下,Wordsmith平台每秒最多可以產出2000篇此類新聞,而且出錯率極低。今年10月,自動化洞察力公司公布了一份案例研究報告,詳細介紹了這一平台是如何協助美聯社每個季度撰寫4300篇報道的。這個數字是美聯社在採用機器人自動寫稿之前此類報道人工發稿量的14倍。

美聯社主編盧•費拉拉談起使用機器人寫手的感受時說:“在財報發布季,我們應該做的是以更具創造性的方式使用我們的精力和時間,而不是把大量時間花在發表財報和寫概述上。我們以后要把所有美國公司的財報都讓機器人來寫。”她還表示,“任何數據驅動的領域,比如出口民意調查、天氣等,我們都打算使用這個系統。”

與美聯社不同的是,《洛杉磯時報》主要是在地震新聞和犯罪新聞領域應用“機器人寫手”。2014年3月18日,美國加州發生4.1級地震,《洛杉磯時報》通過Quakebot生成系統,在收到美國地質勘探局電腦發出的地震信息后,自動將數據輸入模板並提交採編系統,在3分鐘內率先發布了地震報道。

《洛杉磯時報》在罪案新聞領域的機器人寫手應用更具特色。2007年起,洛杉磯時報網站開辟了一個專門記錄“殺人事件”的博客,初衷是 “力圖記錄本地區發生的每一起殺人事件”。然而,可以設想,這在以人力為基礎的情況下幾乎是不可能完成的任務。好在,2010年機器人寫手開始接手這一工作。機器人寫手不但報道新的事件,還追溯歷史補上了之前幾年漏掉的事件。從開設到2014年的7年間,該博客共發布了5000多起殺人事件的報道,詳細記錄了受害者的種族、性別、死因、發現地點等信息,而這其中絕大多數報道都是由機器人寫手自動完成的。

未來的發展方向

機器人新聞寫手出現至今還不到十年,真正開始成形並付諸實踐隻有短短的三四年。可以說,這一應用還處於初始階段,未來還有無限可能,也許會遠超我們的想象。不過就目前來看,有幾個比較明顯的發展趨勢:

首先,機器人寫手新聞在整個新聞報道中佔據的份額會越來越大。關於這一點,應該不會有人懷疑。敘述科學公司的創建者克裡斯蒂安•哈蒙德曾經預測,新聞報道將最終由機器人寫手新聞所主導,份額將“超過90%”。不過,這一比例的得出是以機器人寫手新聞本身創造了巨大數量的、從前傳統新聞記者所不曾覆蓋領域的報道為前提的。也就是說,一方面,由於機器人寫手的加入,新聞的總體數量實現了幾何倍數的增長﹔另一方面,今后我們的世界和我們的生活將日益數據化,越來越多的數據將在互聯網上產生和流動,從而對自動化寫作的新聞產生更大需求。

其次,質量日益提升,並將突破數據新聞的模式限制。眾所周知,現在的機器人寫手新聞主要限制在以數據統計為基礎的報道模式,但技術研發者對於自己的產品有著更高的期待。他們稱,下一步技術升級的目標就是使機器人寫手新聞擺脫現在邊緣化的狀態,讀懂那些無法用表格囊括的非數據信息,寫出篇幅更長、內容更復雜的新聞報道,“甚至在20年或更短的時間內獲得普利策新聞獎”。

再次,開辟更多報道領域,實現更廣泛的應用。從技術出現伊始,自動化寫作涉足的領域不斷擴展,從最初的體育報道、財經報道,逐步擴展到自然災害報道、罪案報道,之后還會進一步囊括健康咨詢、調查報道等眾多細分領域。除了新聞業,自動化寫作未來更廣泛的應用應該是在商業領域,如前面提到的谷歌分析應用,以及其他任何商業分析報告的生產方面,這一趨勢目前已初見端倪。此外,在社交網站上,這一應用也大有作為,程序可以學習如何利用“病毒元素”撰寫稿件,比如使用一些特定詞語或句子結構,以使文章能在社交媒體上引起廣泛的病毒式傳播。

最后,更加個性化,面向個人用戶。今年10月20日,自動化洞察力公司發布了Wordsmith平台面向公眾的版本,個人可以注冊測試版,正式的版本預計將於明年1月推出。這一應用可以幫助個人用戶組織文字,一旦用戶有了一個模板,之后需要做的就是更新數據,機器人寫手會自動幫助用戶生成文章。該公司CEO羅比•艾倫說,機器人寫手並不一定要面向大眾,它更像一個個人數據處理專家,對於每個客戶來說,生成也許隻有這一個人閱讀的文章。未來,隻要條件允許,每個人都可以擁有自己的機器人寫手。

問題與思考

機器人寫手是一項具革命性的新興事物,在帶來驚喜的同時,也引發了很多問題和思考。

首先,從宏觀層面看,對於傳媒業來說,機器人寫手究竟意味著什麼?曾經,有一些媒體從業者對這種報道形式嗤之以鼻,認為其過於固定化、模式化,將其稱為“新聞”是對“新聞”這一概念的貶低和誤解。然而,也有一些人持相反意見,認為這一技術是對新聞業的促進和發展。筆者傾向於后一種觀點,即機器人寫手的意義主要是正面的,它可以促進新聞業的拓展和深化。一方面,它的出現使新聞報道覆蓋了傳統新聞業沒有覆蓋或無力覆蓋的領域,大大拓展了新聞產品的應用空間﹔另一方面,它對人工記者勞動力的解放,使后者可以將精力集中於新聞更深層次的挖掘和批判性分析思考,為新聞業整體的深化創造了條件。

不過,對於新聞從業者來說,危機也是顯而易見的。“快,拔掉那機器人的電源!”這句戲言說出了傳統新聞人的焦慮:機器人會搶走記者和編輯的飯碗嗎?至少目前來看,答案還是否定的。雖然機器人記者大大突破了人工記者的工作局限,不管是在新聞產生的數量上還是時效上,都達到了人力所不能及的程度。但是,機器人寫手與嚴格意義上“真正的記者”仍有較大差距,人類在創造性和行動性上的優勢,仍是機器所無法比擬和替代的。人與機器不是競爭關系,而是分工合作關系。當然,這一變革對新聞從業者們也提出了更高標准和要求。

此外,機器人寫手新聞在新聞倫理層面也為我們提出了很多新的課題。系統自動抓取的數據信息是否權威可信?會不會有人為操縱的可能?對這些數據,新聞機構是否已在法律上被授予使用權和發布權?哪些話題有可能在數據的輸入中存在政治或社會偏見?機器人寫手新聞會不會與人寫新聞存在風格上的不統一而無法歸入同一組報道中?如果某篇機器人寫作的新聞中,其事實或邏輯受到讀者的質疑,其他人能給出令人信服的解釋嗎?即使機器出錯率很低,但是這種概率是存在的,那又由誰來監督機器,對它產出的報道進行查証?如果將機器人用於多媒體領域,它自動生成並發出的圖片報道、視頻報道是否能確保限定在法律規定的范疇內?如此種種問題,都會隨著這一技術的不斷進步而漸漸浮現,當然也可能會在人工智能與媒體越來越完美的融合中獲得解答。

在不久的將來,新聞產業或許也會像制造產業一樣,出現由人完成的“手工制作”產品和由機器人完成的“流水線作業”產品的劃分。再或許,隨著技術的不斷成熟,人們可能會根本無法分辨機器人寫的新聞和人寫新聞的差別,或者早已接受或習慣前者,而認為這種區分毫無意義。工業革命使機器替代了人力,那麼,新聞業也會有這樣一天嗎?技術革新的大潮不可阻擋,我們隻能跟上變革的腳步,擁抱變革。

(作者單位:參考消息報社)

【本文系《中國報業》供稿】

(責編:趙光霞、宋心蕊)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部