多准快全,機器人寫稿優勢明顯
數據海量,規模處理
大數據和人工智能技術是機器人寫稿的技術基礎。尤其是隨著大數據技術的發展,機器人寫稿能力會越來越強。
據估計,當前全球存儲的數據總量以上萬艾字節測量(1艾字節=10億千兆字節),而且仍在加速增長,大約每3年實現一次倍增③。這些數據以各種格式存在,往往難以用傳統數據軟件進行匹配分析。但應用大數據技術則能夠規模化處理這些信息,並在寫稿機器人的背后形成一個高度結構化的海量信息網。無論是文、圖、音視頻還是其他形式的信息,機器人編輯都可以像音樂家排列音符一樣去組合、重構。無論天氣預報、地震預警還是賽事報道,最終都能放入機器人數據庫中,這樣的系統潛力巨大,可以構建無限可能。
信息抓取,精准加工
機器人寫稿的另一大優勢就是精准。寫稿機器人生產新聞,可以不依賴於現場採訪獲取素材,而是通過對現有數據、資料進行快速搜集加工編制而成。雖然其對文章的理解深度還遠不能和人類相提並論,但在海量數據和強大計算能力支撐下,精准度非常高,這是人類記者難以達到的。另外,在數據量足夠大、樣本足夠多的情況下,機器人寫稿可有效避免假新聞出現,因為,機器人寫稿依靠的是全網數據,而非一人一言。
實時監控,快速報道
寫稿機器人用機器代替人類完成對信息源的實時監控,並利用文本解析和爬虫技術實現自動信息抽取,採用算法技術並融合編輯記者團隊的經驗和智慧,以模板和規則知識庫的方式輸出稿件。真正達到了對信息的實時監測、實時發布。
數量龐大,效率極高
目前來看,寫稿機器人能夠贏過人類記者,主要是依靠兩個“法寶”——“數量”和“效率”。和傳統媒體人相比,寫稿機器人可以瞬間完成海量閱讀、分析並根據互聯網活躍點擊量數據,瞬時篩選出下一個熱點新聞,然后通過后台算法快速合成新聞。總體來看,寫稿機器人在速度和數量上有著絕對優勢。依靠海量數據和不斷演進的算法設計,生成一篇深度報道的時間已經由最初的30秒縮短到2秒以內,其精確度還在不斷提升,而且擬人化、情感化的技能也在不斷增強。
刻板僵化,機器人寫稿尚有不足
缺乏獨立思考能力
目前,寫稿機器人尚不具備獨立思考能力,隻能依據既有的數據和事先設定好的程序來寫稿,不能像人類一樣思考並提出問題。因此,其寫作、編發的新聞稿件,也多是簡單的資訊類新聞,對於復雜新聞事件的報道則隻能通過人類的指導來完成。
在復雜寫作領域,人工智能寫稿目前存在兩個狀況:一是所有AI作品的完成都或多或少得到了人類的指點﹔二是人給的指點越少,AI的最終作品就越慘不忍睹。
2016年,日本名古屋大學佐藤?鬆崎研究室研發的機器人,創作了一篇名為《計算機寫小說的那一天》④的科幻小說,獲得了日本微型小說獎。該小說架構嚴謹,但內容呆板,缺乏文學的美感,不過這已經是AI在復雜寫作領域的最高水平。值得一提的是,該小說並非由人工智能獨立完成。在創作中,人工智能的作用佔到20%,80%經過人類的編輯潤色。
寫作模式固定、適用面窄
機器人寫稿的核心是利用大數據對信息進行分析,然后套用固定算法進行重新排列組合,再用人們能夠接受的或新聞報道要求的格式呈現。其寫稿流程分數據採集、數據加工、自動寫稿、編輯簽發四個環節。技術上通過“三步走”來實現:根據各業務板塊的需求定制發稿模板,數據自動抓取和稿件生成,各業務部門編審和簽發。
從這一情況看,寫稿機器人僅適合體育、天氣、財經等資訊性較強的新聞報道,而對一些有思想性或形式更為靈活的報道則力不從心。
其主要原因是,目前機器人尚缺三個方面能力:一是歸因,二是舉証,三是應景。⑤歸因,就是描述現象后,分析這些現象的一些脈絡,思考究竟是哪些東西導致這個現象﹔舉証,就是提出一個觀點后要找幾個例子﹔應景,是指描述完一個過程之后,需要把握畫龍點睛的是什麼,如何用恰當的詞語對此進行貼切的描述。這是機器人寫稿遇到的現實難題。
不會採訪,沒有情感
採訪,是新聞寫作的重要環節,尤其特稿和人物類稿件,採訪更是必不可少。聯系採訪對象,觀察對方,用心感受人物,再對大量資料進行整理,做出取舍。新聞稿件的字裡行間都飽含著記者的判斷、價值觀與人文關懷。這些復雜細致的情感工作,機器人尚不能完成。此外,目前寫稿機器人還無法進行獨立思考,智能寫稿系統在深度和個性化上也很難取得突破。正如人民日報副總編輯盧新寧在2017年媒體融合發展論壇上所言:“作為記者,我為地震顫抖,但機器人不會。”⑥