人民網
人民網>>傳媒>>傳媒期刊秀:《新聞愛好者》>>2018年第2期

數據新聞生產的常態化趨勢及其限度

林溪聲
2018年03月29日15:50 |
小字號

來源:《新聞愛好者》

【摘要】在全球進入大數據時代的背景下,數據新聞成為新聞業發展的戰略方向。大數據和人工智能技術是數據新聞生產的主導力量,並帶動了五種主要趨勢:一是推動傳統調查性報道的轉型升級,有助於發現海量數據中隱藏的價值及數據關系﹔二是根據用戶需求提供個性化服務,詮釋宏觀社會現象對用戶的影響﹔三是將抽象數據具象化,突破傳統敘事報道的范式﹔四是推動專業化數據新聞平台的搭建,提升數據新聞專業主義的標准﹔五是創新對突發事件的解讀分析。在數據新聞生產不斷豐富的過程中,開放數據與數據壟斷、信息安全的競合,可視化形式與功能的矛盾,以及跨領域與新聞專業性之間的沖突是制約其發展的關鍵問題。

【關鍵詞】數據新聞﹔人工智能﹔可視化﹔移動化﹔交互性

“數據新聞”(Data Journalism),是指基於大數據技術、人工智能技術,通過對歷史信息和即時信息的高效處理,更具備歸納統計能力、可視化呈現能力以及更高新聞生產效率的新型新聞報道方式。由於數據在報道中的核心地位,又被稱作數據驅動新聞。現今廣泛使用的“數據新聞”概念最早由《華盛頓郵報》的軟件工程師兼“每個街區”網站①創始人阿德裡安·哈羅瓦提於2006年提出。哈羅瓦提認為,媒體應通過計算機處理原始數據,為公眾提供更重要、更有參考價值的報道,以便深刻地理解周遭世界﹔記者應公布結構化的、機器可讀的數據,與以敘述故事為核心的報道形成互補,以適應媒介變革的需要。﹝1﹞經過業界的不斷探索,數據新聞已形成一股方興未艾的浪潮,影響著全球新聞業的格局。

一、數據新聞生產的常態化趨勢

隨著硬件技術和算法技術的拓展,數據新聞嵌入以關系為紐帶的社會網絡,廣泛深入社會生活的方方面面,並以自動化、規模化、快捷化處理和呈現信息的方式,把媒體報道的覆蓋范圍和創造活力提升到新的高度。﹝2﹞

(一)數據驅動型調查報道

調查性報道是傳統媒體最具影響力的優勢產品,這種報道方式以捍衛公眾利益或公民權利為己任,以揭發政治權力與市場權力種種黑幕為手段,往往需要經過媒體長期而完整的獨立調查。隨著互聯網技術的發展,傳統媒體遭遇危機,從事調查報道的採編人員逐年下降,甚至連每年提交普利策新聞獎的調查報道作品也呈下滑趨勢。﹝3﹞然而數據驅動型調查報道正在西方新聞界如火如荼地進行著,與傳統媒體調查性報道逐漸式微形成鮮明對比。2015年《華爾街日報》“醫療解密”系列報道是數據驅動型調查報道的典型,其以920萬條數據的智能分析為基礎,揭示美國醫保體系的巨大黑幕,引發美國政府和行業的巨大震動,促進了美國醫保體系的改革。2016年全球編輯協會新聞調查獎作品是西班牙一家非營利機構關於藥品專利制度對全球藥品獲得性影響的調查,其基於全球發達國家和發展中國家4.5萬個領域的藥品價格和1.45萬個領域的藥品支付情況數據,進行Ruby和Nokogiri智能化搜集、處理和分析,判斷出盡管醫藥領域的專利制度地位不可動搖,但其他制度並非不可行,在一定范圍內引發了公眾對制藥行業現行制度的思考。

數據驅動型調查報道是大數據和人工智能時代的產物,在生產機制上與傳統調查報道有明顯區隔:傳統調查報道的線索主要來源於個人或機構,或是根據社會輿論的關注點和社交媒體爆料來進行,而大數據和人工智能應用通過對數據的處理,成為拓展新聞線索和選題來源的新方式﹔在新聞生產流程和方式上,傳統調查報道遵循的是“記者—編輯”的線性操作模式,數據驅動的調查報道則依賴“團隊協作模式”,在具體的報道中綜合運用多種技能,對團隊的新聞素養與技術能力提出更高要求。﹝4﹞不同於傳統調查類報道,數據驅動型調查報道的基礎是海量數據的抓取分析以及多個維度的信息交叉印証,重在發現數據隱藏的價值及數據相關關系。

(二)智能化移動應用

伴隨智能移動終端在世界范圍內的全面普及,移動新聞客戶端憑借其豐富的資訊資源、實時的信息推送和方便的社交互動被越來越多的用戶認可。2016年年底,獵豹移動大數據平台結合第三方市場調研機構的數據,以中國、美國、日本、印度、歐洲為重點研究對象,分析世界新聞APP市場,結果顯示:用戶新聞接收渠道日益多樣化,用戶的閱讀時間日益碎片化,用戶在移動端獲取新聞的主要渠道是專門的新聞APP和社交媒體APP。﹝5﹞新聞APP作為移動端首要的傳播渠道,是新聞媒體重點爭奪的領地,各國呈現出各自市場的特色。

在新聞生產的智能化方面,“今日頭條”的小明機器人、Google的人工智能編輯,都展現出對即時信息,比如體育賽事結果、上市公司財報信息的快速搜集並智能生成新聞內容的能力。在用戶界面的智能化方面,類似大數據精准營銷,新聞APP基於用戶個人信息、工作習慣、生活習慣等全方位信息的分析,可以對用戶進行畫像,判斷用戶對新聞內容的偏好,構成用戶專屬的移動新聞APP界面。

個性化新聞應用也可被視為“專屬新聞”,這種新聞應用致力於以用戶的需求為中心,以算法的方式將新聞精准地推送至受眾群體,實現傳統大眾傳媒無法實現的“長尾”傳播。互動性更強的新聞應用是將宏觀抽象的政治、經濟問題轉換成與用戶日常生活息息相關的信息,讓用戶了解經濟、政策等方面的改變與自身的關聯程度,比如稅收的調整會不會影響日用品的價格等。可以預見,根據用戶需求提供個性化的大數據服務,是數據新聞未來的重要增長點。

(三)數據化敘事報道

數據化敘事報道主要是指對抽象數據的具體化,挖掘數據相關性,揭示數據的新聞價值,並制作出可視化立體文本,呈現數據背后的深層意義。正如數據新聞編輯阿隆·菲爾霍夫所說,“(數據新聞)囊括了一套仍在不斷增多的用於新聞敘事的工具、技巧與方法”②。人工智能技術的突破,使機器對各類型信息的處理能力大幅提升,可分析數據對象從人們習以為常的數字,擴展為廣義的文本、圖片、語音甚至視頻。《華爾街日報》2017年獲得全球編輯協會可視化作品大獎的《漢密爾頓的韻律》(The Rhymes Behind Hamilton)基於百老匯口碑甚佳的音樂劇《漢密爾頓》(Hamilton),利用語音識別、聲紋識別對音樂的押韻結構進行智能分析,讓用戶理解這部音樂劇的引人之處。美國商業性新媒體BuzzFeed News在2016年4月推出作品《空中密探》(Spies in the Skies),編輯團隊從飛行軌跡網站Flighttradar24搜集了約200架聯邦調查局和國土安全局監測器在2015年8月到12月的飛行軌跡數據,揭示美國政府的空中監控動作,並以時間序列的方式展示飛行監控的特性,吸引了眾多網民的關注。

技術正推動數據化敘事報道的邊際變化,比如可分析數據對象的擴展和數據挖掘能力的提升,並在改變新聞的話語形態,即從單一的封閉形態轉變為融合開放的形態。數據新聞最終呈現的是豐富多元的可視化信息,這種敘事模式增強了內容的透明度和易讀性,具有高度的互文性、動態性、參與性,並且是一種開放結構,接受者可以解讀出不同的意義。數據新聞的范式突破,突出表現為“社交化、個人化和應用性”﹝6﹞特征,這是對傳統新聞報道模式的深加工和重塑。

(四)數據新聞網站或機構

數據新聞同傳統新聞的諸多差異,造就數據新聞制作團隊的構成大大區別於傳統新聞編輯部。基於數據新聞在數據搜集、處理和呈現等方面的特點,對團隊構成和人員職責提出了更高的要求。﹝7﹞數據新聞團隊除了要具備採寫編評能力外,還需要掌握挖掘和處理海量數據的能力,以及一定的計算機程序編寫、統計分析、制圖軟件的操作能力。近年來,數據新聞業最受關注的標志性事件是幾大專業化數據新聞平台的建立。平台的建立帶來了獨立性,編輯團隊對選題的掌控和主導權得到強化,推出了許多引人注目的好作品,提升了數據新聞的專業主義標准。

作為數據新聞的先驅,英國《衛報》的網站已經同《衛報》母體有了明顯的角色分工:前者報道全球事件,不斷開發新的新聞工具,后者則趨於本地報道。《衛報》網站下的《數據博客》《數據商店》都是數據新聞的發布平台,在兩個欄目上可以看到數據報道、數據化新聞故事、數據新聞媒體群組,以及在社交媒體上廣泛開展的數據新聞討論。類似的數據新聞編輯團隊還有Five Thirty Eight,它在娛樂與體育節目電視網(ESPN)支持下專注於政治選舉、體育賽事預測,以及聚焦美國國內法治的數據新聞平台The Marshall Project等。數據編輯團隊的專業水准則取決於團隊成員的新聞敏感和數據敏感,以及各環節人員的合作情況。隨著工具型應用的日益完善,對編輯團隊的要求更多體現在將智能化工具與新聞專業性的結合上。

(五)突發新聞數據使用

突發新聞報道曾經被認為與數據新聞報道之間存在難以解決的矛盾:一是事件的突發性使得短時間內採集大量數據成為難題,無法為數據新聞報道提供有效支撐﹔二是再簡單的可視化編輯也遠不如文字發布的速度。﹝8﹞近兩年這種局面正在改變,數據新聞題材覆蓋面越來越廣,突發新聞的報道也開始運用數據手段。在2015年5月美國鐵路公司貨車脫軌事故報道中,半島電視台美國頻道次日就能發布脫軌火車的行駛速度嚴重超速,正得益於之前編輯團隊調查美鐵列車所存儲和搜集的數據。在突發事件“第一落點”的競爭中,數據新聞的優勢並不明顯,但在“第二落點”的競爭中可以用數據說話,呈現更加完整的背景和真相。

突發新聞與數據新聞的結合突破了傳統媒體時代無法快速獲取、分析、歸納歷史數據的局限,為數據新聞的發展開拓了新的空間,也對數據新聞制作提出了新的挑戰。針對突發事件報道,數據新聞編輯應當具有這樣的能力與素養:在突發事件的高發領域做好日常數據積累,事件發生時快速搜集各方材料,事件發生后密切關注數據更新,為事件的報道解讀拓展深度。﹝9﹞由於時效性的制約,突發新聞報道的可視化方法可以不復雜,但需要突出與事件相關的歷史與未來、橫向與縱向的數字與關系對比,並通過移動端優先的策略快速傳播到受眾群體,在后續報道中繼續以故事化的方式對事件全方位解讀。實踐証明,數據新聞在突發事件報道領域並非一無是處。

二、數據新聞生產的限度

(一)開放數據和信息壟斷、信息安全的競合

數據新聞對數據的真實性、准確性、全面性和時效性提出了較高的要求,數據獲取和使用的權利成為制約數據新聞快速發展的瓶頸。當前的主要數據源集中在電信運營商、主要國家機構、大型互聯網企業的手中,數據源佔有呈壟斷形態,且在商業利益和信息安全的邊界下難以形成數據互通,而“內容為王”的核心競爭需求則要求新聞業必須擁有一定的數據使用權。

在線信息是目前新聞業數據獲取的重要來源,而技術的拓展和深化正讓過去難以透析的互聯網信息成為重要資源,數據來源更具開放性。對新聞業而言,應該基於對歷史新聞報道數據需求的總結,基於對新技術條件下數據源的深度認識,對數據源形成明確的需求規劃,通過公益性、商業性等不同的策略手段實現同主要數據擁有者的合作,實現對盡可能多的數據源的使用,把握數據新聞時代的戰略機遇。

從信息安全的角度來看,無論是使用更多數據擁有者的數據,還是應用技術拓展數據來源,都對信息安全包括公民隱私、商業秘密和國家機密構成潛在威脅。基於新聞專業性的要求,新聞業應盡可能明確對數據使用合規性的判斷和理解,對國家政府機關數據,把握好公開的度﹔對個人隱私數據,把握好脫敏要求﹔對商業經濟數據,把握好應用的准確性,在充分體現新聞業社會責任的基礎上,平衡好數據獲取應用與信息安全的關系。

(二)可視化形式與功能之間的矛盾

數據新聞依托海量數據和新聞編輯對新聞的理解,以形象化、藝術化的方式提供客觀系統的報道和良好的閱讀體驗。為准確、高效地處理和呈現數據,各種實用、專業、智能的處理工具應運而生。與可視化工具日趨簡便、靈活相伴的一個常見討論是:信息圖表與可視化會不會帶來新聞的簡化?

數據新聞講故事的能力曾備受質疑。但谷歌數據新聞編輯西蒙·羅杰斯認為,“數據新聞不是圖形或可視化效果,而是用最好的方式去講述故事。只是有時故事是用可視化效果或地圖來講述”﹝10﹞。實際上,在如何處理最佳角度呈現數據、受眾之間的相關性、故事化敘述最有價值的新聞上,數據新聞必須不斷進行深度挖掘以彌補天然的品質缺憾。人工智能技術在文本分析、語義分析、神經網絡學習等方面的快速進展,將有助於數據新聞故事化敘事的提升。

(三)跨領域與新聞專業性的沖突

數據新聞生產過程中的互動性造就了一種“眾包”的產制,但也提出了系列問題:新聞報道的主體會不會轉移到數據分析師、程序員甚至高智能的機器人上?新聞傳播的專業性會不會消解?

大數據和人工智能技術的成熟,意味著部分新聞生產有可能被機器取代,更意味著專業記者與各部門更普遍的合作。作為職業的內容生產者,應直面現實,更加努力於提升自身的數據素養:對大數據及其技術有較為全面客觀的認識和實事求是的態度,可以評判大數據對某一問題的分析﹔具備一定的數據採集、處理、分析、可視化等方面的能力,追蹤數據新聞生產的關鍵技能﹔具備良好的傳播能力和判斷力,使數據新聞生產遵循專業規范和社會規范,符合新聞專業主義的採編標准。數據新聞生產並非抑制專業新聞從業者的主體性,而是推動其全面轉型,在生產傳播過程中動態地傳遞新聞傳媒的信息和態度。

三、結語

數據新聞的實踐已經激發了對傳統新聞生產模式的更新和改造。在數據的獲取和分享上,數據新聞幫助媒體從碎片化信息中發現規律和趨勢,增加了報道的廣度和深度。在表達層面上,可視化的數據新聞報道有助於傳播繁雜的信息,將新聞生產轉變為媒體與受眾之間的互動甚至多向度的眾包,並進一步擴大新聞作品的應用性。在傳播效果上,數據新聞提升了新聞報道的科學性和預測性,成就了跨越一定時間和空間的立體綜合式報道。當下,以實現模擬人腦認知和學習能力為目標的各類人工智能技術,包括自然語言處理、語音識別與交互、視頻和圖像識別與搜索、機器學習與智能編輯等取得了顯著進展,為數據新聞生產提供了更多創新的可能,對其發展中形成的熱點趨勢和有效應用需要進一步觀察和反思。

(本文為2017年上海市高峰學科新媒體研究課題、復旦大學“卓學計劃”項目成果)

注 釋:

①“每個街區”(Every Block)是以鄰裡新聞和討論為主的網站,網站提供包含美國的城市新聞、公民數據以及混合形態的信息服務。

②《數據新聞手冊》在線中文版。《數據新聞手冊》是為對數據新聞這一新興領域的愛好者所出版的一本免費開源的參考書。該書始於2011年在倫敦舉行的數據新聞工作坊,后通過來自包括BBC、《衛報》《金融時報》《紐約時報》等媒體的諸多數據新聞領域的倡導者與資深專家網絡協作方式編寫而成,並基於“知識共享協議”發布。http://datajournalismhandbook.org/chinese/。

參考文獻:

﹝1﹞劉義昆.大數據時代的數據新聞生產:現狀、影響與反思﹝J﹞.現代傳播,2014(11):103.

﹝2﹞王斌.大數據與新聞理念創新:以全球首屆“數據新聞獎”為例﹝J﹞.編輯之友,2013(6):16.

﹝3﹞郭之恩.式微的調查性報道﹝J﹞.美國新聞學評論,2010(9).

﹝4﹞李梅,王倩楠.大數據時代傳統調查報道的變革和重構﹝J﹞.今傳媒,2016(1):15-18.

﹝5﹞獵豹全球智庫.2016全球APP發展報告﹝EB/OL﹞.http://lab.cmcm.com/qygc/2016-09-02/85.html/2017-01-12.

﹝6﹞Bradshaw Paul.The Inverted Pyramid of Data Journalism﹝EB/OL﹞.http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/2017-01-16.

﹝7﹞劉瓊.國外報紙如何做數據新聞﹝J﹞.中國報業,2016(9):36-39.

﹝8﹞任軼楠.突發事件報道如何利用“大數據”﹝J﹞.新聞世界,2015(7):114.

﹝9﹞方潔,杜涵.用數據新聞報道突發事件有哪些技巧﹝J﹞.新聞與寫作,2015(2):67-69.

﹝10﹞Rogers,Simon,Facts are sacred:the power of data,Faber and Faber,Guardian Books,2013.

(作者為復旦大學新聞學院副教授)

(責編:趙光霞、宋心蕊)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部