人民網>>傳媒>>傳媒專題>>傳媒期刊秀:《今傳媒》>>2014年·第12期

雲技術時代的數據新聞制作

王錫苓,王 榮

2014年12月05日08:13    來源:今傳媒    手機看新聞

摘 要:互聯網技術已將世界聯結為一個整體,由此帶來人類社會政治、經濟、文化的深刻變化。移動互聯網、物聯網技術,更是催生出海量的數據及其相關的雲技術的發展。在此背景下,傳統新聞採訪、報道方式面臨前所未有的情勢。數據新聞以能夠分析、處理海量新聞信息、挖掘數據背后深層的宏觀社會背景、著以可視化的呈現方式成為當下網絡傳播時代的亮點以及未來新聞報道的趨勢。本文著重分析大數據時代背景下,數據新聞的採集、處理分析以及呈現的類別特性,以為進一步深入研究數據提供我們的一些思考,並對大數據技術提出反思。

關鍵詞:數據新聞﹔大數據﹔新聞報道

互聯網雲技術時代深刻地變革著我們的社會生活,移動互聯網、物聯網的海量信息將人類帶入大數據時代。雲技術、大數據同樣也改變著傳統新聞報道的呈現方式:一種可視化的、交互的新聞報道樣式,被稱之為數據新聞(Data Journalism)。數據新聞在一定程度上消解了傳統新聞採集、寫作、報道,甚至是傳者與受者之間的疆界。海量新聞的抓取、挖掘、處理分析與可視化呈現,這個制作流程不僅需要傳統新聞從業者的專業知識與實踐經驗,同時也離不開信息處理、計算科學以及其他專業領域的從業者通力協作。數據新聞帶給新聞傳播領域新的視界,引起國內外業界、學界的高度關注。文本將對數據新聞制作流程的類別特性做一梳理,以期為數據新聞教學與實踐提供有益的思考。

一、數據新聞出現的背景

數據新聞的出現,與互聯網雲技術時代相伴相隨,且與大數據緊密相聯。雲計算相當於硬件資源的虛擬化,而大數據則是海量數據的高效處理。如果把雲計算比喻為計算機的操作系統、它將大量的硬件資源虛擬化后再進行分配使用的話,那麼,大數據則是海量數據的“數據庫”。前者如Amazon,為雲計算提供了商業化的標准。后者如Google、facebook、Twitter等前沿互聯網公司為人類帶來了SQL(Structured Query Language,簡稱SQL。SQL語言是一種數據庫查詢和程序設計語言,用於存取數據以及查詢、更新和管理關系數據庫系統)的操作[1]。技術的不斷發展為數據新聞的發展提供了可能。就全球而言,歐美國家的一些主要媒體首先覺察出網絡技術發展之於新聞報道的巨大影響,並迅速作出應對。《泰晤士報》《衛報》及《紐約時報》都已組成數據新聞團隊,對一些重要新聞事件進行數據的深度挖掘與呈現。如《衛報》數字新聞部針對新聞選題搜集海量數據,過濾后,通過圖表、互動效果圖等可視化轉換方式完成事件的新聞敘事。再如《紐約時報》在2007年成立互動新聞技術部(Interactive News Technologies Department)探索在線新聞報道。其利用美國總統大選、奧運會等重大新聞事件搜集海量信息、挖掘其中有價值的新聞線索,以互動圖表的可視化方式呈現在《紐約時報》網站上。

2012年,由“全球編輯網絡(Global Editors Network, GEN)”在全球評選“數據新聞獎”。這一獎項的設立為數據新聞的制作與普及樹立了標杆。縱觀其三年來的參賽及獲獎作品,大多集中在歐美國家[2],反映出我國數據新聞與世界頂級媒體在數據新聞領域的差距,同時,也為我國數據新聞的發展起到某種示范作用,啟發我們對數據新聞的探索與實踐。

二、大數據背景下數據新聞的制作與呈現

如前所述,數據新聞與雲技術、大數據之間有著十分密切的關系。有學者對大數據的特點歸納為4V,即多樣性(Variety)、海量(Volume)、快速(Velocity)以及價值[3](Value)。大數據的總體架構共分為三層,數據存儲、數據處理和數據分析。類型復雜的海量的數據存儲依托雲技術解決,數據新聞的快速和時效性有賴於數據處理層解決,最后,數據新聞的價值由數據分析和可視化呈現解決。數據新聞首先要解決存儲問題,然后根據新聞事件的需要和目標價值建立起相應的數據模型和數據分析指標體系,對數據進行深層次挖掘,揭示數據所蘊含的宏觀意義。由於計算機技術的飛速發展,可對數據進行並行計算和分步計算已成為可能,以保証新聞事件的時效性並通過可視化呈現出來。

(一)數據新聞的採集、處理與分析

數據新聞的生產過程包括了數據的採集、處理分析與呈現等幾個環節的過程。大數據時代產生海量的即時數據,對數據抓取、挖掘與處理提出了很高的技術要求。數據新聞制作依據一定的報道意圖,把存儲在雲端的大數據挖掘出來,再結合編輯記者的新聞理念對數據進行處理分析。這不僅要求傳統的新聞從業者具有從紛繁復雜的大數據中對有價值的新聞事件的敏感與“嗅覺”,即所謂“新聞鼻”或“新聞眼”,而且也要求其具備基本的數據分析與處理能力,它同時也為與信息處理、計算科學等專業領域人士進行協作提供了平台。當面臨海量、復雜的大數據時,尋求與專業人士的合作,組建數據新聞團隊更能提高數據新聞報道的質量和效率。

較早開始數據新聞實踐的一些世界頂級媒體,也正是以這樣的理念進行數據新聞的實踐操作的。芝加哥論壇報的APP制作小組自稱為“潛入新聞編輯部的快樂黑客”,他們的工作包括:“與編輯和記者密切合作,幫助他們1.調查和報道故事﹔2.在線描繪故事﹔3.為芝加哥當地的特定群體建立永久的網絡資源。最重要的一點是我們就在編輯部裡工作,常常能在與記者面對面交談中找到我們需要做的東西。[4]”在這些世界頂級媒體,雇佣類似的“黑客”進行數據的採集已不再新鮮。黑客能夠熟練利用互聯網絡技術,根據記者的需求編寫有針對性的工具軟件,抓取記者想要採集的網絡數據,或者對大量文本資料進行數據化轉換,以便記者處理分析。

BBC的數據新聞團隊也是包括由記者編輯、設計師、研發人員在內的人員組成,這樣的團隊包攬著復雜的數據新聞制作。記者編輯提供設計建議,技術人員提供技術支持和建議,合作完成數據的採集與分析處理。ABC(澳洲廣播集團)的團隊成員都包括:一位網頁開發及設計人員、一位主編記者、一位制作人顧問、一位長於數據採集分析與整理的兼職研究員、一位專長於數據挖掘與圖形可視化以及其他技術的學術顧問、一位項目經理以及ABC跨媒體平台部門的行政支持,尤為重要的是,還有一支由記者及相關人員組成的顧問團隊[5]。這支團隊從政府網站和公開報告的數據中汲取靈感,並讓記者編輯與技術顧問在一起工作,以便及時交流溝通各自的思想。記者編輯、技術專家、數據專家一起對數據的處理分析提出建議,面對海量數據快速反應,通過合作對數據進行專業分析,並從中發現新聞報道的線索和故事。新聞記者與數據專家這兩個過去沒有交集的職業,在ABC的辦公室裡逐漸融合,共同完成數據新聞的跨領域制作。對數據採集、處理和分析的跨域合作,不僅更好地實現了大數據的採集挖掘,也促進了數據處理分析專業性與新聞性的結合。

(二)數據新聞的呈現

大數據不僅提供了多樣性、海量、快速變化的信息,更重要的是提供了隱含在這些信息背后的價值。數據新聞通過對信息的採集與分析,能夠挖掘出信息背后的有價值的事件線索。但如何傳播這些信息,如何在新聞呈現時體現信息的價值,是數據新聞制作必須解決的難題。在嘗試數據新聞的起始階段,媒體直接將文字新聞的頁面鏈接到APP,但這樣的做法並沒能帶來訪問量的大幅提升。於是數據新聞開始嘗試將文字新聞向可視化新聞樣式的拓展,利用可視化的呈現方式幫助受眾理解數據,解讀數據所蘊含的價值。並在大數據的基礎上,試圖讓讀者從數據中發現自己的故事。英國《衛報》是研發數據新聞較早的媒體,在其數據新聞博客(Guardian Datablog)上,《衛報》分享著新聞報道背后完整制作故事,包括數據採集、數據的可視化分析作品、以及一些以公共數據為基礎的搜索引擎。受眾通過個性化的搜索,尋找數據中的自己,加深對數據的理解和情感聯系。然而,《衛報》並未就此停步,而是以這些數據和可視化作品為基礎,繼續進行數據挖掘探索,並將其編輯成一系列的新聞故事和深度報道,充分開發數據所蘊含的價值。相比於傳統媒體直接將原始統計數據呈現給公眾而言,數據新聞呈現更側重於對數據的意義提供解釋,呈現數據的價值。《衛報》西蒙•羅杰斯(Simon Rogers)曾舉例說明數據新聞可視化的有效呈現方式,“當英國首相聲稱2011年8月發生的暴亂與貧困無關時,我們在有貧困指數的地圖上標注了騷亂者的地址,以此來揭示這份聲明背后的真相。[6]”

通過海量數據的呈現來反映新聞的內在價值,需要的不僅是可視化的技術手段,更重要的是指導數據分析與呈現的新聞理念和編輯思想。不同的新聞理念,反映在可從數據中發現不同的新聞價值。《紐約時報》的可視化作品《重塑紐約(Reshaping New York)》[7]展示了12年來紐約城市的變遷,從房屋建筑到區域劃分,再到各區房價、物價及教育水平等資源的流變。報道既客觀平靜地展示了紐約的變化,又讓這些立體的圖景以無聲的語言一一道出了彼時最具爭議的市長布隆伯格在任12年來對紐約城市所做的工作。變化的圖表展現了紐約市貌的改進,卻沒有體現這些改變對普通居民帶來的困擾﹔經濟指標表現了紐約經濟水平的提升,卻回避了高房價逼走的本土居民。數據的呈現方式給新聞披上了貌似客觀公正的外衣,卻遮掩了背后的事實真相。通過不同編輯理念的新聞思維和不同呈現方式的選擇,可以體現出事件背后不同的內在價值。數據是會說謊的,在海量、即時的大數據面前,挖掘出數據背后的真正價值,仍然需要專業的新聞理念和編輯思想的支撐。

三、數據新聞的類型特性

數據新聞作為眾多新聞報道樣式中的一種,其特征也可以從內容和形式兩個方面來總結。

(一)數據新聞的內容

數據新聞關注的內容主要包括兩類:數據和故事。所不同的是,數據新聞的數據更為龐雜,記者的任務就是從對這些數據的處理中找到清晰的聯系和深層的意義﹔數據新聞的故事則是從龐大的數據庫中精選出來的最具代表性或者最為動人的故事。數據為故事勾畫了更為宏觀的圖景,故事也給數據做了最為生動注腳,二者相輔相成相得益彰。

所謂數據新聞,首先就是要有數據的驅動。從歷年的獲獎作品也不難看出,要形成優秀的數據新聞報道,大量有價值的數據是必不可少的前提條件。以2014年的世界數據新聞獎為例,獲獎作品多是數據驅動型的調查類報道。如,描繪歐洲移民故事的《移民檔案》,講述人們如何失去房屋所有權的《被奪走的家園》,專注支持新聞調查類報道的NZZ團隊,以及《紐約時報》推出的“地理位置在收入階梯中的作用”的互動地圖等數據新聞項目[8]除了在形式上的創新外,所有新聞都掌握了大量的數據,並對所掌握的數據進行了核實與整理。以《移民檔案》為例,這是一個由六個國家10余名記者協作完成的、包含了2769個事件,13713個移民故事的龐大數據庫。記者在這些數據的基礎上,對歐洲移民的歷史現狀以及相關政策進行了詳盡報道與解讀。

盡管數據是驅動數據新聞的前提和基礎,但是在這些獲獎作品中,數據並不是唯一重要的內容。另一重要的內容則是故事。所有獲獎作品無一例外都講述了有著深刻社會歷史內涵的完整故事。這些活生生的故事賦予了數據以生命,使得存在於數據中的不再是簡單枯燥的數字,而是一個個鮮活的富有生命力的人和他們的故事。條理清晰的數據配合上這些精心挑選的故事,賦予了數據新聞強大的生命力和可讀性。數據和故事共同揭示的不再是簡單一個故事或一個主人公,而是通過這些現象和鮮活的人勾勒出復雜的社會現象,從故事擴展到數據,推及到群體,上升到社會群體層面,提醒人們進行深層思考。

從實踐操作層面看,有三種新聞類型由於其蘊含著豐富的數據和故事適合採用數據新聞的報道形式:數據驅動型調查報道、受眾參與共建型全景式新聞、視覺豐富型新聞事件。隨著開放數據源(open data source)的不斷涌現,新聞業可利用的數據愈來愈多。如何把這些新聞富礦開採出來,如何理解這些表面上毫無規律可循的數字,並將其變成生動的新聞報道,如何從中尋找新聞線索、挖掘社會問題、解讀社會現象,數據新聞還有很長的路要走。與此同時,社交網絡和移動互聯的發展為受眾參與新聞報道提供了可能,受眾可以隨時隨地為新聞的全景式呈現貢獻各自力量。受眾的無處不在帶來了比記者在場更為豐富的新聞內容,並且突破了時空的限制,第一時間帶來第一手資料,新聞機構將這些資料進行整合,再與受眾互動,形成了信息共建的良性循環,共同對新聞事件進行全景式描述。視覺沖擊是數據新聞的特色,其本身就能提供豐富的視覺符號的事件,或者適合於用多種形式展現的數據,在最終的可視化呈現上會更有優勢。

盡管數據新聞成為當下的熱點話題,但是必須明確的是,數據新聞只是一種報道樣式,並不適用於所有的新聞報道,不能刻板地把所有新聞報道都進行數字化改造。如果僅僅為了使表面效果看起來絢麗奪目而刻意進行可視化,則會變成把簡單信息復雜化的盲目炫技或跟風,反而不利於新聞信息的傳播。歸根結底,數據只是一種手段,新聞的關鍵還在於對數據背后的有價值的意義的呈現與解讀。

(二)數據新聞的形式

從全球范圍來看,數據新聞的報道形式多種多樣,目前可大致歸納為三類,即靜態圖表、動態圖表、人機交互。目前我國媒體使用較多的為前兩種,在人機交互方面的實踐並不多。

媒體的種類影響著其信息呈現的樣式。如廣播不具備數字可視化的條件,報刊雜志也隻能使用靜態圖表的呈現方式,同時還受版面空間和審美等多方面的限制,電視由於其視聽綜合的特質成為實現靜態與動態圖表展示的優質平台。如2014年1月底,中央電視台綜合頻道《晚間新聞》的“據說春運”節目中,主持人“用大數據講述了春運背后的故事”。故事是通過一張最新遷徙動態圖給出的,黑色的背景中勾勒出中國地圖的輪廓,不同的城市間用連接線條標示出人們往來移動的線路,動態的線條在視覺上形成了城市間的流動感。同時輔以百度指數提供的熱詞分布表,以便進一步解釋當年春運的現狀。這種報道方式更加直觀地展示了春運的現狀,准確地對春運進行了全景描述,在視覺上帶給人一定的享受。

比傳統媒體相比,網絡媒體與數據新聞之間有著某種天然的“親密關系”。盡管我國目前並沒有專門進行數據新聞報道的門戶網站或APP(第三方應用程序),但一些媒體借助微博、微信等社交媒體或一些門戶網站的平台及時的發布新聞。

1.靜態圖表。靜態圖表有簡單、復雜之分。簡單靜態圖表多為一些較為直觀的頻率分布表或趨勢走向圖。復雜靜態圖表通常用來報道一些較為復雜的社會現象,或者解讀一些相對復雜的政策報告。在理清事情發展脈絡或事物間的關系方面,靜態圖表有其獨特的優勢。通過靜態圖,可在復雜的時間線索中抽出主線,清理旁支,使復雜現象在視覺上一目了然。

2.動態信息圖。靜態信息圖可以展現一個平面的事物,或者說一個二維空間的信息。一旦涉及到多個維度,則需要動態信息圖進行補充。動態信息圖能夠反映注重某一新聞事件的多維角度,呈現事物發展的動態過程,或將時空等多維度視域進行融合報道,或通過簡單圖表的動態結構清晰呈現事物多個層次,不僅能清晰提供更為立體的大量信息,還能通過動態的變化畫面,吸引受眾注意。

3.人機交互。在人機交互方面,引領風氣之先的是歐美一些主流媒體和專業數據新聞門戶網站。如BBC“你是全球第幾個出生的人”,就是基於現有人口數據,實現人機交互的報道。受眾按照要求填寫自己的姓名、出生時間之類的信息,系統便會粗略算出答案。這種交互人機互動滿足了受眾的參與需求,其不僅提高了主動獲取信息的興趣,還在很大程度上增強了信息傳播的效果。

受眾既是事件的親歷者,又是報道的直接參與者,而且還是新聞事件的受者與傳者。人機交互更多的是報道理念的一種變化,把新聞生產變成所有人共同參與的事情,新聞機構隻扮演信息匯總、整理的角色。目前人機交互還剛剛起步,要真正做到人機交互,還有一段很長的路程。

四、結論與建議

(一)數據的採集

數據是數據新聞的核心所在,獲取數據是數據新聞的第一步,不斷拓展數據的來源就成了數據新聞發展的重要環節。一方面,新聞機構可以尋求外部的幫助,與數據挖掘、程序員等專業技術人員合作,拓展數據獲取的渠道。不僅要報道官方公布的數據源,還要通過計算科學技術深入挖掘現實社會深層的有價值的信息,用數據來驅動新聞報道。另一方面,還應該充分吸納受眾參與,開放數據源,進而實現數據的共享與共建。

(二)數據的利用

對數據的理解利用是考察數據新聞制作水平的關鍵環節。理解數據,不僅要多維結合,擴展數據的廣度,還要根植社會現實,挖掘數據的深度。其中新聞理念、編輯思想是牢牢樹立在其中的主線。即在拓展數據廣度、挖掘數據深度時,明確拓展與挖掘何為,探索有價值有意義的數據聯系。數據和故事相聯系,新聞與意義相契合,才能最好地利用數據展示新聞的社會價值,促進社會發展。

(三)數據的呈現

可視化是數據新聞呈現的重要工具,幾乎所有的數據新聞都在視覺效果上做足了功夫。無論是靜態圖表的繪制還是動態圖示的設計,都在美觀和易讀方面抓取了受眾眼球,成為當下最為耀眼的新聞“明星”。

然而,數據新聞呈現的可視化應以明確的新聞理念和編輯思想為指導,否則,數據挖掘、拓展以及可視化的呈現就會流於表面,成為炫耀的蒼白圖式,

(四)避免唯技術論的巢穴

無論是數據挖掘還是可視化呈現的技術,僅僅是一種示現表達的工具。酷炫的可視化效果固然引人入勝,但如果不是建立在有價值內核的新聞價值基礎之上,流於表象的形式主義終究是沒有生命力的。

數據新聞強調的是數據思維、數據理念,是透過數據的一種洞察力。數據新聞為新聞報道注入的,是一種新的報道視野。從內容來看,與傳統的基於記者敏銳的洞察力和新聞敏感相比,數據能輕鬆地找出不同尋常的新聞線索,並能在看似毫不相關的事物中找到聯系,探尋線索背后的社會根源以及解釋社會因素間的復雜聯系,這些都對記者提出了更高的要求。在技術的輔助下深挖內容,在有技術支持的基礎上呈現更深層次的內涵,才是數據新聞與傳統新聞報道的本質區別所在。

(王錫苓系中國傳媒大學新聞學院教授、博士生導師、民意與傳播研究所所長﹔王 榮系中國傳媒大學新聞學院博士研究生)

參考文獻:

[1] 邱文斌.雲計算和大數據二者的區別[EB/OL].來自微信公眾號:智慧城市圈子.

[2] 周婷婷,陳琳.數據新聞實踐的前沿發展——以全球“數據新聞獎”2013年獲獎作品為中心的分析[J].新聞前哨,2014(1).

[3] 彭蘭.大數據時代:新聞業面臨的新震蕩[J].編輯之友,2013(1).

[4] Brian Boyer: <How the News Apps Team at Chicago Tribune Works>, <The Data Journalism Handbook> , Chapter 3.

[5] Wendy Carlisle: < The ABC’s Data Journalism Play>, <The Data Journalism Handbook>, Chapter 3.

[6] Simon Rogers: < Behind the Scenes at the Guardian Datablog> , <The Data Journalism Handbook>, Chapter 3.

[7] http://www.nytimes.com/newsgraphics/2013/08/18/reshaping-new-york/.

[8] 數據來自Data Journalism Award – 2014 shortlist http://www. globaleditorsnetwork. Org / programmes / data-journalism-awards / 2014-shortlist/.

分享到:
(責編:謝琳(實習生)、宋心蕊)




注冊/登錄
發言請遵守新聞跟帖服務協議   

使用其他賬號登錄: 新浪微博帳號登錄 QQ帳號登錄 人人帳號登錄 百度帳號登錄 豆瓣帳號登錄 天涯帳號登錄 淘寶帳號登錄 MSN帳號登錄 同步:分享到人民微博  

社區登錄
用戶名: 立即注冊
密  碼: 找回密碼
  
  • 最新評論
  • 熱門評論
查看全部留言

24小時排行 | 新聞頻道留言熱帖