摘 要:數據驅動新聞是大數據技術與新聞業結合的新興概念,旨在利用科學的算法,從海量的數據中,發現新聞線索。但這一新興的技術構想存在與新聞人文價值追求的不匹配之處,譬如概念的泛化、數據基礎的缺乏,以及數據的真實性和靈活性問題。作者認為,數據驅動新聞只是一種工作方法的改良,並不能從根本上改變新聞的本質﹔盲目迷信數據的價值,隻會迷失新聞的人文追求。正如人的幸福是數據所不能精確描述的領域,“數據驅動”的發展面臨從理論到現實的多重制約。
關鍵詞:數據驅動新聞﹔技術偏見﹔數據可靠性﹔數據科學﹔人文取向
“大數據”是近年來傳媒領域的熱點,一種最具代表性的說法,就是“數據驅動新聞(Data-Driven-Journalism)”(或稱“數據新聞”)。最早開展數據驅動新聞實踐的包括了英國的《衛報》和美國的《紐約時報》,時間是2009年。其后不久,一群芬蘭新聞學者發布了《數據新聞趨勢》研究報告,歐洲和美國一些從事數據新聞實踐工作的探路者在互聯網上合作編寫《數據新聞手冊》,正式在世界范圍內掀起了一股數據新聞熱潮。
從概念上講,數據驅動新聞強調利用數據科學發現新聞。目前最廣泛傳播的觀點認為,數據驅動新聞是一個基於開放數據和開放工具的分析和過濾大規模數據的過程[1]。從新聞業務的流程來看,數據驅動新聞是深入挖掘數據的一個過程,包括收集、篩選和結構化數據,依照特定報道目的實現信息過濾,通過可視化技術實現信息呈現[2]。
從技術操作的效果看,數據驅動新聞有利報道者發掘新的觀察視角,挖掘獨家報道內容﹔荷蘭數據新聞記者Henk van Ess提出,這種報道的過程“傾向於展現問題的各個方面,而不是解釋問題”[3]。香港學者祝建華提出,數據驅動新聞所用數據是公開的,所用工具資源也是共享的,這是數據驅動新聞的一個特質[4]。
而從最終的信息呈現來看,數據驅動新聞就是要把事件發生背后的趨勢和意義以融合的方式完整的呈現給受眾[5]。也有學者分析了數據新聞報道的趨勢性特征,比如文衛華提到,區別於一般以文字敘述為主的新聞報道,數據新聞是以數據為中心,密切圍繞數據來組織報道[6]。又如彭蘭提出,在大數據等技術支持下,新聞中所需要的信息資源,將發生結構性變化,新聞中的事實、要素、背景等信息越來越多地通過自動的方式進行採集,並通過相關的技術進行過濾、分析[7]。
綜上所述,數據驅動新聞體現了大數據技術對新聞業務流程的改造,使新聞生產效率和新聞呈現形式都發生了重大的變化。但這一新興的技術構想如同所有技術化的迷思一樣,仍存在與新聞人文主義價值追求的不匹配之處。
一、概念的技術化
通過對以上概念回顧可以發現,“數據驅動新聞”這一概念的核心是處理已有數據,而不考慮數據的來源﹔隻談技術可行性,這種定義方式從一開始就打上了深厚的技術論印記。
數據驅動的說法忽視了新聞傳播中人的主體地位,將人視為數據的搬運工和盲從者。有人認為,“數據正變得越來越重要,這並不是因為數據的量大,而是我們擁有了工具和能力去分析數據,找出模式、結構並揭示趨勢。[8]”此說法不正確。人類使用技術的動機,並不源於技術的可能性,而來自人類社會解決新問題的需求。我們沒必要把技術的優越性當作技術的合法性。大數據技術之所以產生作用,其原因在於,過量的信息阻塞了我們信息處理流的“出水口”,讓我們對新聞與一般事實的區別產生了偏差。而大數據技術就是幫助我們理清數據的工具。換言之,“驅動”的概念是將新聞視作被動的商品,把大數據技術放大成拯救這一商品的靈湯妙藥,這是置新聞活動主體的能動性於不顧。
數據驅動新聞並沒有從根本上改變新聞的本質。正如劉建明所說,“大數據……不具有嶄新的時代特征。”劉建明認為,大數據作為一種海量信息的處理分析方法,僅僅是諸多信息技術的一個子集﹔從根本上說不具備物質生產和社會管理的革命性[9]。從歷史的角度看,數據驅動新聞與20世紀中葉在美國風靡的精確新聞思潮有繼承關系,精確新聞強調在報道中數字信息的羅列,在深度報道中有廣泛的應用,是對文字敘事的補充。由此看來,與其說數據驅動新聞是新聞業的技術革命,毋寧講是新聞實踐的工具改良。
二、技術先進性不等於合理性
大數據僅僅是數據驅動新聞的前置條件,數據的多少並不能保証數據應用的真實有效,恰恰相悖的是,過多的數據會增添應用的復雜程度,加大偽數據存在的風險,增添無關的干擾。新聞人有必要看到這一兩面性。從數據的採集來看,數據不如人靈活、主動。在大數據的思維框架下,人與信息的關系不是雙向的實踐與認識關系,而是單向的對應關系。也就是說,事物隻有經過了數字化處理,被一個數字化符號所代替,這件物品才在數字的世界具備了意義,否則,就是不存在。而問題的關鍵就在於,我們今天生活的世界並不是完全的數據世界,還有比如尚未解決溫飽的農民、缺乏主動能力的嬰兒,他們的思想和行為沒有數字化。但對數字世界而言,他們就是不存在的﹔以至於他們的情感、思想、靈活性以及創造力都得不到尊重和認可,這實在是指鹿為馬,是數字化的“種族歧視”。任何一種情感的表達不是一種媒介就能獨立承載。傳媒人要防止這種數字的簡單化,減少社會弱勢群體和少數族群的數字失落感。從數據的使用來看,數據也不是越多越好,以維基解密為例,其提供大量未核實、缺少語境的報道,所引消息也多來自沒人能見或無法証實存在的匿名者。因此這些數據本身就夾雜著含沙射影、公開偏見和曲解,其本身並不能自我說明[10]。
三、數據科學不保証人文價值
順著以上的思路,如果退一步講,即使所有的數據都是合理與有效的,傳媒人的主觀能動性也保証發揮,是不是就能夠確保新聞報道的人文方向呢?筆者認為,還不行。應該看到,數據科學的精密性追求和新聞學科的人文性導向本來就是兩個不同領域的問題,兩方之間並不直接相關。客觀的數據僅僅有助於我們求真﹔而對社會的求善與求美毫無幫助,就如同我們無法理解“80%的善”到底是怎樣的善。新聞本身就是意識形態,本身無法量化﹔如果非要通過機器數據假裝採取某個“客觀”立場,就會忽略新聞應有的權力和態度傾向,使新聞報道淺嘗於表面,顯得滑稽可笑。
從新聞屬性看,新聞兼有商業、事業雙重性,不能完全以消費者的需求為導向。正如付玉輝所說,“專業化媒介組織不應該成為社會公眾在大數據傳播環境下所呈現的各種內容需求的奴隸[11]”新聞的本質是給予受眾知的權利,而不是滿足普通人的消費欲望和對廉價商品的揮霍快感,特別是在漫天的商業廣告將每一條新聞的售價降到不能再低的時候。在編輯獨立的基礎上展開自主經營,這才是新聞區別於其他文化產品的一個關鍵。而大數據這個概念是商業領域和技術行業的舶來品,從一開始就是一個不可更改的、包裹著商業邏輯和營銷目的的工具性概念[12],這種以是否產生效率價值、產生多少效率提升的判斷標准與新聞的兩性標准並不完全契合。過度強調統計規則的運用、需求的服從,將打破新聞編輯與經營的對立平衡,無法保障新聞作品人文性的發展方向。
四、數據思維限制新聞人的創造性
英國作家胡斯曾提出這樣的疑問:“為什麼節省勞動力的機器沒有帶來更多閑暇?”“為什麼工人擁有的東西越來越多,他們對生活和工作的主宰權卻並不見擴大?”[13]。大數據技術給新聞人帶來職業變革,數據化思維正在降格新聞業百年的經驗智慧,剝奪記者在新聞中的主導作用。把數據作為新聞的核心驅動力量,就意味著用放在機房裡的數據公式替代親歷現場的記者的判斷力,把效率至上的機器和自動系統作為社會價值判斷的基准,使繽紛多彩的新聞事件同質化。更進一步的是,由於算法相較於新聞事件的滯后與刻板,記者的新想法將不能如編輯室裡彈性機動的爭論一樣被迅速的接受或採納,而隻能依靠一套刪繁就簡的規則被草率的判定,這就打擊了記者的積極性,也減少了報道的多樣性。比如美國一家名叫Narrative的公司,就聲稱可以利用機器以每30秒一篇的速度自動生成棒球比賽新聞稿[14],這就是把新聞報道與流水線上的披薩餅等同了,使記者的工作和拼裝工廠裡從事機械勞動的機械手臂相等同。
容忍世界的間斷和不完美是新聞人的基本素養,它與借助數據實現新聞的透明、客觀並沒有太大的關系。有一個比喻十分恰當,“我們不停談論信息革命,但很少言及記者,就好像醫療衛生領域取得的進步讓醫生變得多余一樣”[15]。記者永遠不會多余,大數據技術不應排斥記者的作用。總的來看,我們不要以為隻要與新技術相關聯,就會有新的報道形式出現﹔需知一味的追求技術應用,將導致我們失去與現實的聯系。誠然,今天的新聞業,面臨來自互聯網和資本市場的壓力與誘惑,已經很難保持傳統嚴肅新聞的清高。在可視化圖、海量數據面前,單一文字報道的視覺吸引力已大不如前。但正如之前所討論的那樣,新聞不是一般商品,而是社會文化的價值體現,正如《新聞業的懷鄉病》所說的,“對於一個以‘致富’為惟一生存准則的時代,叢林法則和達爾文主義的盛行似乎是一種必然。但是,總歸要有那麼一些人去呵護住最后那點理想的火星。”在數字新媒體狂歡的今天,我們需要新聞剝開技術的迷思,用夸張和尖利的聲音引導時代精神的方向。
(作者系:武漢大學 新聞與傳播學院)
參考文獻:
[1] Wikipedia.Data-Driven-Journalism[EB/OL].http://en.wikipedia.org/wiki/Data-driven_journalism#Definitions,2013-08-16.
[2] Mirko Lorenz. Data driven journalism: What is there to learn?[J] IJ-7 Innovation Journalism Conference, 7–9 June 2010, Stanford, CA.
[3] Van Ess, H. Handboek datajournalistiek[EB/OL].http://www. boomlemma.nl/communicatie-media/catalogus/handboek-datajoumalistiek-1.
[4] 祝建華.數據驅動新聞 大數據時代傳媒核心競爭力[EB/OL]. http://media.sohu.com/20120718/n348442131.shtml,2012-07-18.
[5] 祝建華.什麼是“數據驅動新聞”(DDJ)[EB/OL].http://media. people.com.cn/n/2012/0718/c120837-18543914.html,2012-07-18.
[6] 文衛華,李冰.大數據時代的數據新聞報道—以英國《衛報》為例[J].現代傳播,2013(5).
[7] 彭蘭.大數據時代新聞信息資源的結構性變化及其影響[J].中國廣播電視學刊,2013(7).
[8] 方潔,顏冬.全球視野下的數據新聞—理念與實踐[J].國際新聞界, 2013(6).
[9] 劉建明.“大數據”的迷思與新聞媒體的應對[J].中國廣播電視學刊,2013(7).
[10] 克利福德·克裡斯蒂安.論全球媒體倫理:探求真相[J].北京大學學報(哲學社會科學版),2012(6).
[11] 付玉輝.大數據思維與新媒體演進[J].中國傳媒科技,2013(6).
[12] 徐偲?.傳播研究與學術公共性:“大數據”熱潮的冷思考[J].東南傳播,2013(3).
[13] (英)胡斯著.任海龍譯.高科技無產階級:真實世界裡的虛擬工作出版社[M].北京:北京大學出版社,2011.
[14] 彭蘭.社會化媒體、移動終端、大數據:影響新聞生產的新技術因素[J].新聞界,2012(16).
[15] (法)吳爾敦著.宋嘉寧譯.信息不等於傳播[M].北京:中國傳媒大學出版社,2012.