人民網>>傳媒>>傳媒期刊秀:《新聞記者》>>2015·第2期
人民網>>傳媒>>正文

數據新聞何以重要?【2】

——數據新聞的發展、挑戰及其前景

郭恩強/編譯

2015年05月27日14:36  來源:新聞記者  手機看新聞

數據是一種戰略性資產

傳統紙媒的危機自不待言。在這種背景下,發行人和編輯們要決定哪些業務要砍掉,哪些領域要去投資,就變得更加謹慎。在數字化新聞環境下,盡管數據驅動新聞業有其前景和重要性,但一些媒體還是選擇關閉其致力於數據分析的部門。例如,“數字第一媒體”(Digital First Media)在2014年4月關閉了其致力於生產視頻和數據產品的“霹靂”(Thunderdome)項目。

2014年,數據新聞業進入了主流媒體。納特·西爾弗(Nate Silver)在“娛樂與體育節目電視網”(ESPN)開辦了全新了的“五三八”(FiveThirtyEight)網站,《紐約時報》開辦了“結局”(The Upshot)網站。這些新入行者能否實現商業上的成功仍是未知數,但是,對於數據新聞業而言,除了廣告以外有更多的商業模式。從能夠提供關於世界的洞見這一意義上看,數據可以被認為是一種戰略性資產。專有數據是能夠驅動巨型公司的商業模式的寶貴資源。在華盛頓特區,從硅谷到華爾街再到情報機構,數據科學家被當成熱門商品,這是有其原因的,那就是他們能夠從公共的和私人的海量數據中創造有價值的知識。類似的,對沖基金公司使用《信息自由法案》(Freedom of Information Act)去購買政府數據也是有其理由的,因為對於投資管理而言,數據是有用的商業情報。

我們將自己看成一個在新聞領域打拼的科技公司

當數據驅動的超本地新聞和數據報道的收入模式,處於可能繁榮也可能夭折的不明朗之時,非營利機構如ProPublica和《得克薩斯論壇報》(Texas Tribune)卻將目光放在了利潤之外。論壇報如今是在線媒體中閃亮的一員,聚焦於報道本州事務。憑借其在交互式體驗和數據可視化方面的成功,它如今成為美國數據新聞重要的典范之一。

目前論壇報擁有超過200個可視化產品和工具,其中包括一項公立教育檢索工具和一項高等教育檢索工具。后者收集和公布了得克薩斯州每個高等公立院校的財政、人員和教育表現數據。

論壇報收集數據的范圍廣度和精細程度,確實讓人印象深刻。它的在線流量和公眾對產品反饋的興趣,使之成為研究新聞業未來的重要案例。尤其是,在論壇報受歡迎的產品中,數據產品佔了大部分。其中,論壇報的數據圖書館和公職人員列表貢獻了大部分的流量。類似的數據圖書館在新聞界還是少見的。

“我們將自己看成一個在新聞領域打拼的科技公司,而非一個使用科技手段的新聞媒體。”論壇報的首席創新主管羅德尼·吉布斯(Rodney Gibbs)解釋說:“我相信,這個信念讓我們輕裝上陣。我們的科技團隊並不大,有4個全職的開發人員加上一個行政專員,他們就足夠維持我們的主要網站、數據APP和每月發布的可視化工作了。另外,我們兩個數據記者在整個編輯室內進行巡回工作,所以即使不是數據通的記者,也可以為他們的故事搭配數據和可視化工具。換言之,這裡的人無需堅信數據的價值,因為點擊量和受眾反饋已使我們所有人都成為數據的信徒了。”

ProPublica在2014年2月推出了自己的數據商店,免費發布原始數據,同時也出售給那些願意額外付錢購買其他附加值數據的客戶。克萊因寫道:“在數據商店,你可以找到我們在報道中使用的數據,而且數據量還在增長中。如果是原始數據,比如我們從政府來源得到的數據,你會發現一個免費的下載連接,隻需對一份簡化版的使用條款表示同意。如果是需要在政府網站上下載的數據,我們簡單地將其鏈接到原網站上,來保証你快速得到最新數據。”2014年4月,ProPublica網站宣布,將數據商店的范圍擴展到報道中使用到的所有數據,此舉引發強烈關注。“如果你觀察諸如美聯社、路透社和彭博社這樣的新聞室,會發現他們的核心內容是數據產品,其中一些真的非常掙錢”,克萊因對《哥倫比亞新聞評論》 (Columbia Journalism Review)表示,“無疑,對很多新聞編輯室來說,銷售數據產品是個創富機遇”。

數據新聞助力機器人新聞業

數據在其他冒險事業中也將扮演一定角色,也許將為“機器人新聞業”提供助力。如“敘事科學”(Narrative Science)公司提供的一種自動編寫新聞的服務。2014年3月,有關洛杉磯地震的第一篇報道就是機器人寫就的。它的開發者是《洛杉磯時報》的記者和程序員肯·史文切克(Ken Schwencke)。這不是首個“機器人記者”(roboporter),在此之前,基於類似算法,他們還開發了一個有關謀殺報道的新聞機器人。

由自動編寫的軟件來完成本地交通、天氣、高中運動會、警方通報等的新聞報道,看來是不可避免的趨勢,盡管人類編輯仍需在機器人記者寫的文章上起作用。“當了幾年的本地新聞記者,我可以說,編寫簡報,統計諸如謀殺、地震、火災這些文章,本質上就像是瘋狂填詞(Mad Libs)游戲,完全可以讓機器來干”,威爾·瑞摩斯(Will Oremus)寫道,“……但同時,地震機器人(Quakebot)也清晰地揭示了自動化編寫程序的局限。它無法評估地面的損失,不能採訪專家,無法辨別故事中相對有價值的角度”。

短期內,這類新聞機器人(newsbots)的最大用處,可能是充當編輯記者的早期預警系統,在一片雜音中尋找新聞線索做好標記,好讓記者們去分配任務,調查核實。這種類型的數據新聞能挑揀和抓取信息,發出警報,很可能會受到城市新聞編輯的喜愛。此類自動化已經得到廣泛應用,從政府問責到金融報道都有所涉及。“我們希望賦予這種監控和預警功能更多東西”,阿隆·菲爾霍夫表示,“我們每年都會收集上百萬條有關競選捐助與支出的信息。舉例來說,如果一個國會成員遇到麻煩,你會在法律服務那欄看到標記著相關變化的情況。此時,系統會向報道國會新聞的記者發去提醒。這樣就能運用科技,提高記者的工作能力”。

也許有一天,情況會發生改變,正如“敘事科學”的聯合創始人和首席技術官克裡斯蒂安·哈蒙德(Kristian Hammond)對史蒂文·列維(Steven Levy)說的那樣:

相信隨著“敘事科學”這個軟件的成長,它編寫的故事會位於新聞產業鏈的上端——從產品新聞(commodity news)到解釋性新聞,甚至是細節豐富的長篇報道。也許在某種程度上,人類和程序可以合作,各自完成自己的強項。計算機,憑借其無瑕的記憶能力和對數據的抓取能力,也許可以充當人類記者的助手。或者相反,人類記者可以採訪一些對象,整理出遺漏的細節,然后發給電腦讓它來完成文章。隨著電腦越來越完善,能取得越來越多的數據,它們作為故事講述者的局限性將被打破。“人類確實具有令人無法置信的復雜性和豐富性,但它們是機器。也許20年內,將不再存在‘敘事科學’不能寫出報道的領域。”

(作者系:華東政法大學科學研究院助理研究員,法學在站博士后。)

(本文編譯自亞歷山大·本杰明·霍華德(Alexander Benjamin Howard)撰寫的《數據驅動新聞業的藝術與科學》(The Art and Science of Data-driven Journalism)研究報告的第三部分,該報告由哥倫比亞新聞學院TOW數字新聞中心發布。)

上一頁
(責編:汪倩(實習生)、宋心蕊)



我要留言

進入討論區 論壇

注冊/登錄
發言請遵守新聞跟帖服務協議   

同步:分享到人民微博  

社區登錄
用戶名: 立即注冊
密  碼: 找回密碼
  
  • 最新評論
  • 熱門評論
查看全部留言

24小時排行 | 新聞頻道留言熱帖