網易《數讀》欄目數據新聞的真實性研究
摘 要:本文通過文獻梳理對數據新聞的真實性做了簡單界定,然后通過對網易《數讀》欄目創辦至今的所有數據新聞進行內容分析,試圖探究該欄目數據新聞的真實性問題。研究發現,網易《數讀》欄目中的數據新聞在把握真實性方面存在風險:真實性的把握主要依靠“權威”渠道來控制,其中對國外非政府組織這一信源依賴程度最高﹔媒體本身對數據新聞真實性的把控較弱,在數據處理的問題上沒有進行加工使用,同時多種信源交叉印証上做的不夠好﹔很大一部分數據來源描述模糊,原始數據的缺位。
關鍵詞:新聞真實性﹔網易﹔數據新聞
中圖分類號:G210.7 文獻標識碼:A 文章編號:1672-8122(2018)03-0079-02
一、引 言
隨著互聯網技術的發展與普及,“數據新聞”浪潮開始興起。它突破傳統的新聞生產流程,改變以文字為中心的報道方式,被新聞業界視作應對大數據時代的革新實踐。這一發端於業界的新實踐,最早源自歐美新聞業界的個別媒體,之后在全球范圍盛行。
國內數據新聞的實踐及研究起步相對較晚,直到2012年“大數據”概念開始引入中國,“數據新聞”這種挖掘數據背后關聯與模式的報道新形態才逐漸被人們所關注。2012年1月13日網易創立了《數讀》欄目,成為國內媒體探索數據新聞本土化的“領頭羊”。而后各大網站、媒體紛紛成立相關欄目進行數據新聞的報道嘗試。
然而,數據新聞作為新聞的一種報道形式,同樣需要遵循新聞真實性等原則[1]。而數據新聞成稿的背后往往是海量數據,如何在紛繁復雜的數據叢中驗証新聞的真實性問題也成為了當下一大難題。本文嘗試以網易《數讀》欄目為研究對象,參考《數據新聞:一個亟待確立專業規范的領域——基於國內五個數據新聞欄目的定量研究》(下文稱論文1)一文中採用的研究方法,試圖將本論文的部分研究結果與上述論文進行縱向對比,希望能解答“數據新聞的真實性”問題。
二、研究方法
(一)樣本選擇
本研究運用內容分析法對網易《數讀》這一最早探索數據新聞本土化的欄目做定量研究,從報道的角度反觀報道中涉及的新聞真實性問題。
選取該欄目的原因是:首先網易《數讀》是中國最早一批探索數據新聞的欄目,且運營至今仍保持著良好的用戶活躍度﹔其次該欄目在數據新聞業界具有一定的影響力,且單篇的用戶參與度高﹔最后該欄目依托於網易這一門戶網站,屬於互聯網時代中國網絡媒體的一個典型性代表。因此選取這一研究對象,無論從樣本數量還是樣本的代表性等方面,都具有典型性。此外,本論文的出發點在於希望為網易這《數讀》這一數據新聞欄目的發展提出建議與意見,故將之作為研究對象。
《數讀》欄目以“用數據說話,提供輕量化的閱讀體驗”為定位,每周發布2∼3條數據新聞,每周一三五更新。從2012年1月13日至2017年8月30日共計291條。除去重復的樣本(一篇數據新聞放在兩個或以上的專題分類中)和丟失頁面的樣本共4個,樣本數為287個。其中,國際專題中樣本54個,佔比18.6%﹔經濟專題中樣本37個,佔比12.8%﹔政治專題中樣本23個,佔比7.9%﹔民生專題樣本52個,佔比17.9%﹔社會專題樣本77個,佔比26.6%﹔環境專題樣本16個,佔比6.6%﹔其他專題樣本28,佔比9.7%。
(二)類目建構與編碼說明
本研究將主要從“數據來源”、“數據質詢”等研究變量來對數據新聞真實性進行量化研究。
“數據來源”變量中,確定三個從屬指標:數據來源的數量,數據來源的描述以及數據來源的機構單位。數據來源的數量確定為無、一個、多個。數據來源的描述,可以區分為沒有提供數據來源、給出了數據來源的范圍但讀者無法獲取、可以通過描述找到具體來源。數據來源的機構單位可以分為:無、國內政府機構、國內非政府機構、國外政府機構、國外非政府機構、混合型、自採型。數據源由跨類型機構合作或者採編人員採納跨類型數據,則計入混合型。網易自己調研數據則為自採型。
“數據質詢”變量當中,採用賦值的方式來分析數據質詢,沒有數據處理(或全文字)則為0分,單純展示數據源中的數值為1分,進行數據源多角度、多樣性質詢,如對比等,則為2分,深度挖掘,做探索性、預測性等數據處理就計為3分。
本設計由兩名編碼員負責編碼,進行過培訓和信度測試,編碼員間信度超過0.9后開始正式編碼。變量分析將採用spss軟件進行數據分析。
(三)研究假設
本文將試圖探究網易《數讀》欄目中的“數據新聞是否具有新聞真實性”的問題,首先將假設該欄目中的數據新聞具有新聞真實性。
那麼需要繼續驗証以下幾個假設:
假設1:所有樣本都應該交代數據來源,且數據來源大多清晰明確。
假設2:樣本數據的來源機構應該較為平衡。
假設3:為確保數據的真實性,數據來源應該較為多樣,相互印証,故數據來源數量與數據處理的數值之間應該呈現正相關。
三、研究發現
通過SPSS軟件對數據進行分析后,得出如下結果。
(一)假設1驗証
從“數據來源數量欄數量百分比”來看,假設1部分成立。
首先,研究涉及的287個樣本全部交代了數據來源。其中,160個樣本中提到了1個數據來源(55.7%),127個樣本中提到多個數據來源,佔比44.3%。
盡管所有的樣本都交代了數據來源,但超過6成的樣本交代信息來源模糊,隻簡單交代了數據來源的模糊范圍——讀者難以根據提示找到原始數據﹔僅36.9%的數據新聞提供了清晰鏈接或數據來源文本標題。
(二)假設2驗証
根據對樣本數據來源的機構單位樣本數的統計,可知假設2不成立。
首先,樣本中混合型數據佔比較低,為18.8%。(混合型數據指的是數據源由跨類型機構合作或者採編人員採納跨類型數據)。
第二,網易《數讀》中數據新聞大多涉及國內領域,但287個樣本中有67.2%的數據來自國外機構,國內機構(政府組織和非政府組織)僅佔14%。國內數據來源與國外數據來源比例失衡嚴重。
第三,政府組織與非政府組織比例不平衡,其中國內外非政府組織所佔比重大(67.3%),政府組織的數據採用比例小(14%)。
從上述結果看,樣本數據的來源機構不平衡,國內外數據、政府組織與非政府組織數據比例失衡,容易影響新聞真實性。
(三)假設3驗証
將數據來源的數量和數據質詢評分兩個變量做相關分析后發現,Pearson相關性的值為0.127,屬於弱相關,表明這兩個數據的相關性不顯著,因此,假設3不成立。
四、討論與結論
將上述分析與論文1中部分內容進行對比,發現假設1與論文1的結果相似。論文1中顯示“網易表現最優(全部交代數據來源)”和網易《數讀》欄目達不到“樣本中的絕大多數應該是描述清晰的”這一假設,與本文中假設1“全部交代數據來源但超六成數據來源交代模糊”的結果相同。假設2關於數據來源的機構單位樣本數,假設1非政府組織數據佔比大與論文1中呈現的“使用最多的數據來源是非政府數據”相一致。假設3中數據來源的數量與數據是否進行質詢之間不具備明顯相關性。
綜合以上,筆者發現,盡管網易《數讀》欄目的數據新聞所有的樣本都標注了數據來源,確保數據“有章可循”,但實際上,這些樣本作為新聞的一種報道形態,在新聞真實性上依舊存在以下風險:
第一,大多數數據新聞單純發揮傳播“結論”的作用——搬用單一數據源提供的數據進行可視化處理,對“信息”真實性的把握主要依靠“權威”渠道來控制,其中對國外非政府組織這一信源依賴程度最高。在總樣本中,一半以上的數據新聞隻存在單一數據源,近8成的數據來自於國外機構,沒有自採型數據。
第二,媒體本身對數據新聞真實性的把控較弱,在數據處理的問題上沒有進行加工使用,同時多種信源交叉印証上做的不夠好。數據處理問題上,79%的數據直接展示數據數值或內容,成為了數據的“搬運工”。進行多樣性統計加工的數據新聞較少,數據源數量與數據處理之間呈現弱相關。
第三,很大一部分的數據來源描述模糊,原始數據的缺位使得讀者無法通過閱讀原始數據及研究方法等自行驗証真實性(多條數據新聞的評論中出現讀者發問“數據怎麼來的?”)。
當然,以上風險中有本身存在一個國內數據源公開的程度問題,這也使得網易數據新聞在某種程度上較難實現信源平衡等問題。
參考文獻:
[1] 張倩.網易數據新聞“數讀”解讀[J].新聞世界,2016(6) :56-58.
[2] 陳昌鳳,王宇琦.公眾生產信息時代的新聞真實性研究[J].新聞寫作,2016(1):48-52.
[3] 方潔,高璐.數據新聞:一個亟待確立專業規范的領域——基於國內五個數據新聞欄目的定量研究[J].國際新聞界,2015(12).105-124.
[4] 郎勁鬆,楊海.數據新聞:大數據時代新聞可視化傳播的創新路徑[J].現代傳播,2014(3):32-36.
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注