人民網
人民網>>傳媒>>人民網獎學金>>郵電2017

新媒體時代下新聞傳播“五力模型”的構建及可視化實現【3】

郭文文、郭泰、杜寶琛、馬正
2018年02月12日10:58 | 來源:人民網研究院
小字號

3 新聞傳播五力模型算法模型

3.1同一新聞事件的判斷

一般會出現新聞轉載和新聞的后續報道,所以需要進行兩種方向的判斷。首先,如果兩篇文檔全部一致的話,可以確定為轉載。否則進行相似性判斷。對於新聞內容可以先進行預處理,進行中文分詞和除去停用詞。然后識別命名實體,然后把各個關鍵詞用TF-IDF進行處理,對於命名實體使用權值進行加強。然后選取n個權值比較大的詞生成網頁的特征向量,如果兩個網頁的特征向量出現相同詞數量大於一定值,則判斷兩個網頁為同一新聞事件的網頁。判斷為同一新聞事件的網頁后,需要提取關鍵數據:新聞的內容、新聞發布網站、新聞網頁源碼、新聞的評論內容。

3.2傳播力的算法模型

本文將傳播力的算法模型設置如下:

傳播力=傳播范圍+傳播持續時間+傳播速度+目標群體覆蓋率

其中傳播范圍、傳播速度按照上文描述進行計算,且值域為[0,1]。目標群體覆蓋率為同一新聞事件發布及轉載的媒體傳播力排行榜數據值之和,其中新聞網站來源的傳播力為:利用傳播力排行榜表格中的數據,排名前10的傳播力數值設為11﹔排名10-20的傳播力數值設置為10﹔20-30設置為9,以此類推。排行榜不存在的按照1處理﹔發布媒體為微信的則為微指數公眾號總閱讀數排名,具體規則同上。

考慮到數據的獲取能力,計算傳播范圍時採用新聞網站、微信、微博數據,計算新聞事件佔當天新聞比重。傳播持續時間計算新聞事件在媒體中出現累積的天數。傳播速度計算如下:

3.3公信力的算法模型

公信力指新聞媒體自身在長期的新聞傳播實踐過程中所形成並累積的、贏得社會和廣大受眾普遍信任的程度或能力,包括了信息創造者、發布和轉發的媒介平台三部分。由於公信力包含了主觀和客觀的對媒體和作者的評價,所以這裡以權威網站的排名作為信息。

3.4說服力的算法模型

說服力中關鍵詞的確定需要綜合以下幾個方面考慮:

1:使用TF-IDF計算出每個詞的權值,權值越大的詞越關鍵。

2:按照詞性進行分類,一般人名、地名、機構名較容易成為關鍵詞,所以對這幾類詞賦予較高的權重。

根據以上幾個方面綜合計算之后確定出最佳關鍵詞,然后統計該關鍵詞在每日關於該新聞時間的新聞中總的出現次數為A,即為詞頻。

關於報道說明性信息量的計算方面,對於關於該新聞事件的報道對於完全相同的隻取其中一篇,然后統計各個報道的網頁源碼,識別其中html中圖片和視頻標簽的個數來統計其內容的豐富程度。最后對其數量進行加總,為S。

關於輿論導向的計算方面,截止到當日24:00,針對同一新聞事件相關的新聞報道的網絡評論進行評論情感分析,計算具有明確傾向的評論分類情況,與目標期望進行匹配。

3.5號召力的算法模型

同上文所述,先對新聞稿件進行判斷,如果屬於同一新聞事件的就計入統計。當天的總的網頁數量即為轉發數,為z。評論數為當天各個網站下關於此新聞事件評論的數量的總和。搜索數量為當天的百度和微博關於該新聞事件關鍵詞的搜索數量的加和,設為s。

3.6影響力的算法模型

新聞影響力(E)由五種基本指標動態決定。該五種指標分別為:新聞源網站的轉載率r、所處版面特征值p、發布時段特征值s、新聞標題特征值t和新聞認可率z。

其中,轉載率r為所轉載媒體的影響力值乘以相應權重決定。

4 新聞五力模型指標體系實驗及結果

4.1 實驗數據集

本文按照不同新聞源(新聞網站、貼吧、微信、微博)連續獲取了一個月內一對競品(王老吉和加多寶)的新聞資訊,獲取的實驗數據列表見表6。

4.2 實驗結果

對文本內容進行去重和無用數據清洗后,將新聞內容按照新聞五力模型指標體系進行了標注和計算,得到了以下結果。

4.2.1傳播力

如圖7所示,傳播力以折線圖表示,以天為單位反映了一個月內傳播力的變化。節點上顯示當天傳播力的數值。鼠標懸浮在節點上可以看到詳細信息。折線圖顯示了一個新聞事件隨時間的傳播力變化,可以看到當事件發生初期傳播范圍較小,隨后在某個時間內突然增加,隨后慢慢減小。

(責編:溫靜、趙光霞)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部