人民網
人民網>>傳媒>>傳媒期刊秀:《新聞愛好者》>>2018年第10期

新聞的算法之謎與傳統媒體的智能化

劉建明
2018年12月10日10:41 |
小字號

來源:《新聞愛好者》

【摘要】西方的新聞算法並非出奇制勝的媒體新寵,個性化新聞分發潛藏許多陰差陽錯和信息風險。建立一套科學機制,防止新聞推薦的失算,才能保証新聞分發的安全性,受眾的差異化需要也能得到滿足。面對網媒的挑戰,把新聞的自動化生成轉化為報刊和廣播電視報道,實現傳統媒體的智能化和編輯記者的能智化,傳統媒體才可能發生大的變化。

【關鍵詞】兩種新聞算法﹔算法的失算﹔算法的科學化﹔傳統媒體的算法

算法新聞的創新正在攪動各類媒體的操作意識,調整算法的標配和技術指標,不僅決定各大資訊平台的競爭力,也使傳統媒體受益匪淺。但新聞的“算法推薦”曾引起廣泛的質疑:算法能讓受眾得到真正重要的新聞、了解社會的變化嗎?媒體使用算法新聞能否全面反映世界、透視社會現實?盲目夸耀西方新聞分發的算法,介紹算法的理論也讓人懵懵懂懂,根本無法回答和解決這類問題。為了解開新聞分發的算法之謎,本文不能不從新聞算法的常識贅述。

一、用於不同報道的兩種新聞“算法”

算法是計算機處理數據的主要手段,新聞的智能生成和新聞分發都有各自的算法,二者譯成漢語也有不同的說法,因為計算機對二者執行的指令不同,達到的目標不一樣,把兩個算法攪在一起,隻談推薦算法,使傳播規則的重塑陷入一隅。

第一種算法是指智能生成新聞的數據推算,英語常由Algorithm(Algorithmic)一詞表示。通過大數據搜索、整合和推斷,發現真實的新聞,由計算機編寫成文本,稱作智能新聞或自動化新聞,很多人把它譯成算法新聞。打開英文網站,Algorithmic Journalism,Algorithm about news或Videos of algorithmic news,大多是指由計算機在海量數據中自動編寫的新聞,按漢語的習慣似應譯為“智能新聞”或“計算機程序新聞”,可以將其稱為“自動化新聞”。

這類新聞不是記者親自採訪、寫作的,而是由計算機程序搜索到數據,經過統合、辨析提取事件的五個W要素,再現一個完整事件,每次推算都可得到正確的結果。正如美國學者哈特利•羅杰斯所說:“在數學和計算機科學中,一個推算(Algorithm)是關於如何解決某個問題的明確規范。推算可以執行計算、數據處理和自動推理任務。”[1]Algorithm依據大量資訊(僅包含少許數字)推斷出事實的存在,僅需數秒或十幾毫秒。美聯社新聞智能程序“墨客”(Wordsmith),每秒能形成2000篇文章,《華盛頓郵報》的新聞程序“吐真者”(Truth Teller)集成一篇新聞僅用半秒左右時間,不僅會寫作,還能核查新聞。

5年前,智能新聞隻能在體育、財經和天氣預報等很少的領域應用,這兩年正在向時政新聞擴展。美國頂尖的算法新聞公司Automatic Insights和Narrative Science聯合開發的新的推算程序,能自動生成市場營銷和時事新聞,並已被越來越多的網站採用。Narrative Science公司創始人克裡斯蒂安•哈蒙德(Kristian Hammond)預測,到2030年將有90%以上的新聞由機器人完成。[2]

第二種所謂算法是向用戶智能分發新聞,多使用英文news on arithmetic表示。打開西方英文網站,常看到這樣的欄題:Arithmetic:Latest News(數據統計:最新消息),Videos of news arithmetic(數據統計的新聞視頻),Videos of arithmetic on news feed(數據統計推送的新聞視頻)等。這些欄題都是指通過數字計算排列出新聞的順序,並向受眾推薦他們需要的新聞,即我們常說的新聞算法分發。Arithmetic是指數學的算法,通過計算閱讀量的大小排列新聞的順序,向受眾推薦。“從古希臘時起,Arithmetic就稱為算術(名詞、形容詞),曾被設想為將事物裝配在一起或計數后排列出先后次序。”[3]

當一款名為Custombot的算法工具誕生后,根據用戶的特定偏好、標准或元素創建個性化新聞推送(feed),迅速風靡各大資訊平台。這種算法採用文本分割和自定義標記,快速過濾用戶不喜歡的信息,算出某個用戶最需要的新聞和文章,產生了新聞的定制報道。一時間,“個性化推薦”成為網絡平台和新聞客戶端追捧的熱點和新寵。“利基市場”“因子量值”“長尾信息”“置信區間”等高大上的概念和詞匯接連出現,讓人感到高深莫測。

上述分析,基本厘清了Algorithm和Arithmetic之間的區別。Algorithm屬於解決難題的推算思路和方法,用於計算機自動化新聞的生成。而Arithmetic是指如何更快、更精確計算一條新聞的閱讀量或讀者偏好,用於向用戶推薦新聞或其他信息。西方英語資訊平台或社交媒體往往把智能新聞(algorithm about news)直接推薦給用戶,這類報道的欄題,通常使用“news feed algorithm”,而不是“news feed arithmetic”。

新聞推薦根據數據計算,推測出用戶可能喜歡的新聞,大體有7種數字推薦方式,這就是:依據用戶的偏好推薦、協同過濾推薦,按照既定的規則推薦、效用推薦和基於內容的推薦、新聞熱度推薦及知識推薦。后4種推薦作為新聞分發的主要指標,打破了新聞推薦的個性局限,能有效防止新聞推薦的失算和風險。

二、新聞算法分發的失算與風險

網上信息浩如煙海、凌亂不堪,用戶無法很快找到他們需要的信息。網媒如果按照新聞發生的重要程度排序,向受眾推薦他們關心的新聞,就能為用戶產生最大的效用。出於這一目的,首先在英美社交媒體上出現了新聞的算法分發(news Arithmetic feed),簡稱新聞推薦(newsfeed)。從本質上看,新聞推薦要解決在適當的時間,把合適的內容推薦給信息需要者,便於用戶閱覽。但實際上,大量資訊平台的新聞算法分發,除制造神秘氣氛外,還強行向用戶推銷不良信息,用戶得到的很多是他們不需要的東西。

資訊平台與社交媒體主要依賴個性化算法向用戶分發新聞,個性化本身就暗藏許多低俗的信息需求,為推銷色情、淫穢和暴力新聞打開缺口。尤其是各類無孔不入的直播平台,總是齊聚於用戶端,淫邪銷魂的視頻不請自來,打頭陣的當然是廣告。從2017年末開始,美國的臉書網就多次收到與垃圾郵件相關帖子的投訴,在同一時間,我國多家社交媒體由於向用戶兜售精神劣品,也引起網民的極度不滿。

無論基於用戶的新聞偏好、行為協同還是基於內容的推薦,如果不掌握用戶的特征和全面數據,就很難給受眾提供實用的東西。許多平台忽略客戶的准確特征和分類,按照自己的意圖漫無邊際地推送有利可圖的信息,根本不考慮信息的社會危害。算法分發新聞,一方面要識別內容需要者的巨大差異,另一方面又要為同一條新聞找到不同用戶,計算技術很難精准、圓滿,信息推送必然屢屢失算。在算法分發新聞誕生地的美國,許多業界人士對算法推薦的破綻就提出了種種批評。班尼迪克•埃文斯(Benedict Evans)指出,“臉書”等社交媒體執行“算法派發新聞”的邏輯,只是個技術術語。用算法找出最想看到新聞的人,以及最想看到什麼樣的新聞,然后將這些內容排序,出現在用戶的新聞訂閱中,這是十分錯綜復雜的。算法分發新聞的邏輯存在兩個問題:一是讓算法的樣本變得“正確”非常困難。用戶的欲望不斷變化,新聞偏好可能經常改變。二是即使完成一次成功的新聞推送,也是基於特定的算法規則,這些規則包含主觀判斷,這些判斷不是靜態的,在原則上都是不完美的。[4]算法分發新聞常常“投錯娘胎”,給用戶推薦一些低質、無聊的信息,大量新聞分發都徒勞無功。

算法一旦經常失算,用戶的信息滿足感就會遭到踐踏,資訊平台的公信力就會喪失殆盡,時間一久將被用戶拋棄。媒體報道新聞要讓受眾了解社會變動,提升受眾的認知,以往的新聞推送還經常把錯誤或虛假信息派發到用戶的移動端,構成報道風險。有關社會政策、社會發展和社會矛盾的重大事件報道,是相當數量的用戶所關心的,僅僅從用戶的個體指標出發計算新聞分發,新聞推送必然埋下潛在的威脅。

算法新聞推薦,促使各大網絡平台和移動客戶端競相吸引眼球,為招攬廣告而龍爭虎斗,社會責任的大堤被一步步蠶食。正如《人民日報》提出的警示:“所謂的算法成為利益的砝碼,一切圍著流量轉,唯點擊量、轉發量馬首是瞻,‘標題黨’泛濫,價值取向跑偏,內容淪為附庸。”“千篇一律的同質化信息,信口雌黃的歪理邪說,形形色色的商業廣告,還有那些活色生香、花邊八卦、流言蜚語,以各種爭奇斗艷的形式粉墨登場,一股腦、無休止地推送過來,讓廣大受眾被迫接受……”[5]網絡媒體的先進技術隻能服務於新聞的傳播力、引導力和媒體的公信力,否則就是荼毒筆墨。當受眾被算法引入迷途,夸大算法推送新聞的出奇制勝,就將網絡研究推向貽害無窮的懸崖。

三、創建新聞算法推薦的科學機制

新聞推薦算法一旦“價值缺失、制造信息繭房、競爭手段無底線”[6],無窮無盡的消極信息就把著迷的用戶搞得暈頭轉向和筋疲力盡。正如許多美國用戶批評“臉書”消磨人們的心智時所說的:“該公司的產品利用人類心理上的脆弱性,將人們吸引到社交媒體上,劫持他們的時間和注意力,正在破壞他們的安寧和幸福。”[7]消除這類流弊,隻能建立一套科學機制,而不是拋棄信息計算技術。如果資訊平台設立信息安全警戒,平穩、適度、科學地運用推薦算法,就能防止新聞推薦的失算和風險。

舊的新聞分發算法,大多基於用戶的使用習慣,預測用戶感興趣的信息和話題。由於計算數據的大體量(用戶數以億萬計),根據點擊率、閱讀時間、評論和轉發量做出的評估和內容標配,不可能完全“對號入座”。當把個性偏好列為推薦的首要標准,黃色媚俗的內容贏得千百萬受眾的點擊,就不足為怪了。

無論美國的“臉書”還是我國的“今日頭條”,已經意識到以往算法推薦的紕漏和失策,正著手改進算法的指標和運作程序。從2018年開始,國內外的資訊平台和移動客戶端都在揚棄舊的算法,開創和完善新的推薦體系。Facebook的CEO馬克•扎克伯格(Mark Zuckerberg)說:“我正在改變我們的產品目標,從幫助你找到相關內容到來幫助你找到更有意義的社會互動。”“我們將讓‘臉書’的20多億用戶在社交網絡上花更少的時間,包括觀看視頻。”[8]我國的“今日頭條”也在嘗試建立算法推薦的科學機制,修正以往僵化的推薦模型參數,把社會責任擺在首位,嚴格防范發出政治錯誤和虛假信息,加強對推薦內容的多次審核。

這種科學機制,首先要把內容的積極意義和知識性列為第一指標,把有關公共利益的重要新聞給予更大流量,把事關全局的重要新聞匹配給所有用戶。社會政策、國內外大事、人民生活狀況、社會各種正能量和重大事故,應成為各大資訊平台推薦的重頭新聞。將其編制為特定的計算標簽分發給廣大用戶,拒絕受閱的用戶是極少數的,關鍵在於文字稿與視頻要制作得有聲有色、准確生動,增強正面新聞的吸引力和感染力。

所有分發內容都要通過風險模型過濾,經過2-3次風險審核后才能進入推薦程序。當出現十多個用戶的批評反饋或負面信息舉報時,網站還須即刻對信息進行復審,如果確認分發了錯誤或不當的信息,應立即直接下架。對信息當事人造成侵權或涉及違法內容的信息,直接責任人將受到應有的處罰,直至接受法律訴訟。這類保証內容安全的健全機制,成為內容配送的嚴格要求。

與新聞內容相匹配,計算新聞的熱度,把熱點新聞作為算法推薦的重要指標,是優化新聞推薦的重要機制。當一則新聞不斷被用戶點擊、閱覽、下載、轉發,有更多的用戶給予正面點評,標志著新聞熱度持續升溫。這樣的新聞具有極高的價值,可向全體用戶推薦。按照新聞類別確定新聞熱度,沿用個性分發的方式向習慣性受眾推薦,比如重要體育新聞要向喜歡體育信息的用戶推薦,重大科學發現和發明的新聞要向科技專業人士推薦,個性化新聞推薦既要堅持內容積極有益的標准,又要滿足受眾差異化的需要。

用戶中總有些人喜歡娛樂和奇聞異趣,對公共事務不感興趣。對這樣的用戶除給他們發送全局性的重要新聞外,還需滿足他們的特定取向,及時給他們分發興味濃厚、幽默雋永而沒有精神危害的軟新聞。但要擬定標簽敏銳和用戶特征鮮明的算法模式,竭力防止低俗暴力、聳人聽聞和荒淫糜爛的信息暗度陳倉。在對正面信息制定加權標志的同時,設置刪除荒誕淫穢、標題黨興風作浪的信息標簽,及時實施有效的干預手段。如果新聞推薦的計算程序具備以上這些嚴密的機制,信息推送的安全性將得到有效保障。

四、傳統媒體的智能化創新

算法新聞不是網絡平台的專利,而是所有傳媒絕處逢生的一場革命,傳統媒體不能置身度外。運用計算機運作程序,把自動化新聞轉化為報刊和廣播電視新聞,雖比網絡慢了半步,但比人工操作要快千百倍。報紙在晚間編排和完成印刷,實際上壓縮了信息發生和傳播的時空,第二天早上讀報,讀者絲毫不會有新聞姍姍來遲之虞。

報紙把新聞寫作完全交給機器,由機器將數據轉換為新聞文本,快速選擇讀者急需知道的新聞,按照重要程度排列出版面順序,構成新聞的整體推送。在算法程序(Algorithmic program)的引領下,保障新聞內容的精准度和可靠性,傳統媒體新聞算法的大體量選擇和高效優勢就凸顯了出來。“自動新聞產生於電腦程序判斷,正在挑戰新聞工作者的職業判斷,因為人的主體性容易犯錯誤。電腦程序判斷與新聞工作者的職業判斷不同,它在本質上是客觀的,它的內容都來自實際和現實,將冰釋人工編寫的主觀成分,比人的自主判斷更有合法性。”[9]

國外廣播電視正在謀劃由機器人主持各類新聞節目,男女機器人擔任新聞主播。它們不僅擁有人工智能的對話系統,而且伴有豐富適度的面部表情,聲音也更加動聽、圓潤。當機器人坐上播音台,會對廣大公眾產生極大的吸引力,擬人化的情感交互將產生卓爾不群的視聽效果。雖然我們並不一味追求機器人主持節目,但當廣播電視台找不到受眾滿意的、理想的播音員和主持人時,天生麗質、足智多謀的機器人播報新聞,將成為首選。

人工智能具有機敏思考、廣攬縱判的思維功能,新聞將伴隨心智的頓悟,隨時打開受眾的心靈窗戶。這一切不能僅僅依賴機器的算法,新聞現場畫面的人工採集,文字稿的編輯把關、加工和潤色,都將有決定的意義。

也就是說,當傳統媒體實現新聞寫作的智能化,原來的記者編輯並沒有如釋重負,他們將承擔更重要的任務。第一,掌握智能新聞的導引技術,每個人都要精通新聞模板的編程方法與技巧,成為熟練運用自動化新聞程序的新聞工作者隊伍中的一員。第二,新聞計算程序對於那些定時定點發生的新聞(比如新聞發布會),不能現場採訪,隻能由記者人工完成。他們每天帶上“微型傳感器”(sensor)到處抓拍突發事件和各種要聞的現場畫面。記者攜帶智能視聽工具和穿戴式搜索器,“對周圍環境的監測極其靈敏,加上與衛星傳感器和定位裝置的信息交互,對全球各地發生的事件盡收無余”[10],及時給編輯部傳來最新的事件動態。第三,編輯不再是單純的文字與圖像的一般處理者,而是自動新聞文本的把關人和修補者,他們以職業的洞察力和核心價值觀,選好每一篇新聞,維護具有強大凝聚力和引領力的社會主義意識形態。在文字上,編輯們把自動生成的新聞文本錘煉得精妙入神、呼之欲出,新聞的思想性和意境遠遠超出網絡信息的粗俗。閱讀這樣的報紙是名副其實的精神享受,也是一種文化滋補,它的社會效益和經濟效益都將史無前例。

參考文獻:

[1]Rogers,Jr,Hartley (1987).Theory of Recursive Functions and Effective Computability. The MIT Press.57.

[2]Home Davinci Institute,”Robots are writing more news than you think”,ww.impactlab.net/2014/04/17/.

[3]J.Fauvel and J.Gray,“The History of Mathematics:A Reader”,The Open University,1987.

[4]Benedict Evans,“The death of the newsfeed”,Twitter,April 02,2018.

[5]宣言.不能讓算法決定內容[N].人民日報,2017-10-05.

[6]宣言.不能讓算法決定內容[N].人民日報,2017-10-05.

[7]Jessica Guynn,“Facebook's making a big change to your news feed”,USA TODAY,January 10,2018.

[8]Jessica Guynn,“Facebook's making a big change to your news feed”,USA TODAY,January 10,2018.

[9]M.Carlson,”Automating judgment Algorithmic judgment,news knowledge,and journalistic professionalism”,New Media & Society,(4)2017.

[10]劉建明.對智能新聞若干問題的釋疑[J].新聞愛好者,2017(11).

(作者為清華大學新聞與傳播學院教授)

(責編:趙光霞、宋心蕊)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部