人民網
人民網>>傳媒>>傳媒期刊秀:《新聞愛好者》>>2019年第5期

智能時代算法型內容分發的問題與對策

靖鳴 管舒婷
2019年05月24日16:09 |
小字號

來源:《新聞愛好者》2019年第5期

【摘要】人工智能的開發讓算法推薦強勢崛起成為當下最流行的內容分發方式。在給傳播領域帶來革命性改變的同時,算法背后存在的隱患也逐漸凸顯。文章從問題角度出發,分析算法型內容分發所導致的信息繭房、假新聞泛濫、算法偏見、把關權力遷移等現象。這些問題將導致受眾孤獨倍增和新的“知識鴻溝”出現的風險。針對算法型分發存在的問題,在優化算法內容分發模式的同時建立網絡世界人行道,展望互聯網向智聯網發展的未來走向,以期算法推薦在內容分發2.0時代更好地服務人類。

【關鍵詞】算法﹔內容分發﹔問題﹔今日頭條

數據顯示,截至2018年底,中國移動互聯網活躍用戶規模高達11.3億人。[1]對於通信行業來講,內容分發指的是採用智能分析法對用戶訪問互聯網留下的痕跡以及其所佔用的網絡流量進行分析,按照服務運營商定義的內容分發策略,將節點的流媒體資源數據庫中指定的內容推送到下一級節點的過程。現階段,算法推薦系統可劃分為三個不同的種類:第一是協同過濾推薦﹔第二是以內容為核心的推薦﹔第三是關聯規則推薦。在西方國家,利用算法分發信息並非出奇制勝的媒體新秀,個性化分發實際存在很多信息風險。如何利用人工智能更新算法分發並制定科學的機制以保証分發安全,在滿足受眾差異化需求的同時構建穩定的網絡環境是現今最急需解決的課題。

一、變遷:三種基本內容分發模式

隨著移動互聯網的廣泛普及與智能手機功能的深度開發,信息的內容分發打破了塔奇曼所說的“新聞常規”。傳統人工採編衰落,社交分發、算法分發興盛崛起。在用戶獲得新信息的速度與准度越來越高的基礎上,三種分發模式正朝著並行的方向發展。

(一)以編輯為核心的傳統分發模式

在移動通信設備廣泛應用以前,報紙、電視等傳統媒體是人們對信息的主要獲取渠道。傳統媒體在內容分發階段,主要由專業的記者編輯擔任“把關人”角色,對媒體收集到的信息進行篩選、排版、審核的人工分發方式。

在移動終端上首先誕生的手機報,實際上是報紙的便攜版。其內容排版呈現方式都和傳統媒體類似,延續著人工採編的分發方式,可以算作線下媒體向智能終端的過渡媒介。例如,2004年,《中國婦女日報》“彩信版”作為中國第一份手機報正式發行。隨后,各類新聞資訊APP井噴式誕生並主宰信息源,如以紙質內容為主體,以移動端方式傳遞給用戶的南方周末APP等新聞客戶端和將網站信息遷移至手機屏幕的鳳凰、騰訊等。

在這種以編輯為核心的傳統分發模式下,移動用戶仍然是以被動的受眾身份接收著內含專業編輯記者傾向看似多樣且全面、實際卻“千人一面”的信息。

(二)以社交為核心的人際網絡分發模式

目前,主流社交媒體已成為人們獲取信息的核心來源。在以社交為核心的分發機制下,無論是微博還是“朋友圈”都代表著大眾傳播實現了“千人千面”的顛覆性改變:一是移動用戶不再麻木地被動接受,而是通過自己的社交結構主動擁有了無法復制的信息﹔二是在這種模式下,根據用戶關注的對象與好友所形成的人際關系網絡提供用戶在海量信息中篩選和過濾的功能。目前,用戶通過社交媒體關注某一熱點事件的比例通常超過83%。[2]

但在社交網絡經歷過瘋長並逐漸過載的現狀下,基於社交分發的信息變得單調甚至劣質。在微信朋友圈裡,微商、養生鏈接、炫富等垃圾信息的數量與日俱增﹔大V和營銷類賬號的流量佔據了微博總流量的一半以上,相關調查顯示:超過九成的微博信息都是“大V”賬號發布的,而其賬號數量隻佔總數的3%。[3]

(三)以算法為核心的智能分發模式

“算法”的概念來源於計算機領域。它是指解決問題的一系列明確指示,是系統地描述問題解決的戰略機制。2012年,“今日頭條”率先使用算法進行內容分發。隨著人工智能的深入發展,這種智能分配模式已成為主流移動媒體轉型的新選擇。

就拿“今日頭條”來講,其算法內容分發的方式主要依靠如下幾個方面:一是畫像。根據用戶提供的個人信息包括區域、職業、年齡等進行粗略標簽。之后,通過用戶每一次的搜索,記錄瀏覽的信息類別、閱讀頻次、文章主題、內容熱度、來源等進一步刻畫使用者的興趣取向。二是場景。彭蘭認為:從其本質來講,移動通信是建立在場景服務基礎之上的,對場景進行感知,以及對信息進行適應。[4]通俗地說,“算法”分析會感知出用戶使用今日頭條時所處的網絡狀態。若在移動數據環境下,接收的內容可能多是圖片或者文字。在Wi-Fi環境中,客戶端將刷新出更多視頻或動態圖片。由此,讓適合的場景在恰當的時機出現。三是學習。系統對用戶的使用情況持續追蹤,例如某用戶對推送的內容是忽略了還是閱讀了,閱讀的推送是讀完了還是中途放棄。瀏覽用時較長的內容有什麼關鍵詞,是在什麼時間、什麼地點瀏覽的等。根據這些數據將用戶畫像進行實時調整。四是篩選。通過上述及時反復的“教育與學習”,后台根據平台設定的標准對海量信息的質量、轉載率、原創性等因素進行判斷,再逐層篩選並准確抓取用戶需求的內容。

綜上所述,倘若用戶登錄頭條使用的賬號屬於微博等社交賬號,登錄系統會按照用戶已經上傳保存好的基本信息,在很短的時間內對用戶興趣進行分析,並迅速獲取用戶的畫像(不超過10秒)。之后頭條系統會根據用戶的閱讀行為,對其畫像進行優化,並給出相應的信息推薦。[5]

二、以算法為核心的內容分發模式存在的問題

人民網曾連續三天推出《不能讓算法決定內容》《別被算法困在“信息繭房”》《警惕算法走向創新的反面》三篇文章批評算法推薦模式。[6]指出如果平台僅僅依托於算法的話將會出現如下三種問題:第一是價值觀的嚴重缺失﹔第二是信息繭房﹔第三是競爭手段會經常性地突破底線。這會導致平台遲早被有關部門約談。進入網絡時代以后,算法和人工智能雖然給我們帶來了無限未來,但是其技術仍存在著局限性,因此,我們必須為智能推薦設立一個把關人。

(一)假新聞泛濫

國內移動媒體發布的虛假信息主要集中在醫療領域(減肥、保健等)、金融領域(股市下跌、房地產市場等)、虛假社會信息、虛假娛樂報道等。2018年,中央電視台《經濟半小時》節目曝光了“今日頭條”在二三線城市推送虛假廣告,當記者抵達廣西機場時,“今日頭條”頭版廣告就精准地變化為“補氣血”。

因為平台編輯沒有對內容進行很好的把關,同時后置了內容審查環節,造成平台系統將不同價值觀的內容向不一樣的用戶群體分發。當平台系統任由獵奇、低俗等人性本能需求進行個性推薦時,其價值觀和質量將會無法得到有效保障,在價值導向和質量上就難以保証。

無獨有偶,2019年1月,獨立研究機構PlainSite發布了一份報告指出,Facebook可能有50%的僵尸用戶。“虛假賬戶可以隨機點擊廣告,或自主按下‘喜歡’網頁的按鍵,以擺脫反欺詐算法。如果不去仔細追蹤虛假賬戶的操作模式,它們看上去就像是真的。這類活動雖然欺騙了廣告商,卻給Facebook帶來了收入,虛假賬戶通常通過詐騙、假新聞、敲詐和其他形式的欺騙來欺騙Facebook上的其他用戶。”在2016年美國總統大選中,Facebook被指疏於監管,讓大量假新聞、假數據在平台上傳播,誤導了美國選民。[7]

(二)把關權力遷移

無論是國外的Facebook、Google,還是國內的“今日頭條”“一點資訊”,都把自己定位成科技公司而非新聞媒體。從本質上看,智能算法是這些科技公司為了吸引更多的用戶群體,最大限度延長他們對公司產品的使用時間,從而獲取經濟效益而提出的。陳昌鳳等認為,信息的“把關權”被算法所掌控,但算法的事實核查能力、信息質量的辨別力的發展還遠達不到足以處理信息內容真偽和價值判斷的程度。[8]平台利用算法會對“眼球”標題及低俗色情信息進行過濾。盡管如此,這些信息帶來的巨大閱讀量,會利誘平台降低把關的“度”,讓打擦邊球的文章都可以通過審核。

隨著信息把關權利的不斷遷移,數字環境中的新聞行業出現了很大的變化。算法平台正在取代大眾媒體成為新聞分發權的新把關者,這導致了新聞把關權的滯后。同時新聞的選擇權也正在由用戶群體向算法平台逐漸轉移。編輯的缺位,很可能導致公共性、突發性、政治性等嚴肅話題難以通過算法審查,最終造成媒體公共內容的缺失而帶來嚴重后果。

(三)信息繭房與過濾泡

2006年,美國哈佛大學法學院教授凱斯·R.桑斯坦在《信息烏托邦——眾人如何生產知識》中,對“信息繭房”這個定義進行了確切闡述,指出:網絡化讓資訊的選擇性變得多種多樣,這或許讓社會看起來更為民主和自由。可因“個人本位”理念的影響,終將對民主帶來巨大的破壞。[9]簡言之,“信息繭房”就是“我們隻聽我們選擇的東西和愉悅我們的東西的通訊(信)領域”。[10]

隸屬於“今日頭條”的抖音,是我國最具影響力的短視頻平台之一。沉迷其中的用戶根據平台推出的音樂素材,觀看並自行制作導致同類型同質化的短視頻井噴式誕生。民眾反復沉迷在如“學貓叫”等抖音神曲裡,被封閉在抖音的圍牆裡,這對民族文化的發展造成了一定的阻礙。

信息繭房形成的最主要原因是,在唯流量主義的媒介環境中信息傳播特點已經發生了轉變,吸引用戶注意力代替以往生產專業新聞成為傳播的重點。從這個意義上而言,用戶接收的網絡新聞內容,都是由互聯網平台上的機器算法用“過濾泡”過濾之后的產物。2011年,以利·巴裡瑟(EliPariser)在其著作《過濾泡:互聯網沒有告訴你的事》中提出了“過濾泡”(filterbubbles)這個概念。他指出,以機器推薦算法為代表的互聯網技術,正在使得用戶獲取的信息日益個人化﹔用戶接收到的信息,往往會受到其檢索歷史、閱讀記錄等的影響,並受到機器算法的操控。[11]“過濾泡”的出現會導致平台出現兩大突出問題:第一,經過“過濾泡”獲得的信息,會受到用戶的價值觀和愛好的影響以及機器算法的操控,從而會導致信息出現一定的偏向使接收信息失衡﹔第二,因為算法自身存在的一些弊端,會造成其向用戶推薦的信息不是他們所需要的。比如,據某個網友透露,其在“今日頭條”瀏覽新聞時,不經意間點開了一個花圈的新聞,導致其以后數天都收到“今日頭條”所推薦的有關喪葬用品的新聞。

(四)算法偏見

2018年,王思聰為慶祝IG電子競技俱樂部拿下德瑪西亞杯冠軍,在微博隨機抽取113位用戶每人發一萬元作為獎勵。但獲獎名單中僅有一名男性獲獎者,而參與抽獎的男女比率為1︰1.2,這引發大批網友質疑算法抽獎的公正性。

“今日頭條”創始人張一鳴一再主張算法沒有價值觀。實際上,“數字系統以清晰的方式和它們根植於其中的文化緊密地融合在一起”。[12]算法新聞的設計是人主導的,其中不可避免地存在著商業競爭、權力壓迫等沖突。《自然》雜志曾用BIBO表示BiasIn,BiasOut(即偏見進,偏見出)。可見,偏見從人類社會移植而來,隱秘地隱藏在算法之中。

皮尤研究中心發布的《算法面前的公眾態度》調查結果顯示,58%的美國成年人認為算法不同程度地帶有人為偏見。[13]亞馬遜公司曾開發一款用於篩選簡歷的算法意外被“培養”出歧視女性應聘者的偏好﹔谷歌旗下的PHOTOAPP將兩名黑人的照片標記為大猩猩﹔微軟聊天機器人Tay上線幾個小時就被美國青少年“教”成滿口暴力語言,集種族歧視、性別歧視等於一身的“壞小孩”。[14]大數據是現實的一面“照妖鏡”,它將人類社會中不易察覺又影響深遠的歧視,映射到算法所控制下的所有領域。

三、算法分發模式可能引發的風險

(一)精准推送導致個性化孤獨倍增

對於平台運營商來說,用戶的使用時長是判定用戶黏性的標准之一。但從受眾角度來看,人們在移動媒體上停留的時間越長,意味著他們越容易沉浸在自我的話語場中,脫離整個社會的發展,導致共同體關系的維系出現問題,使用戶以個體為單位陷入更加嚴重的孤獨之中。

《經濟學人》曾刊發文章表示,今日頭條的1.2億用戶平均每天使用此APP約74分鐘,超過包括Facebook和微信在內的大多數國內外大型社交平台。[15]在傳統的信息整合、分發模式下,人們曾對電視著迷,整天沉浸在與電視相對的狹小空間裡,與現實社會的人際互動保持一定的距離,並由此形成了孤獨、自閉的性格,日本學者中野收將這種人稱作“容器人”。

如今,隨著人工智能化的分發模式的普及,人們的內心需求更容易被識別。受眾仿佛掉入了更大更堅固的容器中,無須主動集群即可獲得精准的信息服務。此外,當碎片般的個性化推送無孔不入地侵入到生活中時,人們耗費在依附網絡的弱人脈上的時間正越來越長,面對面的人際傳播勢必將減少。這樣,現代人的孤獨感勢必會增加。

(二)信息過度“壁龕化”導致新“知溝”出現

壁龕在現代裝修中指的是在牆壁上開辟的儲物小空間。經濟學教授菲利普·科特勒根據壁龕(壁龕的英文為“Niche”,也就是“利基”)的特點,在《營銷管理》中對其進行了經濟學上的闡述,即“利基是更窄地確定某些群體,這是一個小市場並且它的需要沒有被服務好”[16]。一個個“壁龕”,將看似公平的互聯網中所暗藏的階級劃分得更加明晰。

一方面,人類主動地被差異化興趣取向所分類。基於用戶的興趣點不斷推送相關內容,依靠強大的學習功能,相似的信息不斷出現。長此以往,媒介素養不足的用戶被低俗趣味的內容所捆綁,推入束之高閣的“壁龕”而導致視野被局限,從而失去與高媒介素養用戶交流的機會,形成新“知溝”。

另一方面,部分用戶通過付費緩和信息選擇的焦慮,人類被動地被收入水平的差距所割裂。例如,同樣在喜馬拉雅APP中收聽音頻,如果付費收聽過一次優質內容后,算法會不斷推送出小眾的精品音頻。這些精品內容可能需要無法支付的用戶花費百倍精力,通過不停地搜索才能獲得。《紐約時報》關於“新貧富數字鴻溝”的調查顯示,高收入家庭的青少年大約花費5個多小時在網絡上學習而收入相對較低家庭的孩子則需要花更多的時間尋找好的網絡資源。[17]

四、內容分發2.0時代的優化策略

(一)改進以算法為核心的分發模式

2018年1月,“今日頭條”、鳳凰新聞客戶端等均因傳播色情低俗信息被國家互聯網信息辦公室約談,關停整治部分頻道,“今日頭條”旗下的內涵段子客戶端甚至在4月被國家廣電總局勒令永久關停,傳統的“算法+數據”存在的漏洞已經清晰可見。[18]專業的媒體意識到“過濾泡”“信息繭房”的存在並通過技術手段,發起“戳泡”運動,嘗試在分發中幫助受眾擺脫思維定式的桎梏,開放包容地傾聽全方位的聲音。

例如,美國BuzzFeed對“Outside Your Bubble”功能進行推出,那就是在一部分流傳范圍非常廣的新聞底部,加上一些平台的評論,比如Twitter、Facebook等等。瑞士報紙NZZ開發了一款名為theCompanion的APP。這款APP通過機器學習生推送個性化信息,與眾不同的是,算法能夠保障在每一次給讀者所推薦的信息中,至少有一條信息不是讀者原本感興趣的領域。谷歌推出了“逃離泡沫”插件。該插件能夠通過對用戶的閱讀喜好進行分析,將一些積極、容易被用戶接納的信息向用戶進行反向推薦。用戶每次訪問Facebook時,插件會將不同視角的文章自動導入用戶的信息流。[19]

此外,百度推出了“搜索+推薦”雙引擎的新型內容分發模式,實現了從“人找信息”到“信息找人”的內容領域升級。通過“搜索+推薦”的雙引擎模式,讓用戶更高效地獲取信息,其內容分發的核心是基於用戶的主動搜索,在對用戶的搜索內容和行為進行全面分析以后,實現二者的雙向互補循環,從而對一個能夠和用戶生活場景完全融為一體的“不搜即得”場景進行創建。該模式能夠不斷地為傳統算法的精准分發提供有效保障,同時還能夠通過對用戶的搜索行為進行分析,從而獲取其不為人所知的愛好。同時,該模式不但可以對“信息繭房”這個突出問題進行有效處理,同時還能夠在感官上給用戶帶來很好的體驗效果。

(二)建立網絡世界“人行道”與智聯網

在《數字化生存》一書中,尼古拉·尼葛洛龐帝明確提出用戶不僅需要擁有極端個性化的“我的日報”,同時還對具有公共性特征的“我們的日報”也是非常急需的。[20]信息繭房並不是算法時代獨有的產物,信息繭房存在的根源是“選擇性心理”,而“協同過濾算法”則加劇了信息繭房效應。桑斯坦在《信息烏托邦》的開篇對網絡中的過濾機制是美夢還是夢魘進行了追問,他認為網絡傳播的“回音室”局限同樣會產生群體極化與群體盲思問題。所以,桑斯坦指出,為了避免信息繭房的影響,必須創建網絡世界的“人行道”。就和人們在逛街時不知道自己會碰見什麼人、不在計劃內的事情,不同的人群因此有新鮮的體驗和言行互動。在用戶無法想象的地方,為他們分發各種不在計劃內的信息,能夠讓社會上不同層次的人都可以對各種領域的信息有所接觸,從而擺脫“信息繭房”的束縛。

“智聯網”這個定義是馬化騰2018年在騰訊的“雲”未來峰會上提出的。智聯網是互聯網在將來的主要發展趨勢,其指的是在智能環境中,任何事物都是可以相互聯系的,其是建立在互聯網、物聯網等技術基礎之上的,其核心系統是知識自動化系統,主要職能就是對知識進行獲取、表述、關聯,從而讓各個智能實體在語義層次上進行聯結、讓它們的知識實現相互聯通。當全平台的信息共享成為現實之時,“信息繭房”問題也將迎刃而解。

五、結語

學界關於算法型內容分發的研究主要集中在技術原理與優勢價值上。本文在算法分發熱潮之下,提出其現存的具體問題與風險,以期對運用算法的移動平台敲響警鐘。后信息時代的根本特征就是真正的個人化。不可否認,現存的算法是實現個人化的階段性產物,它的確為人類社會邁進智能時代做出了貢獻。為促進人工智能時代算法推薦的優化,防止負面效應的激化,廣大網民應消除信息繭房的影響,提升自身的媒介及網絡素養。與此同時,各大平台隻有從現存風險中找尋突破口,發展信息平衡與糾偏技術,對用戶進行校正性推送或反向推送,才能在智能技術的潮流中勝出。

參考文獻:

[1]QuestMobile.中國移動互聯網2018年度報告[R].2019.

[2]智研咨詢.2016—2022年中國大數據行業深度分析及投資戰略咨詢報告[R].2016.

[3]喻國明,韓婷.算法型信息分發:技術原理、機制創新與未來發展﹝J﹞.新聞愛好者,2018(4).

[4]彭蘭.場景:移動時代媒體的新要素﹝J﹞.新聞愛好者,2015(3).

[5]劉曉潔.新聞聚合類平台內容分發方式的優勢與不足﹝J﹞.新聞戰線,2018(17).

[6]觀察者.人民網三評今日頭條媒體:不要拿對媒體的標准要求地攤雜志[EB/OL].https://www.guancha.cn/society/2017_09_21_428110.shtml,2017.

[7]華爾街見聞.繼續水逆:報道稱50%的用戶是僵尸Facebook股價應聲下挫[EB/OL].https://baijiahao.baidu.com/s?id=1623603093213869

419&wfr=spider&for=pc,2019.

[8]陳昌鳳,霍婕.權力遷移與人本精神:算法式新聞分發的技術倫理﹝J﹞.新聞與寫作,2018(1).

[9]胡婉婷.“信息繭房”對網絡公共領域建構的破壞﹝J﹞.青年記者.2016(15).

[10]凱斯·R.桑斯坦.信息烏托邦:眾人如何生產知識[M].畢競悅,譯.北京:法律出版社,2008.

[11]Eli Pariser.The Filter Bubble:What the Internet Is Hiding from You[M].Penguin,2011

[12]托馬斯·克倫普.數字人類學[M].鄭元者,譯.北京:中央編譯出版社,2007.

[13]全媒派.算法真的沒有價值觀?皮尤調查發現依然憂慮偏見與隱私問題[EB/OL].https://baijiahao.baidu.com/s?id=16183363114263900

72&wfr=spider&for=pc,2018.

[14]羅錦霖.算法歧視·大數據折射人類社會偏見與陰暗[EB/OL].http://www.woshipm.com/it/1649545.html,2018.

[15]中國網.今日頭條用戶平均使用時長超過Facebook和微信[EB/OL].http://it.people.com.cn/n1/2017/1121/c1009-29660004.html,2017.

[16]科特勒,凱勒.營銷管理﹝M﹞.王永貴,譯.北京:中國人民大學出版社,2012.

[17]全媒派.新貧富數字鴻溝:你沉迷手機時,金字塔尖父母早已讓孩子遠離屏幕[EB/OL].https://edu.qq.com/a/20181115/003303.htm,2018.

[18]北京日報.今日頭條、鳳凰新聞手機客戶端被約談[EB/OL].http://news.ifeng.com/a/20171230/54663165_0.shtml,2017.

[19]全媒派.圍觀良心外網的“戳泡運動”[EB/OL].https://news.qq.com/original/dujiabianyi/paopao.html,2017.

[20]尼古拉·尼葛洛龐帝.數字化生存﹝M﹞.胡泳,范海燕,譯.北京:電子工業出版社,2017.

(靖鳴為浙江越秀外國語網絡傳播學院特聘教授,南京師范大學新聞與傳播學院教授,博士生導師﹔管舒婷為南京師范大學新聞與傳播學院碩士生)

(責編:趙光霞、宋心蕊)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部