人民網
人民網>>傳媒

徐一龍:算法不制造信息繭房,而是探索興趣

2019年11月20日08:09 | 來源:光明網
小字號
原標題:徐一龍:把今日頭條等同於算法推薦,是四五年前的認知了

  文/今日頭條副總編輯 徐一龍

  一、頭條=算法 熱點 關注 搜索

  很少人知道,現在互聯網尋人非常高效的系統——頭條尋人,最初就是今日頭條一個日常彈窗運營動作。

  今日頭條的彈窗,有部分內容是針對本地用戶,給本地用戶彈窗本地資訊。2015年中旬,今日頭條嘗試將尋人啟事也做本地推送——只是這個本地更精准,取走失者周邊幾公裡。

  最初,我們預期用這個方法幫助尋找走失的兒童,沒想到兒童走失的案例非常少,而且即便推送出去的,也沒有一例成功。到2016年春節,就在我們猶豫要不要放棄的時候,我們意外發現,偶爾我們推送的一條尋找走失老人的信息,居然成功了。

  我記得,這是2016年大年初二的事情。后一鳴知道了這事兒,他說,這事有價值,當成一個長期項目做吧。

  后來的事情很多人都知道了。一個公益項目,從2016年大年初二整裝出發了。頭條尋人,基於LBS技術,從尋找走失老人開始,逐步擴充到精神病患者走失、尋找緊急住院無名患者家屬、尋找台海老兵遺屬、尋找烈士遺屬,三年過去,已經找到幫助超過1萬個離散家庭破鏡重圓。

  我講這件往事是想說,把頭條等同於算法,至少是四五年前的偏見了。寫這篇文章,就是想從傳統媒體人的角度,談談今日頭條在7年時間裡,是如何搭建一個包括“算法熱點 關注 搜索”在內的通用信息平台的。

  2015年1月,我履職今日頭條副總編輯,參與內容運營的工作。在此之前,我在傳統媒體工作了15年。來今日頭條前,我不但不了解“算法”,對“推薦”這個詞也很陌生——傳統媒體,是很少使用“推薦”這個話術來描述業務的。

  為什麼?我的理解是,“算法”、“推薦”的業務場景都是處理海量資訊。我曾經在電視台、報社、雜志社工作,生產的內容其實都很有限,一份報紙最多也就千余條新聞,媒體界用“頭條”、“頭版”、“封面”,就可以解決現在資訊APP瞄准的“推薦”問題。而類似今日頭條僅每日新增的內容,就有幾十萬篇文章,如果沒有“推薦”,那可是徹底亂套了。

  所以,什麼是“推薦”呢?我的理解是:面對海量內容時,如何幫助用戶高效地選擇、消費內容。

  來今日頭條后,我這個文科生也對“算法”有了粗淺的了解,對更多內容行業觀察者來說,今日頭條甚至普及了“算法”這個概念:通過個性化推薦技術,用戶可以看到自己感興趣的內容,這后來也成為了全球范圍內幾乎所有內容平台的標准配置。但是,今日頭條的推薦策略其實並不只是“算法”。

  2012年8月上線至今,今日頭條歷經了7次大的版本更新,並在這個過程中,演化成一款日活過億的國民級產品。今日頭條的推薦策略,早已不依賴於“算法”,而是一個囊括了“算法熱點 關注 搜索”等多種功能的通用信息平台。

  熱點、關注、搜索……這些功能陸續推出的背后,其實是今日頭條在不斷完善自身的推薦策略。在我印象裡,有三個比較重要的節點。

  第一次,是2015年要聞區的設立。2015年1月,頭條的推薦頻道,已經有了要聞區,但是這個要聞走的是“加權推薦”的策略,不保証每個用戶都能看到。當時我剛加入公司,基於傳統媒體人對重大新聞的判斷,我提出了入職后的第一個產品需求:“重大新聞應該讓每個用戶都看到”。靠算法起家的產品經理和工程師們,也認為這個需求很合理。因為他們也發現,每當發生重大新聞,頭條的DAU就會提升,算法可以讓用戶看到自己喜愛的內容,而重大新聞則有“穿透性”,如熱刀插黃油般,可以輕易穿透個性化——即便不關注科技的用戶,也會關注孟晚舟女士在加拿大的遭遇。現在,“要聞”的演進更成熟了,仔細觀察下現在的頭條首頁,會發現整個頁面可以分為四個區域,第一塊是搜索區,第二塊是頻道區,可以看到各種垂類信息,第三塊是要聞區,權威媒體的重要新聞,第四塊是個性化區,用戶可能感興趣的內容。我們希望能夠通過這樣的改進,同時滿足用戶對於個性化資訊和了解新聞熱點的需求。

  第二次是2017年微頭條和問答產品的推出。我們通過這兩種全新的內容體裁,探索智能社交,包括:上線問答頻道並推出獨立產品“悟空問答”,一個為所有人服務的問答社區﹔上線“微頭條”,讓所有頭條用戶,特別是普通人通過發布短內容,與人互動、建立關系。這是頭條從算法分發走向社交分發的初步嘗試,我們希望用戶在頭條內能建立起有效的社交關系。與此同時,內容可以通過“關注”的形式來分發,而不是僅僅依賴於算法。所以我們在產品上也做了改變,今日頭條客戶端第一欄(最左邊)就是關注頻道,用戶可以在這裡實時查看自己關注用戶的動態。此外,用戶在刷推薦頻道時,也能夠隨機刷到自己關注的親戚朋友或名人明星的動態。因為工作的關系,我在頭條上關注了很多名人、作者和朋友。我會發現,“關注頻道”對我吸引力越來越大了,甚至能媲美“推薦頻道”,這就是關注分發的魅力。

  第三次是2019年頭條搜索的推出。最近,我們推出了全網搜索的功能。這是今日頭條“信息創造價值”理念的延伸。用戶可以通過今日頭條最上面的搜索框進行搜索,查詢站內外的信息。我本人也一直頻繁使用頭條內的搜索,坦誠說,最初效果並不太好,但最近,它越來越能滿足我搜索的需求了。而熱點運營工作,也延伸到搜索去。每當發生重大新聞,運營人員也會去優化搜索結果頁,讓人們能看到重大新聞最重要、最新的進展。

  二、算法不制造信息繭房,而是探索興趣

  在互聯網時代,人通過上網獲取信息,主要有四種途徑:一是門戶網站,二是搜索引擎,三是社交,四是算法。

  門戶網站的特點是人工編輯篩選,把所有新聞列在首頁,缺點是容量有限,一天頂多更新幾百篇稿件,用戶也不會每條都看。而像今日頭條,內容池是上千萬篇文章,能夠提供的信息量要豐富得多。

  搜索是人主動獲取信息,但要在海量的搜索結果中,逐個仔細篩選出自己想要的,佔用時間比較多。即便搜索結果也不斷被優化,搜索時,“找內容”的過程仍然要佔據大量時間。

  社交等於關注和訂閱,由本人選擇,按自己需求出發。但一個人往往是相信什麼或者喜歡什麼之后,才會選擇關注什麼。比如我家人相信健康養生,就關注健康養生的作者,帶來的問題是難以突破認知。

  有人說算法會造成“信息繭房”。這是對算法最大的誤解。

  “信息繭房”概念,來自於哈佛大學法學院教授凱斯·桑斯坦。他在《信息烏托邦——眾人如何生產知識》一書中指出,在信息傳播中,因公眾自身的信息需求並非全方位的,公眾隻注意自己選擇的東西和使自己愉悅的通訊領域,久而久之,會將自身桎梏於像蠶繭一般的“繭房”中。

  為什麼我說算法不會制造“信息繭房”?

  首先,算法在推薦時,除了用戶現有的個人興趣,還會基於使用環境、內容熱度、其他用戶的興趣,來給用戶推薦信息。這些因素能夠讓推薦內容更加豐富,避免了內容越來越窄。

  其次,算法本身還包括興趣探索。

  一般人對算法的認識:喜歡什麼,就推什麼。可人生是漫長的,人的興趣不但是各種各樣的,也不斷變化的。比如,我是英超球隊阿森納的鐵杆球迷,可最近幾年阿森納每況愈下,實在心生疲憊﹔在體育內容上,最近一年我就更關心乒乓球,尤其是“日本選手張本智和和伊藤美誠多大程度上可以挑戰中國乒乓球運動員”,就比“阿森納能不能排名英超前四”更讓我關注了。

  算法如何做這樣的興趣探索呢?尋找這個問題的答案,也是我來今日頭條后,想要探索的一個“新興趣”。

  在向公司的技術大拿同事求教后,我了解到,算法最有效的能力,是識別出你最感興趣的內容和最不感興趣的內容。在二者之間,還存在一大塊“你可能感興趣的內容”,這些內容絕對不會被工程師和產品經理們放棄。事實上,每個人的成長也是不斷地將“可能感興趣的事情”,固化為“確定感興趣的事情”和“確定不感興趣的事情”的過程。

  對於算法如何識別人們“最不感興趣的內容”,算法推薦裡專門有個名詞叫“協同過濾”,英文術語叫collaborative filtering。“過濾”是“推薦”的反義詞,也是“同一個事情的兩個方面”。算法有很強的能力,過濾掉那些你明顯不感興趣,跟你一點關系都沒有的東西。比如我根本不關注美妝、口紅方面的內容,算法沒必要推薦這些內容給我。

  那麼算法如何去探索那些人們“可能感興趣的內容”呢?

  用戶興趣泛化和窄化,其實是推薦系統中的經典問題,學界和業界一直很重視。這個問題叫EE(Exploitation Exploration):Exploitation是利用,通過已知的比較確定的用戶興趣,推薦相關的內容。Exploratio是探索,除了推薦給用戶已知的感興趣的內容,還需要不斷探索用戶的其他興趣,避免推薦結果一成不變。

  算法追求的是,盡可能地滿足用戶獲取有價值信息的需求,並且讓用戶獲取信息的價值最大化。

  我們的工程師大拿說,興趣探索在短期內會減損用戶使用時長,因為用戶會在信息流裡刷到不那麼感興趣的內容,覺得信息流很亂。但是如果不做興趣探索,短期內可以提升點擊率,但這個提升效果會迅速衰減,因此從長期看收益是負向的。

  所以,興趣探索並非算法的“錦上添花”,而是“必不可少”。

  這下你可以理解,“算法就是喜歡什麼就推什麼”是一個多麼“天真”的誤解了吧。

  三、人是萬物的尺度,也是算法的尺度

  當然,任何事物都不是完美的,算法也有一定的局限性。所以,需要一些其他手段,來幫助信息更好地流動。

  在今日頭條,我們在內容運營方面,主要做兩個事情:一是幫助頭條獲取更多優質來源﹔二是確保優質內容在頭條上獲得合理的閱讀比例。

  算法再精准,興趣探索再成功,如果內容池的內容不夠優質、豐富,那推薦做得再好,也不會讓用戶感受好。所以,從一開始,我們就非常重視優質內容。2015年,頭條率先推出“千人萬元計劃”,對1000個優質作者,給予每個月1萬元的保底補貼。今年又推出了“創作者收益計劃”,希望幫助1萬位創作者月薪過萬,讓優質創作者獲得更多收益。

  公平並非一視同仁,一篇公司調查和一篇娛樂八卦,前者付出的心血多,而流量往往低於娛樂內容,而平台這時候,就該勇於去“拉偏架”。“拉偏架”不但體現在資金扶持,也體現在流量扶持上。

  有些優質內容,它們不一定能引起所有用戶的興趣,也不能單純從用戶行為習慣來判斷,無法被推薦系統直接有效地衡量。這個時候就需要人介入。

  一方面,我們調整機器推薦權重,比如給優質來源的優質內容更多推薦權重﹔另一方面,我們優化產品機制,提供雙標題、雙封面,幫助創作者提升推薦效果。此外,我們還投入專門的人力,想辦法幫助優質內容獲得更好的分發和閱讀體驗。我們專門有一個團隊就叫“作者體驗”。

  舉個例子。2017年10月,今日頭條和《三聯生活周刊》達成戰略合作后,我們為《三聯》量身打造了封面專題的分發方式。封面專題是《三聯》的特色,一個專題往往由四到六篇文章組成。在手機信息流中,專題的閱讀效果其實不如單篇文章,但是,如果這些文章被拆開、打散,作為一個專題的閱讀價值就會降低。后來,我們想辦法讓《三聯》專題在頭條信息流裡,同時擁有兩種分發方式,既可以被單條推薦,也可以以專題的方式被推薦。用戶把每個專題收藏起來,就可以看三聯周刊的所有封面報道。最新一期的封面報道《老友記》最近上線了,在今日頭條內搜索“三聯生活周刊”就能找到。

  我入職今日頭條后,經常有媒體圈的老朋友問我:一龍,你在頭條干什麼啊?頭條不是都靠算法嗎?

  看,這兩個問題,本身就是矛盾的。如果頭條都靠算法,那我在頭條真的沒事可做了。而事實是,我在頭條挺忙﹔頭條除了算法,還有很多人。

  我們始終相信人對於優質來源和優質內容的鑒別力。人的判斷不同於機器,但同樣值得被重視。技術更快,面對海量的信息,分發效率尤其重要﹔但人更准,特別是進入模棱兩可的地帶,人的同理心和想象力能夠發揮重要作用。

  無論是人還是技術,其實都只是一種手段,都是希望最優質的信息,能又好又快地觸達到需要的用戶手裡,讓人找到信息,讓信息找到人,消除用戶“早知道就好了”的遺憾。

  不久前,有同事發給我一個腦科學專家的言論。大意是說,要打敗推薦算法,需要兩個因素:1. 你需要有追求高品質內容的需求。2. 你需要隨機取樣人類各個領域的知識。

  其實,算法追求的,和這位專家追求的,一點也不沖突。因為,說到底,算法的目標是由人設定的,算法的內核,和優質內容、多樣性並不對立。這也是今日頭條一直以來努力的方向。

  而這位專家所需要的“因素”,在作為通用信息平台上的今日頭條上都有。

  如果隻有算法,絕不會有頭條尋人﹔如果隻有算法,今日頭條也不會長期保持成長。

  “讓上帝的歸上帝,凱撒的歸凱撒。”人類其實沒必要打敗算法。一定要和算法分個勝負,大概是人的虛榮心和傲慢在作祟。比如在圍棋領域,我們沒有必要一定要追求打敗阿法爾狗。

  算法在效率方面確實勝過人,而人的同理心和想象力高於算法。我們應該做的是,和算法相互學習,做好分工。畢竟,參差多態,乃幸福之源。(李經)

(責編:馮粒、曹昆)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部