如何利用詞頻寫好解讀類文章

快速、准確地統計出詞頻數據是解讀類文章的基礎,要想事半功倍必須熟練掌握統計工具。
簡單堆砌詞頻數據很難吸引讀者,第一步要篩選出最能支持觀點的數據,第二步要對所選數據進行合理分析。
將數據可視化更利於讀者閱讀和記憶,數據和可視化編輯是相輔相成、缺一不可的。
詞頻解讀類文章是典型的技術加內容雙輪驅動的作品。解讀依然是重點,而數據是不可或缺的觀點支持。
近幾年,以詞頻為主線的解讀類文章不斷涌現,其新穎、易讀的形式深受讀者喜愛。再通過可視化處理和新媒體的傳播,可以輕鬆收獲可觀的閱讀量和轉發量,因此也成為全媒體記者寫作時的標配。
此種寫法多見於對政策、報告的解讀,如《十個關鍵詞解讀2016年政府工作報告:改革與創新是高頻詞》《2017政府工作報告高頻詞出爐:改革最多》《31地政府工作報告:“創新”成高頻詞 提及1322次》,等等。這些文章一般在會議結束、報告發布后的半小時內快速推出,在第一時間對幾萬字的內容進行關鍵詞梳理,使讀者加深記憶和理解。
這是詞頻效應在起作用。詞頻效應(word frequency effect)在各種文字系統中,都得到了大量証實,它是指人們對高頻詞的識別快於對低頻詞的識別。心理學家福斯特的搜索模式認為,在心理詞典中,詞條的排列順序是從高頻詞到低頻詞,而詞的認知是通過搜索達到的。由於高頻詞比低頻詞較早被搜索,所以高頻詞比低頻詞被認知得更快。心理學家高夫則認為,人們在認知高頻詞時可能隻需通過視覺表征而達到心理詞典的詞條,所以認知高頻詞比認知低頻詞快。
另外,詞頻解讀在生活、娛樂方面也被大量使用,主要是對名人或其作品進行分析,從而提升讀者對關注對象的認知。如文章《我爬了咪蒙的278篇文章做詞頻統計》﹔再如,有人統計過歌手汪峰的117首歌曲中最常用的詞語,如形容詞排名前五的分別是孤獨、自由、迷惘、堅強和絕望,名詞排名前五的是生命、路、夜、天空和孩子,就此分析其作品風格為“在憂郁中呼喚希望”。
這種寫作方法的好處不言而喻,通過詞頻統計將關鍵詞出現的次數進行排序,可以清晰地勾勒出所要解讀內容的重點並加以分析。其表現形式要麼是直接使用詞語出現的次數強調關鍵詞的重要性,要麼是通過次數選出前幾位的關鍵詞並加以深度解讀。前者的代表作有2018年《新京報》的《政府工作報告“改革”一詞出現97次 是歷年最多一次》和2015年《華商報》的《盤點政府工作報告高頻詞:發展提134次改革86次》﹔后者可參見2018年《新京報》的《一圖讀懂政府工作報告 今年政府工作有10大關鍵詞》和2017年《湖北日報》的《政府工作報告關鍵詞:“改革”一馬當先》。
這些文章首先滿足了讀者快閱讀的習慣,現代讀者需要更為便捷、快速地了解所讀內容的重點,通過軟件排出的詞頻能在極短的時間內進行發布,滿足讀者需求﹔其次,在面對信息量較大的政策、報告或是多篇文章時,詞頻統計可以很好地加深讀者的印象﹔再次,作為解讀的一種方式可以和其他信息相互補充,形成立體的信息傳播格局。
筆者曾對全國婦聯常委擴大會議上的講話進行詞頻分析與解讀。此次會議召開的時間節點放在中辦印發《全國婦聯改革方案》一周年之際,其總結經驗、謀劃未來、督查問效、狠抓落實之意非常明顯,重要性不言而喻。
一萬多字的講話通過詞頻排序,前十位的詞語分別是:改革175次、婦女95次、工作79次、組織71次、基層58次、群眾55次、網絡新媒體48次、推進37次、服務28次、建設21次。它們全面地表現了落實並推動《全國婦聯改革方案》的經驗與思考。
此文在會議結束10分鐘后用《中國婦女報》公眾號和長微博推送給與會人員、婦聯干部和廣大婦女群眾,在及時、精准的同時,創新的形式更縮短了傳統會議新聞給讀者造成的距離感。此文發出后不但得到了讀者廣泛認可,更獲得了同行的青睞與關注,400多個公眾號、80多家網絡媒體予以轉載轉發,使一篇工作新聞得到了很好的推廣,讓更多人了解了全國婦聯的工作與努力,形成了良好的輿論氛圍。
可以看出,不管是統計方法還是發布速度,在沒有新技術支持的條件下都很難做出精准的解讀、分析和傳播,這就給記者提出更全面的要求。那麼需要掌握什麼技能才能寫好詞頻解讀類文章呢?
筆者認為,盡管詞頻解讀所用的數據僅是單一維度,但寫作過程也分為數據的收集(挖掘)、數據的分析整理、可視化的呈現三步,完全符合數據新聞的制作流程,因此需要具體注意以下3點:
熟悉詞頻統計工具。快速、准確地統計出詞頻數據是此類文章的基礎,要想事半功倍必須熟練掌握統計工具。現在可以利用的工具有三大類,第一類是傳統辦公軟件,如微軟Office系列的word、excel和WPS Office中的WPS文字、WPS表格都能完成詞頻統計,缺點是必須熟練使用軟件中的功能和函數。第二類是專業詞頻統計軟件,如AntConc、詞頻等,盡管它們比較專業,但水平參差不齊。第三類是在線平台,如清博大數據、圖悅等,相對以上兩類,在線平台具有操作簡便、升級快、生產的產品種類較多(可生成詞雲和數據圖)等優點。因此,初學者使用在線平台是不錯的選擇。
數據解讀才是重點。盡管詞頻數據可以更為直觀地証明作者觀點,但是簡單的堆砌很難吸引讀者,因此第一步要篩選數據,即選出最能支持觀點的數據﹔第二步要對所選數據進行合理分析,以起到解讀作用。筆者認為,詞頻解讀以使用詞頻的數據作為基礎進行客觀分析,從而使讀者加深印象並得到幫助,這就要求作者對所分析的數據和內容非常熟悉,也就是我們常說的內容為王。
學會可視化編輯手段。可視化也可稱之為圖形化,將數據可視化更利於讀者閱讀和記憶。詞頻的表現有詞雲、柱狀圖、餅狀圖、曲線圖等基本形式,也可制作成表格。這些手段都是為了讀者更加易讀、文章更容易傳播。數據和可視化編輯是相輔相成、缺一不可的。前面說到的統計工具都可以完成圖形的制作,初學者可直接使用。
綜上所述,詞頻解讀類文章是典型的技術加內容雙輪驅動的作品。解讀依然是重點,而數據是不可或缺的觀點支持。
(作者單位:中國婦女報社)
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注