人民网
人民网>>传媒>>人民网奖学金>>哈尔滨工业大学>>哈工大2017

网络背景下新闻传播效果评估模型研究【2】

何功璞
2018年02月11日16:14 | 来源:人民网研究院
小字号

2.2 指标数据采集及处理

一般来说,主成分累积的方差贡献率大于80%时,就可以将这个主成分保留下来。

2.3 权与综合指数的确定

权可以反应一个指标的重要程度,在确定新闻传播效果评价综合指数中具有重要意义。一般来说,权的取值可以从指标含信息量的多少、区分能力、可信程度、相关性方面来考虑,运用方差、变异系数、负相关系数等数值确定下来。由于在新闻传播效果相关评价指标的数据处理阶段采用主成分分析方法对指标进行降维,那么在确定权重时,可以直接将主成分的方差贡献率代替为各个主成分在综合指数中的权重。随后,通过加权平均公式获得最终的新闻传播效果评价指数:

在运用样本数据得出新闻传播效果综合评价指数的计算方法后,可以通过代入新的新闻指标数据来计算。值得注意的是,随着网络的发展与网民、媒体数量的增多,互联网上的阅读、评论、转发等用户行为数据会爆发式的增长。在时间序列上,需要经常采集新的数据对模型进行调整。在评估一大批新闻的传播效果时,也可以运用数据直接运用以上方法建立新的模型进行综合评价。

3、新闻传播中的数据挖掘方法

除了可以对网络新闻传播效果进行整体的评估外,对于新闻传播中网民的舆论风向与传播层次也可以进行分析。及时把握新闻受众群体的舆论演化趋势,有利于媒体挖掘新闻热点、对新闻跟进报道。对新闻下的评论进行文本挖掘,是发掘新闻传播带来的舆论风向的一个好的方法。构建可视化的新闻传播网络,能够直观的显示新闻传播层次与深度。下面给出针对新闻传播效果评估的文本挖掘和可视化方法。

3.1、评论观点聚类

对新闻评论观点进行文本聚类,可以发现用户的兴趣模式,发掘新闻所带来的关注热点,促进媒体的后续新闻报道。对于新闻评论的文本聚类与一般聚类过程不同。文本聚类首先要通过文本表示模型对非数值的文本进行数值化的表示。首先,需要对新闻评论文本进行预处理。文本预处理是根据表示模型对于文本特征的相关定义进行文本特征的抽取与选择,模型表示是采用表示模型的方法,完成对于文本特征的权值计算。文本特征抽取时可以借用现有的语料库,或者人工提取评论观点文本的关键词。

文本聚类算法是对模型数据采用聚类算法进行相应的处理和计算。由文本聚类的方法,可知文本聚类需要解决的问题有:

(1)选择数据的表示模型,即建立文本特征,将网民的评论文本内容这种半结构或无结构化的表示成为结构化数据,以一定的特征项(如词条或描述)来代表目标文本信息。比如,在涉及到争议性话题时,网民们会有多种观点,新闻传播效果不是单一化的,这种情况下可以对代表不同观点的新闻评论可以进行特征提取。

(2)选择聚类算法,即在将文本内容表示成可分析处理的形式后,选择适合于文本数据特征的聚类算法,对数据进行聚类处理,比如采用层次聚类、K-means聚类等方法

(3)进行聚类结果的评价,即采用一定的评价指标对聚类的结果进行评价和分析。比如,可以发现网民对某一新闻观点的支持或者反对的比例、不同观点人群的分布特征等等。聚类的结果能帮助媒体更好地分析新闻受众特征,进一步引导大众舆论走向[3]。

进行文本聚类分析时,主要有以下步骤:

3.2、评论情绪分析

在文本情感分析中,往往只能得出文本的积极或消极的倾向性。而根据心理学的情绪结构理论表明,人类情感可细分为几类基本情绪或多种复合情绪,如高兴、难过、愤怒、感动等,多类情绪预测能够对于新闻评论这种具有多种主观情绪的文本,粒度更为细致的情绪划分方法更为受用。将新闻评论的文本内容作为信息源,在概率框架下利用监督学习的方法来解决新闻评论多类情绪预测问题,有两种可选择的应用于情绪预测的方法,朴素贝叶斯模型和Logistics回归模型。

目前越来越多的在线新闻网站提供用户情绪投票的功能,用户在阅读新闻之后,不仅可以通过撰写评论,在字里行间隐式地行发自己的情感,还可以直接使用情绪投票功能,点击同自己的情绪相同或相近的候选情绪类别标记,显式地为自己想要表达的情绪投上一票。虽然用户情绪投票和评论中的表达的情绪都是用户阅读新闻后对该新闻事件的情感,只是表达方式不同,那么当数据量足够大的情况下,可认为用户情绪投票中各情绪的分布与用户评论中情绪的分布相同。在线新闻的用户情绪投票统计信息自然而然地可以为该新闻所对应评论的情绪分类起到导向作用[4]。下面给出一种基于朴素贝叶斯模型的情绪分析算法:

对于一个新闻d,用户在阅读该新闻后可对其中的新闻事件发表评论以抒发情绪,也可使用网站提供的用户情绪投票功能,在给定的候选情绪类别标签集合 中选择与自己想要表达的情绪相同或相近的情绪类别标签。

将用户情绪投票功能中的候选情绪类别标签 作为用户评论中可能表达的情绪类别,因此情绪类别标签集合E即该新闻评论情绪分类问题的输出空间。将新闻的用户情绪投票信息作为针对该新闻发表的所有评论的元数据,每个评论c含有与其对应新闻相同的用户情绪投票信息,用 表示,其中 是用户对情绪 的投票分值。假设新闻评论中情绪的分布与用户情绪投票中各情绪的分布相同,给定一个评论c可用情绪 所得票数占总票数的比例,作为该评论c表达情绪 的条件概率,即:

结合新闻评论和情绪投票,便可以预测出新闻评论的情绪分类。根据大量样本进行训练,便可以获得新闻评论与情绪分类之间的关系。在后续阶仅有新闻评论文本时,可以通过对前阶段参与训练的新闻评论文本进行分词处理、词频统计、特征提取等数据挖掘,发掘不同情绪的评论特征。在提取到这些特征以后,运用机器学习方面的技术对单纯的新闻评论进行分类会变得简单。

3.2、新闻传播网络可视化

可视化布局图可以展示新闻传播过程中的关键部分,不同的可视化布局可以让用户感受到不同的信息内涵,能反映出新闻热点传播的不同特点和规律。新闻传播可视化布局图可以以射线图为基础,并加入节点力等动力因素,且为其设置稳定条件,进而形成动态可视化系统,这种可视化布局实际上是力引导布局法和圆形布局法的结合,相对于树形布局等其他布局法,能够更好的呈现新闻传播的规律和结构,便于媒体把握新闻传播趋势[5]。

射线图是对圆形图的扩展,它也是以某一节点为中心,其他节点按照关联程度或者转发关系围绕中心呈放射状排列,这种布局图中心明确,层次结构关系明显,适用于多层媒体新闻传播的研究。而加入节点力的动力因素是考虑到节点间的相互作用力,会对节点间的距离、节点移动速度、节点的聚合程度等产生影响,通过调节其稳定条件,可以分析各要素变量对其传播结构的作用效果,有利于对可视化模型进行更进一步的研究[6]。

目前,知微传播分析已经将射线网络图应用于研究微博热点传播路径,发掘微博的传播深度和爆点。在新闻传播方法,同样可以借鉴射线布局的方法,采集新闻传播数据构建可视化网络图。

结束语

在研究新闻传播效果评价模型时,构建整体的评价体系可以量化一条新闻在传播效果。在对新闻传播中各个分指标进行具体的研究,可以挖掘新闻传播中的受众分类、传播深度和爆点等。媒体通过评估各个分项指标,掌握新闻热点、传播人群、传播层次和舆论传播规律,选择好新闻的传播手段和渠道,有助于其提升新闻传播效果。新闻媒体需要通过对新闻传播效果的全面衡量与综合分析,从而网络新闻编辑的深层规律中去寻找提高新闻传播质量的方式与方法。 

(责编:温静、赵光霞)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部