算法促进人工智能时代的信息传播【5】
算法并不必然助长内容生态的低质化。这要从算法设计的主要特征分析,分为个体、群体、整体三个层次的特征:对个体用户,算法一般通过对内容特征、人的特征、环境特征三个维度指标的分析,在特定人和特定内容之间做出力求精准的匹配。内容特征可能包括领域分类、主题词、实体词、来源、质量评分、相似文章等指标,人的特征包括兴趣、年龄、性别、职业、使用行为、机型等指标,环境特征包括时间、地点、天气和网络类型等。在群体层面,算法通过寻找不同用户在兴趣分类、主题、实体词和使用行为上的相似性,将一个用户感兴趣的内容推荐给另一个人,这已不是基于用户自己的历史行为,而是基于群体隐性关联之上的协同推荐。就网民整体,算法则基于内容的热度特征,包括全平台的热点文章或不同类别、主题和关键词的热点内容,在“冷启动”阶段对新用户进行初步推荐。
要扭转社交时代以来内容低质化的趋势,需要智能信息分发平台将社会责任意识主动地融入算法设计。算法的市场目标分为中短期目标和长期目标,中短期目标是几个小时、一两天之内用户的兴趣匹配,是为了提升点击率和收藏、转发、评论等行为,而长期目标是实现用户的稳定留存和活跃使用。很多时候,短期目标对实现长期目标并没有帮助,有时候反而起反作用。以标题党现象为例,劣质创作者通过噱头可以吸引用户点击,使点击率虚高,用户可能会留下负面评价,表面上提高了参与度,但却以牺牲用户体验和影响留存为代价,类似含水的点击率和负面的评论率,不符合信息平台的长远利益。
当前智能分发已成为新闻资讯客户端、浏览器等应用的“标配”手段,从行业实践看,居于头部领先位置的App更重视用户的长期留存,更倾向于主动避免内容低质化带来的社会舆论和监管风险。字节跳动公司最早将智能推荐算法应用在信息分发领域,在发展早期也存在内容质量问题和算法偏向市场化的问题,近年通过设置更多元的算法目标,综合分析用户浏览时长、评论情感倾向来打击标题党、煽情化等劣质内容,通过技术模型过滤有害信息和黄赌毒等违法违规内容,并基于正能量信息的模型训练来加强主流价值信息的推荐。例如,信息平台通过对上百万篇网信部门宣传报道指令、党报党刊要闻等正能量信息的人工标注,作为机器学习的模型训练集,模型经过不断优化,对新时代建设等主流价值观内容的识别率准确超过93%。算法对识别出的文章进行1.5-2倍的加权推荐,目前正能量模型识别范围已涵盖凡人善举、行业榜样、知识普惠、公益慈善等众多领域,平台内容日益多元优质,生态越来越有益健康。而一些“信息流”平台则表现出打擦边球的意愿和行动,以对低俗化内容的推荐来实现短期用户量的“冲高”,美女、大尺度、追星、偶像成为内容关键词,这些信息经推荐算法进一步放大了对用户,特别是青少年用户的影响。这已引发社会关切和监管层的关注,已督促改进。但效果尚不明显,需要加大监管力度。
分享让更多人看到
- 评论
- 关注