用主流价值导向驾驭算法研究
此文为2019年度“人民网奖学金优秀论文奖”获奖论文。
摘要:随着近年来互联网的发展,算法技术得到了越来越广泛的运用,而价值观对算法的影响,也逐渐成为了公众讨论的焦点,本文通过对算法演化方向的研究、价值观在算法的前期开发、后期管理以及算法本身的影响,配合对人民网、知乎、今日头条等典型案例的分析,探究主流价值观对算法的驾驭及算法未来的发展方向。
一. 引言
现今算法被应用于各个领域:信息的获取及筛选,收集数据对用户喜好进行分析和个性化推荐等。可若单一考虑用户立场或信息受欢迎度进行信息筛选而进行算法设计可能会导致不好的结果,例如推送一些诸如抢劫、行凶等消息会对导致社会风气走向危险的道路。此时,就需要企业对价值观做一个衡量,是选择利益,还是选择引导,这些选择会被体现在算法中。
二. 算法的演化方向与研究
算法是一个逐渐演变的过程。它的诞生初期仅仅是人类开始开发他们的智慧,用以改造生活;渐渐地,人类的生活得以满足,算法被用来创造金钱;近年来,算法已与科技无法分开,成为人类价值观的一种体现。
(1)初期算法——文明的起源
早期的算法是没有分类的,人类仅仅是将他们的生活经验进行总结并扩大应用。公元前4000年,最早的历算法“一周七天”,“一年十二个月”等诞生了;公元前3000年,多位数乘法出现;公元前2100年,美索不达米亚人已经有了乘法表,使用着六十进位制的算法,甚至还拥有了倒数表、平方和立方表等,同时,中国夏朝出现的象征吉祥的河图洛书纵横图的“九宫算”,被认为是现代“组合数学”最古老的发现[1];公元前2000年,十进制的算法在达罗毗托人的生活中出现;公元前400年,斯巴达人将密码用于军事用途……
(2)早期算法——知识的启蒙
公元前300年,欧几里得算法诞生;公元前200年,矩阵诞生;公元前50年,恺撒密码诞生;50年,“秦九韶算法”诞生;100年,《九章数学》成书;263年,圆周率的近似值被推出;500年,多项式方程算法出现;600年,十进制系统出现;1360年,奥雷姆通过横、纵坐标表示点的位置并进而讨论函数图像;1484年,正负号诞生;1545年,一元三次方程与一元四次方程的解被得出;1593年,珠算发展到了顶峰;1607年,《几何原本》前六卷出版;1628年,《筹算》出版;1686年,莱布尼茨发表第一篇积分学论文《深奥的几何与不可分量及无限的分析》[1],创造了微分符号及积分号,发现了微分和积分的互逆关系;1700年,莱布尼茨提出二进制算法……
(3)中期算法——科技的角逐
二进制算法出现后,计算机领域得到了飞速发展,人类对算法的研究逐渐转移到更复杂、更深奥的领域,同时,算法也与科技及商业绑定。
1815年,阿达奥古斯塔为巴贝奇分析机拟定了“算法”,写了一份“程序设计流程图”,这份规划被人们视为“第一件计算机程序”,阿达奥古斯塔被认为是世界上第一位软件工程师;1834年,巴贝奇提出分析机的概念,分析机分类堆栈、运算器、控制器三部分;1847年,布尔运算诞生;1930年,Prim-Jarnik算法诞生;1934年,哥德尔使用原始递归函数;1943年,哥德尔确定出可计算函数;1951年,Booth算法诞生;1958年,面向算法的语言ALGOL诞生;1959年,Dijkstra算法诞生;1965年,LR算法诞生,复杂度的概念被提出;1973年,数据加密标准诞生;1986年,BP网络和BP算法被提出……
(4)现代算法——价值观的需求
随着算法体系的不断完善与科技的不断进步,商业市场逐渐扩张,算法不再是数学家们为了研究知识而提出的解决方案,更多的时候,它是商业家们为了完成商业需求而开发的针对性算法,或者,他们将已完善的算法拿来,用以满足他们的商业需求;算法是没有价值观的,但他们却是使用者价值观的体现。例如,有人利用网络算法无法对上传内容进行分辨的空子,进行违法活动;同时也有人利用算法对客户的喜好进行总结与推导,给予用户更好的产品体验。有人认为算法不应评判内容,而应给用户一个平等而自由的平台,无需平台给他们贴标签;也有人认为,网络应该给予人民好的引导形象,算法应将坏的一面彻底剔除……在这些领域,每天的争议都不绝于耳,源于当今市场的复杂化,商业需要在满足用户需求、投资者需求的前提下追求最大的价值,有些产业选择走上非法之路,有些产业选择坚守正义,在这其中所体现的,就是算法的价值观,也是人的价值观。
三. 价值观对算法的影响研究
在与算法的融合过程中,价值观对算法的前期开发、后期管理乃至算法本身都产生了一定的影响,引发了一系列的变化。
(1) 价值观对算法前期开发的影响
在研究了多款文字呈现类软件后我们发现,为了所谓的“点击率”,发布者常常选择发布一些不符合常理的、甚至涉及暴力或带有性暗示的视频来满足观众的猎奇心理。用户触发点击行为后,将会被算法捕捉记录。点击量越大,算法的推送力度越大,进一步带来更多的点击量,从而导致恶性循环,最终使得越来越多庸俗、粗俗、导向不正的内容充斥在各大客户端的页面上。
强调主流价值导向,将会增强算法开发者的使命感,开发出真正优质的、与主流价值观完美融合的算法,从而提高推送内容的质量。
(2) 价值观对算法本身的影响
1) 促进算法公正
2018年5月,携程被曝“酒店同房不同价”,涉嫌存在“杀熟”行为; 2015年美国芝加哥法院使用的犯罪风险评估算法COMPAS被证明对黑人犯罪嫌疑人造成了系统歧视;微软开发的Tay聊天机器人试用24小时便成为种族灭绝的反女权主义纳粹分子,发出 “希特勒无罪”的消息……诸如此类的事件引发了人们的强烈不满,国内外对于“算法公正性”的不满和质疑层出不穷。
算法的本质其实是为了实现某个功能的工具。使用者希望在应用算法时,它能够中性并且保持公正。然而,算法由人创建。因此在编写算法的过程中,开发者必然会给算法赋予判断的标准和某些倾向性。同时,算法所依赖的大数据也并非是绝对中立的。大数据来源于社会群体,而社会群体中,或多或少都隐藏着固有的不平等、歧视乃至排斥的情况。
算法开发过程中的“黑盒”性以及数据来源隐藏着的不平等都影响着算法的公正性。即便算法难以实现绝对的公正,我们仍要以正确的主流价值观作为算法导向,才能尽可能地让算法趋于公正。
2) 提升算法的透明性和可解释性
算法技术对于大部分不具有相关专业知识的普通用户来说,是非常复杂且不透明的。人们无法真正地理解算法,从而可能导致对算法的误用、滥用。
当一些带着恶意破坏社会秩序、价值观畸形的算法出现时,用户的误用将会给其作恶的可趁之机。与此同时,一些算法只能用于特定人群,还有一些算法的使用场景有严格的限制,倘若这类算法被用户在不知情的情况下使用,可能会造成各种不良影响。同样,对于监管审核人员来说,无法真正理解算法将会成为监察管理路上的重大阻碍。
因此,在把算法提供给用户使用或者监管人员进行审核的同时,需要将如算法使用限制、算法准确性、算法误差范围等需要被了解公开的内容进行必要且详尽的说明,同时,对于涉及用户利益的部分,更应主动以用户能够理解的方式进行充分的说明,结合内生性的生产逻辑和外生性的监管逻辑,按照算法披露、法律规制和社会监督三个思路构建算法透明实现机制。
(3)价值观对算法后期管理的影响
今年4月,快手宣布招聘3000名内容审核员,审核团队达到数千人;2018年,今日头条急招2000名内容审核编辑,审核团队人数过万。虽然算法是一种智能工具并且具有自我学习能力,但是如今依旧不能完全靠规则化的机器来完成所有判断。
由于仅靠算法本身对不良有害内容进行筛查监管是远远不够的,因此,相关公司还需要招聘具有专业知识、有高度社会责任感的人员进行监管审核,弥补算法自筛查能力的不足,与算法共同把关,真正做到双重保障。
四. 主流价值观对算法影响的典例分析
(一) 正面典例分析
1、“人民号”典例分析:平台首创主流价值算法,弘扬传播积极内容
1) 背景简介
百度技术赋能人民日报搭建的“人民号”平台首创了“党媒算法”[2],在主流价值观驾驭之下,实现为用户个性化推荐优质内容的功能。人民日报官方微博账号数据显示,截至人民号上线一周年为止,已有近18万账号申请入驻该平台,经过层层筛选,有2万多优选账号成功入驻;累计收录优质内容300万条,其中用户偏好的内容大多集中在新闻资讯、影视、工作职场、金融、出行等方面。由此可见,不只是通过低俗、吸引人眼球的内容才可以获得高流量,正能量和主旋律的内容同样可以获得人们的关注、喜爱和认同。
2) 价值观给算法带来的正面影响
在“算法焦虑”与“流量焦虑”仍待解决的当下,人民号坚持用主流价值观构建主流价值算法,用社会责任与义务规范传播内容,用优质平台凝聚众人的智慧与力量,不断将正能量传播给整个社会。百度与人民日报联合研究的“党媒算法”不同于传统商业意义上的推荐算法,它在基本的算法逻辑的基础上,努力为算法赋予党媒的主流价值观,构建一个新颖的新媒体生态。”人民号“平台的出现恰恰印证了算法是可以在主流价值观的引导之下避免不良、有害内容传播,弘扬积极向上的正面态度的,正如前人民日报社副总编辑卢新宁所说:“我们高度重视用户流量,但我们坚决反对低俗的流量、失序的流量、带血的流量。……我们高度重视算法推荐,但我们坚决反对失控的算法、混乱的算法、危险的算法,我们认为任何算法都不应抽离价值,都应是在主流价值驾驭之下的。” [3]当蕴含有主流价值观的内容,经由算法的分发扩散后,这些内容必将获得更大的传播能力,进而使这些正面、优质的东西被更多人知道、了解,向整个社会传递美好积极的信息。
2、知乎典例分析:算法遵从主流价值观,为用户创造良好社区氛围
随着互联网产业的发展,当今诸如快手、抖音等许多热门APP专注于根据用户喜好个性化推荐内容,而知乎作为其中“格格不入”的一员,却更“关注内容生产的本身,将算法大规模应用于社区氛围的管理,以生产出有价值和对用户有帮助的内容” [4]。知乎创始人周源在谈到知乎的价值观时说到:“我们会依据自己的价值观,将违反知乎价值观的观点删掉。我们反对偏见,也反对谣言八卦。……平台的价值的一部分就是要有自己的价值观,虽然这是一个比较难的选择题,但如果知乎认为这么做是对的,就会去做。” [5]知乎通过开发算法机器人来识别垃圾广告、处理举报内容、处理人身攻击类内容,其算法也很好地避免了低俗内容的产生、维护了一个良好的社会氛围,符合我们所提倡的主流价值观。我们也可以从中看出,平台需要有价值观、算法也要有自己的价值观,一个受到主流价值观引导的算法,会将这种价值观反馈传达给用户,可以为社会的发展起到一定的积极作用。
(二) 负面典例分析
1. 今日头条案例分析
1) 背景简介
今日头条是一款基于北京字节跳动科技有限公司开发的数据挖掘引擎产品,是一款在新媒体环境中向用户推荐信息的产品,提供用户与信息的连接。以“为你推荐你喜欢的个性化新闻资讯”为广告语,以个性化新闻的独家推荐为最大卖点,其创始人张一鸣一直以来信奉“算法没有价值观”,在价值观与技术的冲突面前,主张技术>价值观,今日头条利用大数据挖掘和剖析,从多方面分析用户的行为习惯,根据多维信息特点的匹配程度为用户提供个性化的推荐服务,用户也可通过“订阅”与“定制”功能来获得自己感兴趣的相关信息。这样的信息分发模式,给今日头条带来了巨大的收益,根据新浪科技讯消息,截至2016年10月底,今日头条已累计有6亿激活用户,1.4亿活跃用户,每天每用户使用时长为76分钟,然而无道德观约束的算法导致的弊端也随之而来,2018年元旦,国家网信办就持续传播低俗信息、违规转载新闻信息等问题约谈今日头条,4月,国家广电总局约谈今日头条,责令其下线有害节目并进行整改。2017年底,今日头条因“持续传播色情低俗信息、违规提供互联网信息服务”等问题,暂停更新24小时。如今依然许多网友反映,今日头条推送的垃圾信息过多,优秀内容难以得到有效传播与宣传。
2) 今日头条算法简介
新闻算法推送以计算机数学算法为计算工具,通过对用户浏览历史的数据挖掘来推断用户的兴趣,结合性别、年龄、职业、等基本个人信息,得到用户查看新闻的时间、网络环境和搜索习惯等信息,结合大数据分析,推算用户对新闻的偏好,并将其推送给用户以达到根据用户偏好差异提供相应推荐的效果。
今日头条算法获取用户阅读的内容,通过用户的注册信息、登录数据、关联社交账号数据和 阅读行为来深入计算用户的兴趣,并将用户的主动关注优先纳入算法考量,以完成个性化推荐。并通过原创推送等功能,为自媒体提供发展平台,运作“头条号”。此外其推荐引擎会对热门关键词进行整合,生成子频道,当带有某一标签的文章数量大、热度高时,这一标签就会被算法捕捉并聚合为这一栏目下的某一子频道,如“体育”栏目下的德甲、法甲、 欧冠等子频道。[6]
3) 忽略价值关的算法带来的负面危害
a) 茧房效应
信息茧房是指人们的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”中的现象。而数字算法下个性化推荐技术和用户的心理,共同造成了今日头条的“信息茧房”效应。
首先,在今日头条这个融合各种信息与观点的公开平台上,信息过载现象与用户注意力是匮缺以及用户选择性接触等多种原因,决定了人们更愿意倾向于选择自己感兴趣的话题,而今日头条“无价值观算法”的作用与“人工不干预”理念,加上其通过算法进行个性化推荐的广泛运用,导致其产品依靠数字算法,完全为了迎合受众的需求而进行个性化推荐,使用户禁锢在符合自己舒适度的“圈子”里,通过今日头条推荐算法获取的新闻大多与之前已经有所了解的内容相关或相同,导致用户不断被这些信息所包裹,从而形成了信息茧房。[6]
b) 低质量信息传播
今日头条个性化推荐算法完全依赖于用户行为,未对推荐信息进行宏观把控与干涉,当用户的阅读历史产生一定倾向性时,个性化推荐内容会迅速捕捉并匹配到这样的倾向性,然而,一方面,用户的需求通常是盲目且阶段性的,另一方面,一些娱乐主题的新闻或有噱头的标题,一定程度上确实会引起用户的好奇并增加其被用户点击的概率,双重作用导致当用户点开几条八卦新闻之后,其接收到的个性化推荐相关推送将会被各类八卦新闻占据;当用户观看几部不符合常理的、甚至涉及暴力或带有性暗示的打违法擦边球的视频作品后,平台将加速向其推荐这类劣质作品;而这样的低质量信息很容易对当代辨识能力不足的年轻人、儿童造成不良的价值观影响,不健康的信息的过度传播,将影响当代社会年轻人的身心发展与良好社会形态的构建。
2. 谷歌案例分析
使用最先进图像识别技术的谷歌早期曾由于搜索引擎所使用的算法未涵盖有关“种族”的价值观考量,Google Photo算法将黑人打上“猩猩”的标签,而搜索“不职业的发型”时,结果中种族面绝大多数是黑人的大辫子,同样,根据哈佛大学数据隐私实验室教授拉谭雅·斯维尼的调查发现,根据谷歌智能广告工具 Adsense 给出的结果,在谷歌上搜索有“黑人特征”的名字,很可能弹出与犯罪记录相关的广告,同样在其退出的一款名为Google Arts & Culture 的对照片进行识别并找到相似的历史名画的APP中,外媒Digg News发现,有色人种和女性所配对的作品相当有限,而且往往带着种族歧视色彩,谷歌因此多次陷入“种族歧视”风波。可见即便算法与算法开发者不带有种族倾向性,可能也会由于算法与机器学习本身的特质吸收和放大歧视,对社会上的弱势社群造成伤害,因此算法必须考虑价值观因素。
3. 微软案例分析
2016年3月23日,微软开发的人设为19岁女性,昵称为 Tay 的聊天机器人在推特上线。该机器人通过抓取和用户互动的数据模仿人类的对话进行聊天。而由于该机器人所依赖的算法并未对言语质量与伦理道德进行把控,上线一天之内,Tay 就成为了一个满口叫嚣着种族清洗的极端分子,并因此被下架。可见依赖于未考虑价值观因素的算法的产品极容易收到不良社会风气的影响,从而对网络环境及社会造成反向危害。
五. 基于主流价值观的算法未来发展方向
近几年来,关于“算法究竟有没有价值观”问题的讨论成为了互联网领域的热门话题,经过我们的调研与分析,它的答案是肯定的,也应该是肯定的。一些人提出,算法只是一门技术,不应给算法拷上沉重的道德伦理枷锁。然而,算法是人创造出来的,算法的价值观就是人的价值观的直接投射。拥有正确价值观的算法不仅仅给人们的生活带来便利,有时更接近于一种人文关怀。西安电子科技大学通过大数据分析学生在校刷饭卡的记录,给达到设定标准的学生予以补助,这一暖心举措获得人们的广泛好评,大赞。与之相反的是,拥有错误价值观的算法往往成为助长社会不良风气的温床,例如平台监管不力导致的淫秽色情、暴力血腥制品的传播,诈骗犯罪经由互联网渠道“重获新生”,隐私被窃取和贩卖的现象屡见不鲜……
由此,大力推行基于主流价值观的算法,整改与优化偏离主流价值观的算法已经刻不容缓。由今日头条的负面案例分析可见,在其“算法没有价值观”,“技术>价值观”的导向之下,弊端很快浮现,随之而来的央视点名、广电约谈、产品下架整改,操作快、稳、准,显示出国家引导算法向主流价值观靠近的决心与力度。
算法价值观规范化是未来基于主流价值观的算法的发展趋势之一。这里的价值观规范化并不企图磨灭算法价值观的多样性,而是剔除算法中带来负面影响的部分,改进不适当、不合理的部分,使之趋近于相关部门机构制定的标准。正如广电总局给今日头条下达的整改要求中所说:“网站节目的上传总量和上线总量应立即调减至与网站审核管理力量相匹配的规模” [7],用白纸黑字的硬性条例规范平台,督促企业规范算法,确立正确的算法价值观。广电约谈整改企业,是我国互联网向网络平台规范化迈出一小步,也是算法规范化的一次前瞻导向。而在这样的社会价值观导向之下,企业逐渐意识到平台监管存在的问题,纷纷采取行动。今日头条宣布要扩招员工,完善“人机结合”审核模式;快手与清华大学合作,成立未来媒体数据联合研究院,尝试通过技术与人文的结合,实现人与人更精准的连接。在技术与人的碰撞后迸溅的火花之中,我们看到“AI算法+人工干预”赋予算法主流价值观的可能性。将推荐技术、视频理解和大数据分析的深厚积累作为研究素材,进一步优化和提升AI算法,提高内容供给的效率和准确性,让积极内容拥有更多被推荐的机会;与此同时,人工干预在一定程度上可以约束不良信息的传播,让博人眼球的低俗内容没有容身之处。Ai算法与人工干预相辅相成,互相促进,为用户提供健康上乘的内容,在基于主流价值观算法的影响下进一步提升幸福感。[8]
人民日报严正指出:“技术红利与公序良俗没有必然冲突。新事物在跨越野蛮生长阶段之后必须逐步走上正轨。” [7]如何让算法更好地服务于人类,遵从于人类社会的秩序,然后健康有序地发展,既是提问,也是对基于主流价值观算法的要求。在本文中提到的解决方案也许不够全面,但基于主流价值观的算法若能在规范化的基础上采用“Ai算法+人工干预”机制,不断优化与发展,相信算法乱象的治理应该会有很大的改善。
参考文献
[1] 算法发展史 https://max.book118.com/html/2017/0819/128731268.shtm
[2] 搜狐.人民日报新媒体将推党媒算法 打造良性传播生态http://www.sohu.com/a/253509904_592957
[3] 卢新宁:人民日报为什么要办“人民号”?http://media.people.com.cn/n1/2018/0612/c40606-30051403.html
[4] 算法有没有价值观?知乎从技术维度给出了解释http://www.woshipm.com/ai/988228.html
[5] 中国经营网.知乎“进化论”http://www.cb.com.cn/index/show/bos/cv/cv132571287
[6] 赵欣琦:《数字算法下信息茧房效应——今日头条为例》.卫星电视与宽带多媒体,2019
[7] 赵丹:《人民日报海外版:算法也有价值观》.人民网-人民日报海外版,2018.04.13
[8] 钱皓:《为算法补齐短板,是社会责任,也是快手们的新机遇》,
分享让更多人看到
推荐阅读
相关新闻
- 评论
- 关注