澎湃Logo
下载客户端

登录

  • +1

算法有瘾,大厂难戒

2022-03-30 13:32
来源:澎湃新闻·澎湃号·湃客
字号

原创 AI财经社 AI财经社

尽管算法新规明确规定了,平台必须要在显著位置上线算法关闭键,但从目前各平台算法关闭的繁琐程序来看,互联网巨头们短期内并不愿意将选择权真的交给用户。

撰文/ 《财经天下》周刊作者 曾广 薛永玮

编辑/ 董雨晴

如果说“推荐算法”是一个潘多拉魔盒,那么这个盒子正是由互联网公司们亲手打开的。

现在,推荐算法被滥用带来的一系列负面效应正在被遏制。2022年3月1日,工信部、网信办等多部门联合发布的《互联网信息服务算法推荐管理规定》正式施行,在全球范围内开启算法规范先例。

截至3月28日,据《财经天下》周刊不完全统计,抖音、微信、淘宝、美团、大众点评、今日头条、百度、微博、小红书、腾讯新闻、哔哩哔哩、快手等App,均上线了个性化内容推荐和个性化广告推荐的关闭按键。

这意味着,人们可以自主选择告别这种被算法支配的恐惧。

不过,目前各主流App的执行情况却并不理想。互联网大厂显然不愿就此交出魔盒,而是全力将算法关闭键“隐藏”了起来,让用户无法轻易关闭,以最大程度减少算法新规对平台的影响。

离不开算法的不仅是互联网大厂。站在用户角度来说,被精确的推荐算法训练了多年,很多用户也并不愿意就此关闭个性化推荐,以接受“不够精确”的服务。

推荐算法被关进了笼子,但它的触角却依旧无处不在。

算法难戒

大厂员工范婷,在一个工作日的午后百无聊赖地刷着自己的朋友圈。手指仅滑动了两下,就看到了一家瑞典设计师品牌的广告。这个服饰品牌她有印象,因为自己曾经在淘宝下单过两次。不过,一个渔夫帽就卖到了350元,价格稍贵,她因此消费得不多。

“微信朋友圈推的广告,一般都比我的日常消费要高一档次。”范婷说,“最离谱的一次,是刷到了兰博基尼的广告”。

做产品测试的王琦琦,前一天刚和同事们说完“你们想要王者荣耀联名款护舒宝吗”,第二天中午,她就在抖音上刷到了这款产品的视频。她惊叹,“我被监控了?”更让王琦琦疑惑的是,有时候只是日常聊天谈到的某个东西,下一秒抖音就会推给自己。

做前端技术的迪琳对推荐算法更为敏感。她是抖音的老用户,最近因为搜了几次健身相关的内容,抖音便开始天天给她推荐健身课程。她还发现,因为经常和男朋友在抖音上分享视频,慢慢地,她和男朋友刷到的视频池也愈发趋同,“他刷到的有些视频,我一看,就是我前一天刷到的。”

这些不是个别现象,而是真切地被算法改变的大众生活。

伴随着推荐算法近十年来被大规模应用,个人隐私、社会伦理、推荐效果等问题也开始受到重视。事实上,2021年8月,国家互联网信息办公室就发布了《互联网信息服务算法推荐管理规定》,提出算法推荐服务提供者应当向用户提供不针对个人特征的选项,或者向用户提供便捷的关闭算法推荐服务的选项。该规定于2022年3月1日起正式施行。

尽管算法新规明确规定了,平台必须要在显著位置上线算法关闭键,但从目前各平台算法关闭的繁琐程序来看,互联网巨头们短期内并不愿意将选择权真的交给用户。

作为国内推荐算法最知名的代表应用,抖音关闭个性化内容推荐需要整整7个步骤:打开App、点击“我”、点击导航栏、点击“设置”、点击“通用设置”、点击“管理个性化内容推荐”、点击“个性化内容推荐”右侧的关闭按钮。整个过程非常繁琐。

除了内容的兴趣推荐,还有“个性化广告”,有从业者告诉《财经天下》周刊,通常这两块业务在公司内部分属不同业务条线,但体现在用户端口上,有时候这两个功能的关闭键可能会设置在一起,方便用户管理。不过,抖音的并没有在一起。

《财经天下》周刊同样测试了小红书、淘宝、微博等平台,想要顺利关闭推荐算法,操作步骤几乎都在5个以上。

不同平台的推荐算法关闭按钮。图/抖音、小红书、淘宝

对于这种高度复杂化的操作,其初衷到底是什么?《财经天下》周刊据此向抖音官方询问,截至发稿前尚未得到回复。

但是可以肯定的是,关闭推荐算法将给互联网巨头的商业化带来直接的影响。据2014年Fcaebook的一份内部报告显示,关闭推荐算法会直接导致用户浏览时间变短、发布信息的频率降低、返回和登录平台的频率降低等一系列后果。

实际上,资深算法工程师俊豪向《财经天下》周刊透露,目前只要是互联网大厂,现在对算法都极其依赖,而不同App算法关闭键的隐藏深度,一定程度上也代表了它们对推荐算法的依赖的程度。

“流量大的内容类、社区类App,推荐算法这一块做得都不会差”,测试过多款竞品的王琦琦说道。一直在大厂做技术的迪琳则提到,对于一个互联网公司来说,搜索和推荐部门往往是最核心的部门,其招聘要求、人员配置都保持着较高的水准,“精确地推荐、有效的增长,是一个公司最重要的事情。”

但是搜索和推荐在业务逻辑上有着本质不同。搜索的用户往往带有明显的目的性,需要根据用户键入的内容去抵达新的内容,而推荐的用户可能没有目的,平台不一定需要完全按照用户的兴趣推荐,同时也可以引导人的兴趣。

当然,并非所有的互联网企业都依赖推荐算法,尤其是一些体量不大的公司和产品。对于这些公司或者产品而言,因为数据量并没有庞大到必须依赖算法的地步,采用简单过滤反而效率更高。

一位大厂产品运营人士告诉《财经天下》周刊,她之前运营的一款榜单类平台产品,并没有使用推荐算法,只需要人为推荐一些榜单内容到页面,“这类产品本身就不可能占用用户太多时间”。她还运营过一个信息分发平台,出于技术成本和内容专业性的考虑,往往也更多选择使用“人工推荐”。

但是对于用户数以亿为单位计量的头部App而言,算法就变得必不可少了。尤其是当整个行业的数据量呈指数级攀升,头部互联网平台都有数亿用户。海量的数据与庞大的用户规模,必须要借助算法进行过滤和效率提升。

算法已经成为互联网必不可少的基础设施,成为互联网戒不掉的“蜜与糖”。

被“推荐”栏统治

推荐算法在国内的广泛使用,离不开移动互联网的普及和字节跳动的崛起。在移动互联网高歌猛进的十年内,推荐算法也一步步统治了中国互联网。

2012年3月,字节跳动成立,主力产品今日头条于当年8月上线。作为国内首个以机器推荐为主要分发方式的新闻资讯App,今日头条上线仅90天,便横扫1000万用户,并首次在国内带火了“推荐算法”这一概念。

在今日头条之前,国内的资讯平台都是编辑中心制,以人工分发为主,而今日头条则开启了机器分发内容的先河。

俊豪向《财经天下》周刊透露,字节跳动并不是国内最早开始做推荐算法的互联网企业,比百度、阿里都要晚。但是凭借着“今日头条”,字节跳动迅速打响名声,成为了推荐算法的后起之秀,以至于在很长一段时间内,这家公司的名字都被叫做“今日头条”。

此后伴随着抖音和TikTok的崛起,字节在推荐算法领域的实力进一步增强,甚至一定程度上成为了推荐算法的代名词。

2016年9月,抖音1.0上线,两年之后,这个短视频平台迅速席卷国内,成为国内最受欢迎的两大短视频App之一。

和今日头条相比,抖音在算法推荐上更加激进和大胆。在抖音,用户通过重复的“下划”操作观看短视频,在不断下划的过程中,算法不断“学习”用户的喜好,根据用户点赞、收藏、关注等行为特征,不断训练模型,让系统推荐的短视频更加符合用户的喜好。

图/视觉中国

在抖音席卷国内的同时,抖音国际版TikTok也迅速崛起。2017年8月,字节在海外创建了TikTok,后来收购Musical.ly并将双方整合,从2019年开始,TikTok迅速席卷全球。

和抖音一样,TikTok同样深度依赖推荐算法。在麻省理工学院(MIT)2021年发布的十大突破技术中,TokTok的推荐算法名列其中,因为它能够使普通人的内容有机会受到名人一样的待遇并流行起来,实现了一定程度的内容公平性。

2018年之后,伴随着抖音的迅速崛起,算法推荐逐渐成为国内信息分发的主流方式,资讯平台、电商平台、种草平台纷纷押注于推荐算法,不同类型的App都被“推荐”栏统治。

到2020年的中国互联网,推荐算法实际上已经无处不在,除了千人千面的短视频平台以外,各大电商平台的“猜你喜欢”、搜索App的结果排序、浏览器中的推送消息,基本都运用了推荐算法。

作为短视频生态的另一大巨头,快手同样很早就开始借助算法进行短视频分发,但是和抖音单列信息流的沉浸式推送相比,此前的快手更加偏向传统信息流,赋予了用户一定的选择权,将系统推荐的不同视频平铺于首页,用户可以二次点击。

不过在2020年9月,伴随着快手8.0的上线,快手迎来单列与双列并行的时代,“越来越像”抖音的同时,用户的自主权也进一步被算法收回。

即便是那些不以算法为强项的互联网企业,大多也在移动端首页上线了推荐系统,例如爱奇艺、哔哩哔哩首页为“推荐”栏,优酷首页为“猜你在追”。

和传统的PC端相比,场景化的移动端天然更适合推荐算法。以哔哩哔哩为例,如今网页版哔哩哔哩首页依旧采取了传统的信息陈列,而哔哩哔哩App首页则是典型的个性化推荐。

在推荐算法逐步普及的过程中,字节跳动(抖音、今日头条)、快手、小红书、阿里巴巴(淘宝)成为其中最典型的代表,尤其是字节跳动的推荐算法,被行业公认为强大。

“字节的算法强大在于产品力和学习能力强大”,一位不愿具名的前小红书产品经理告诉《财经天下》周刊,从产品力来说,字节的算法比较难做,信息流提取的用户行为特征有限,在有限的特征中预测用户的喜好更难。从学习能力来说,字节的数据并发量高,需要同时对大量用户的行为特征进行在线学习。

推荐算法的强大反映到产品端,体现为字节系产品的庞大DAU(日活跃用户数)和超高的用户时长。一组数据曾显示,抖音在2021年的日活峰值超过了 7 亿,用户日平均使用时长已经超过了 1 小时。

推荐算法的初衷,是实现更高效、更公平的信息分发。但是伴随着算法对移动互联网的统治,由于大公司掌握了算法背后的分发权,过度追求收益,导致推荐算法陷入了巨大争议。

细思恐极的“监视”

推荐算法从诞生之初便存在争议,对于用户喜好的过分迎合,可能会导致用户长期接收单一种类的信息,形成所谓“信息茧房”。而企业对商业化的过度追求,则可能导致大量用户特征被滥用、用户利益被侵犯。

但是这种争议的最大化,源于2020年以后,新冠疫情下高速增长的宅经济让互联网行业加速扩张,大量用户在短视频平台上消耗海量时间,两大短视频平台在国内的用户数接近网民总数,TikTok在海外横扫全球。

在此过程中,推荐算法所导致的“信息茧房”问题开始被大量讨论,大数据杀熟、饭圈文化等问题也被与推荐算法关联起来,算法成为众矢之的。2020年9月,一篇《外卖骑手,困在系统里》刷屏全网,将外卖平台的算法推到台前,助推外卖平台后续公开了其部分算法。

一切争议的源泉在于,推荐算法的普及过程,逐步背离了它的初衷。

在互联网行业,算法本身属于一个广义词汇,除了推荐算法以外,还包括匹配算法、广告增长算法、策略算法等各个类别。但是从底层逻辑来看,不管是匹配外卖和网约车订单的匹配算法、精准推荐广告给用户的广告算法、分配优惠券的策略算法,亦或是最受关注的推荐算法,其核心均在于人与信息的高效抵达。

简而言之,算法就是设定一套规则,让人和信息根据这套规则来建立联系。但是随着算法背后的规则越来越复杂,算法对于大部分用户而言变成了一个“黑箱”,同时也引发了监管和用户对于算法滥用的担忧。

这种担忧背后的问题是实际存在的。以推荐算法为例,早期模型不精准的时候,算法背后的很多特征还是可识别的,一些内容可能会被打上简单的标签,但是如今伴随着深度学习、神经网络、云计算能力的不断提升,算法已经变得“不可视”了。

推荐算法的“不可视”,源于模型本身和特征变得越来越复杂。

推荐算法的一大基础在于,人们在互联网上的一切行为都可以归纳为“特征”,并根据“特征”构建模型,然后基于这个模型进行算法推荐。特征是多种多样的,例如人们在刷短视频时的点赞、关注、收藏,都可以被归纳为特征,通过这些特征去不断地训练模型,就能使算法越来越精准。

“其实现在的模型特征,甚至都不是性别、年龄这种显性特征,而是更细微的特征,比如你的停留时长、直播打赏记录、播放视频的倍速、甚至拖动进度条都可以被归纳为特征,然后用这些特征去做模型。”俊豪告诉《财经天下》周刊。

据俊豪透露,现在很多模型都直接做成了“嵌入”(一种系统类型),甚至就连算法工程师们都不知道其中具体包含了什么特征。这是细思恐极的,意味着,就连使用技术的当事人,也无法具体清楚他们用技术对人们做了什么。

“很多嵌入连我们也不知道是什么意思,很多推荐模型已经不可视化了。对于懂技术的人来说,这也是个黑匣子,只不过我们知道往哪里调,知道它怎样起作用,但具体代表什么就不知道了。”俊豪告诉《财经天下》周刊。

俊豪更进一步解释,“即使你不告诉我你是谁,家在哪,只是通过你的浏览记录、点赞记录,算法也能挖掘出很多它想要的特征,然后根据这些特征去做推荐。”

在这样的背景下,对于用户乃至很多的从业者而言,算法本身已经成为了黑箱。而这也意味着,算法是否被滥用,往往也是不可知的:算法到底收集了人们的哪些特征?背后如何应用?是否侵犯了隐私?例如在许多大数据杀熟的案例中,一些用户行为特征被运用在差别定价。

图/视觉中国

对于互联网公司而言,应用推荐算法有两个明确的目的,第一是帮助用户更高效地找到内容/商品,提高用户的忠诚度。第二是提高交叉销售能力,提升成交转化率。所以算法推荐的准确度,直接影响到平台的收益。

“你推荐10个短视频,要是用户都不喜欢,他就直接退出了。但你要是一直能给他推荐喜欢的,他可能连续看俩小时,顺便看几个广告,再买点东西,这收益差远了。”俊豪说。

所以在进行内容/商品推荐的时候,平台有极大的动机更多地给用户推荐那些具有更高收益的内容/商品。伴随着对用户的不断训练,推荐算法从一开始的“追随用户”,变为“引导用户”。自制力好的人可以抵抗算法,但自制力差的群体面对这样的“引导”,会产生何种影响不得而知。

主动权来到了算法这一边。

困于算法

不管是互联网企业还是公众,当下都已无法离开算法。

“算法在社会中的方方面面的渗入,已经成为一个既定事实。”暨南大学新闻与传播学院副教授师文对科学传播有多年研究,“人们终究是生活在一个社会中,而不是生活在一个实验室里。当算法技术进入社会之后,就会产生它的社会意义。”

这种算法作用于社会的情况表现在日常的每一个环节:当你每次浏览微博、豆瓣、知乎的时候,都在被算法识别、筛选,每个浏览痕迹,都会变成可量化的数据。最后你的社交圈越来越趋同,刷到的动态越来越是自己“本来就想看到”的。于是你开始以为这就是社会“本来的样貌”,并对不同的声音无法容忍。

清华大学2018年的一篇研究文献就指出,在算法分发时代,互联网巨头通过技术优势将分发和传播的权力从人类转移到机器,“事实上收回了信息的把关权”。算法对社交领域的侵入,实际上是互联网企业和算法权力的进一步扩张。

“算法一开始只是一种效率工具,但现在成了一种规则,一种权力”,师文对《财经天下》周刊说,集成用户的大数据,支配人们的信息流向,这是推荐算法对人们更大、更为持续的影响。

如今,伴随着世界各国纷纷将算法监管提上日程,一个共识是,算法的“权力”必须被约束,而算法规范的一大目标就在于,让算法不被滥用。据俊豪透露,算法新规实施以后,现在一切关于个人特征的信息基本上都不能用了,而且伴随着相关部门中懂技术的人越来越多,规范水平也在不断提升。

“现在监管部门很多人也很懂技术,他们会直接翻代码,看你是否侵犯用户隐私、过度收集权限等。”俊豪告诉《财经天下》周刊。

除了以上努力,平台和公众自身也需要在社会中建立起更好的适应机制。在师文看来,对于公众而言,需要思考如何与算法相处,与算法相处的时候应该拥有哪些权利,“比如抖音用户那么多,但算法素养依然欠缺,未必人人都意识到抖音是存在推荐算法的,那就无从谈起更进一步认识到这种算法的运作机理,更不用说意识到这将对我们的信息环境产生什么影响。”

分发信息的互联网企业们,则需要针对算法做出更为透明和充分的引导。师文提到,平台在保护商业秘密的前提下,首先需要让其算法更加的可见、易懂,增强算法的透明性,让公众对其算法有所意识和了解。在保障用户的选择权时,也应该给予其更充分的选择,采取更加用户友好型的设置。

“不能搞一个算法披露出来,但是公众看不懂,搞一个关闭按钮出来,但是公众找不到——这种做法只是看上去有了选择权,而不是一种充分的选择权。”师文说。

英国学者杰米·萨斯坎德在《算法的力量》一书中还强调到,互联网公司内部几乎没有工程师会思考其工作导致的系统性后果,他们中的大部分只需要解决某些分散的技术问题就可以交差了。这也要求,整个互联网行业要抛弃所谓“技术无罪”的挡箭牌,真正对推荐算法的过程和结果负起相应责任。

但硬币的另一面是,多年的用户培养已经导致不少用户难以戒掉推荐算法,新规对平台的实质影响有多大还很难说。

“商业化效率是一定会下降的,但是推测不会下降很多,甚至不会有影响,因为用户可能找不到关闭键、不愿意关闭或者不在乎关闭。”上述前小红书产品经理提到。

没有选择关掉推荐算法的用户确实不在少数。一位抖音资深用户表示,自己不会选择关闭个性化推荐,“关了之后还是会到处推广告,不关还能筛掉一些我奶奶才看的视频。”迪琳越来越不爱刷抖音了,但如果真要关闭个性化推荐,“那还不如不玩了,刷到的就完全不是想看的了”。

王琦琦早就听说可以关闭个性化推荐,但似乎还是出于一种依赖,想知道“系统到底会给我推荐什么”。像范婷一样对技术无感的普通用户,则是习惯了这一切,疲于查找关闭入口也无暇考虑更多,“看一看也无妨”。

(应受访者要求,文中范婷、迪琳、王琦琦、俊豪为化名。)

我们从《财经天下》周刊出发,以新媒体的形式和节奏、

以传统媒体求实的精神,致力于传播真正有价值的报道。

AI财经社原创内容,未经授权,禁止任何转载

原标题:《算法有瘾,大厂难戒》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈