- +1
AI社会学|众包时代:你挣到你的一美元了吗?
每个学期课至中途,通常是美国高校春季假期的前一周,我都会给学生布置一个回家作业。作业很简单,既不要求你写三千字论文,也不需要处理五万条数据,而是要你以工人(worker)身份登录全球最大的众包平台——亚马逊旗下的Amazon Mechanical Turk (MTurk),然后,赚上一美元。
每年学生回来汇报的经历五花八门,无奇不有,很多人在经历了九九八十一难之后仍旧没有拿到那一块钱。常常是激情吐槽了半堂课后,才有人总结陈词:这一块钱也实在太难赚了!
学生们在平台上遇到的第一个困难,是身份审批。跟美国大多数涉及雇佣人工的打工平台一样,亚马逊有着繁琐的审批过程。出于税务的考虑,平台往往要求工人提供具体身份信息,包括社会安全号码。
审批之后,第二个困难会接踵而至,就是在平台上找到标价一美元的工作。学生的反馈是,很多工作有非常繁琐的“打工要求”,譬如,你必须身处美国,必须完成过多少份工作,必须有百分之九十以上的成功率。更甚者,一页一页往下滚屏的时候,看到的多是标价五毛钱的问卷调查,标价一毛钱的数据清洗工作,甚至标价一分钱的图片标注工作—— 譬如,请动手圈出下列图片里含有红绿灯的那些,或者,请手工将下面这张手写的收据抄录成电子版。有学生抱怨说,有些标价一块钱的工作一出来就被抢光了。一些五毛钱的“高薪”工作,会要求你先完成一个长达三页的教程,然后参与一个长达两页的测试,最后才能看到工作页面。也就是在你打上工之前,先要打一份预备工,目的是看看你到底有没有资格打这份工?!
最后,工打完了,还存在工资结算的问题。学生回忆道,工资并不是当场结算的,很多雇主会明确说明,工作里含有“测试类型”的问题(譬如,请选择含有选项b的那一栏),如果没有正确回答上这些问题,说明打工不认真,完成的工作会被“雇主”断然拒绝。一般情况来说,这拒绝是单方面的,打工人并没有上诉讨薪的机会。
还有些学生汇报,在打过一次工之后,他发现自己在平台上出现了数据评分——你可以看到自己成功地完成过几次工作,成功率是多少,但并无关于具体工作的具体评价。学生们说,他们感觉,很多时候,雇主是靠这些抽象的数据在筛选工人。
低薪,内卷,乏味,有时甚至讨薪无门,欢迎来到AI背后的众包时代。
众包(crowdsourcing)一词,始于2000年代早期,指的是将无数微小工作通过网络灵活机动地分派给大量用户的一种劳动组织形式。2004年,《纽约客》的名记詹姆斯·索诺维尔基(James Surowiecki)在《群体的智慧》(The Wisdom of Crowds)里开篇立意:如何正确地估算一头公牛的重量呢?如果让一位畜牧业专家和一群什么也不懂的乡民对决,哪一边的估重更准确?
索诺维尔基的中心思想是,群体的智慧也许远优于单个专家的决策。在公牛的例子里,组织一群乡民,让每一个单独给出公牛的估重,经过平均后得到的数值,最后往往比最资深的畜牧业专家的估重更为准确。
这之后,“群体的智慧”成为年度热门词汇。从某种程度上来说,很多我们耳熟能详的在线社区都是这一概念直接或者间接的获益者,譬如依赖大量网络用户自愿参与编辑的维基百科。2008年,在美国联邦交通管理局授权和资助下,盐湖城甚至进行了一项通过公众参与大众交通规划的众包项目,当地居民可以经由网络运用群体的智慧重新设计城市交通规划。
2005年11月,亚马逊上线了Amazon Mechanical Turk (MTurk),将众包的想法正式平台化和商业化,之后不同类型的众包平台如雨后春笋,纷纷涌现。Turk这个名字最初来自于18世纪一架号称在欧洲巡回演出里打败了拿破仑的超级国际象棋机器。之后人们发现Turk其实完全不是全自动的现代化机器,而是一架木偶,木偶底下藏着一个人类的象棋高手。所以,与其说是机器在与人类对弈,不如说是人类操纵机器在与人类对弈。
亚马逊继承了这个概念,将其众包平台命名为Turk,不可不说是有一点黑色幽默的意思在里面。之后,科研人员和初创人工智能公司们大批涌入MTurk,作为“雇主”(“requester”)登陆平台,发布所谓的“人工智能工作” (“Human Intelligence Tasks”, 也被简称为HIT)。通常情况下,这些工作是计算机算法在当前的科技发展下尚且无力处理,人类却可以通过简单训练很快就能上手的工作,譬如图像识别、内容审核、语音识别等等。
很多时候,这些由数以万计的世界各地的劳工们一份一份手动处理的数据,组成了当代人工智能算法的基石。譬如,我们之前讨论过的人工智能历史上最大的计算机视觉数据集ImageNet,其庞大的1500万张各式各样的图片,就是由众包平台上近五万名工人共同标注的。而之后无数先进的计算机视觉算法,都是在这个数据集上训练出来的。
从这个角度上来说,亚马逊大佬杰夫·贝索斯(Jeff Bezos)将MTurk平台提供的服务称为“人工的人工智能”(artificial artificial intelligence),也许是更为贴切的说法。
最早以“群体智慧”的希望兴起,在被平台们商品化和算法化之后,众包的概念饱受批评。
最显著的批评,是对于劳动的剥削。
第一层的剥削来自平台。据统计,MTurk每日上线超过60万项任务, 平台以20%~45%的比例对这些任务进行提成。其中将近四分之一的任务标价在一分钱左右,超过70%的任务标价在五分钱左右。 由于工人是美国法律意义上的“独立承包商”,因此他们不受美国大部分劳工法律的保护,也不受最低工资法的保护。
第二层的剥削来自雇主。对于企业,尤其是各种AI初创企业来说,众包平台转嫁了他们需要寻找、培训、雇佣工人带来的成本。众包平台说,我们的工人们是“按需”存在的、“流动”的,以及“灵活”的。然而同一套说辞对于打工人来说,就意味着他们的工作就是“全天待命”的,“没有保障”的,以及“呼之即来,挥之即去”的。
首先,平台上的工人需要花时间筛选工作,如我们之前讨论的那样,报酬高于一美元的工作少之又少,很多工作有不同的门槛要求。而这一部分“寻找和筛选”工作的时间往往并不会计入工作时长,收到报酬。
其次,“按需”的工作常常意味着工人必须时刻在线,随时准备工作。与通常的理解相反,“按需”是指雇主只有在需要的时候才发布工作,而不是工人只有在需要工作的时候才去工作。对工人来说,算法分配的优质工作往往在瞬间就被一抢而光,长时间在线甚至“全天待命”是硬性要求。
最后,“灵活”就业的意思是,工人没有社保,没有工位、办公设备、上岗培训,甚至也没有要求雇主进一步解释工作的机会。平台上的工人需要自己配备工作设备,搞清楚工作的要求是怎样的,产出到底是怎样衡量的,否则就有可能拿不到最后的工资。
更深一层里,是在文化层面上对于劳动的异化和分层。
加州大学圣地亚哥分校的传播学者莉莉·伊拉尼(Lilly Irani)说,众包平台们的兴起,从本质上,是将数以万计的有关人工智能的劳动进行了分层:一批独角兽和天才程序员们上升成为人工智能科学的皇冠;另一批则下沉成为了现代人工智能产业的不可见的底层设施。人工智能算法不可及之处,随时有大量廉价动态的人类劳动可以补上。但付出劳动的工人们只是计算机系统里的一串符码(譬如A98DR9ETTTNNSS),他们不但没有名字,没有同事,甚至对自己的劳动也没有自主权,对工作的目的和性质更是一无所知。福特时代为汽车拧螺丝的工人们尚且知道他们最终的产品是一辆汽车,众包工人接收的却只是一项被打散成不能再打散的工作,譬如,标注这张照片上河流的位置。至于标注后的图片是被用去训练汽车还是坦克,工人们没有知情权,也没有署名权。如此,身处于发达国家的资本家,独角兽和天才程序员们永远可以出现在最光鲜亮丽的酒会,鼓吹优异的员工福利,扁平化的公司管理,去等级化的工作环境;而不用去理会今天发布的最新版自动驾驶汽车是用印度南部单亲妈妈们手动标注的数据训练出来的。
一张图片一分钱。
2008年,《连线》杂志的记者杰夫·豪(Jeff Howe)在 《众包:大众力量缘何推动商业未来》(Crowdsourcing: How the power of the crowd is driving the future of business)一书里说, “MTurk允许客户们将我们希望计算机能做、但(事实上)却不能做的各种琐碎工作外包”。而那些工作,大部分是“枯燥、无脑、低薪的任务 ”(“dull, brainless, low-paid tasks”)。
国际劳工组织(International Labor Organization) 在2018年发布了对生活在全球75个国家、在五个英语众包平台上工作的3500名工人的大规模调查。他们的数据显示:
● 在2017年,一个众包工人的每小时平均收入为3.31美元。
● 56%的工人从事众包工作超过一年;29%的人从事众包工作超过三年。
● 众包工人受过良好的教育:37%的人有学士学位,20%的人有研究生学位。
● 平均来说,工人每做一小时的有偿工作,就会花20分钟进行无偿工作,无偿工作包括寻找任务,参加无偿的资格测试,以及写评论。
● 对于大约32%的工人来说,众包工作是他们的主要收入来源。
● 众包平台上最常见的任务包括回应调查和参与实验(65%),访问网站内容(46%),数据收集(35%)和转录(32%)。
● 众包工人里各种社会保护的覆盖率很低:2017年,10个受访者中只有6个有健康保险,只有35%的人有养老金或退休计划。
2006年,亚马逊大佬贝索斯对一群聚集在麻省理工学院的科技精英们介绍彼时刚刚上线的众包平台MTurk,将其与新兴的“云计算”(cloud computing)相比较。他说,与“云计算”一样,MTurk提供了即时的、按需提供的、可通过计算机代码访问的计算力(computational power)。不同的是,在MTurk上,计算力是人。
“你们都听过 “软件即服务”;今天上线的是“人类即服务” (“You’ve heard of software-as-a-service. Well this is human-as-a-service”)。
我们这里没有工人,更无所谓阶级,我们提供的,只是“服务”。
当然,更大的问题是:为什么会有那么多受过高等教育的人愿意随时待命,去做这一批低薪,内卷,没有福利,没有职业前景,还常常讨薪无门的众包工作?是什么驱使着他们将自己挂在平台上等待被“雇佣”?
2013年,莉莉·伊拉尼和她的合作者推出了Turkopticon。作为第三方网站和浏览器插件,Turkopticon允许Mturk上的“工人”(worker)联合起来,对发布任务的“雇主” (requester)进行反向评分。
有人说,它是众包时代里工人们所拥有的最接近“工会”的东西。也有人说,它是众包时代的“阶级斗争工具”。
最新的众包任务,发生在俄乌之战的前线。据推特网友Bogdan Kulynych的实时报道,他在一家名为Premise的众包平台上发现了要求众包工人在乌克兰为俄罗斯军队的导弹算法拍摄、标注、识别关键地理位置的工作。根据工作时长和辛苦程度,其报酬从0.25美元到3.25美元不等。
随后Premise暂停了平台在乌克兰的运营,并辟谣道,它在乌克兰的工作是“代表西方民主国家,希望了解该国的基础设施状况”。而据《华尔街日报》报道,Premise是通过众包方式,为世界各地政府安全部门收集信息的诸多众包平台之一。其大金主主要来自于美国国家安全部门。
参考文献:
1. Irani, Lilly. "The cultural work of microwork." New media & society 17.5 (2015): 720-739.
2. Surowiecki, James. The Wisdom of Crowds. Anchor, 2005.
3. Tau, Byron, “Premise Mobile-Phone App Suspends Ukraine Activities After Accusations Fly.” Feb 26, 2022, The Wall Street Journal, https://www.wsj.com/livecoverage/russia-ukraine-latest-news-2022-02-26/card/premise-mobile-phone-app-suspends-ukraine-activities-after-accusations-fly-8FDnhZe9raunaIJ4HV66
4. Gray, Mary L., and Siddharth Suri. Ghost work: How to stop Silicon Valley from building a new global underclass. Eamon Dolan Books, 2019.
5. Berg, J., Furrer, M., Harmon, E., Rani, U., & Silberman, M. S. (2018). Digital labour platforms and the future of work. Towards Decent Work in the Online World. Rapport de l’OIT.
6. Irani, L. C., & Silberman, M. S. (2013, April). Turkopticon: Interrupting worker invisibility in amazon mechanical turk. In Proceedings of the SIGCHI conference on human factors in computing systems (pp. 611-620).
7. Howe, Jeff. Crowdsourcing: How the power of the crowd is driving the future of business. Random House, 2008.
-----
作者沈虹,毕业于美国伊利诺伊大学香槟分校传播学系,现任职于美国卡内基梅隆大学。她用社会学的方法研究新兴科技。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司