澎湃Logo
下载客户端

登录

  • +1

高考季:哪些专业未来更不容易被人工智能替代?

2023-06-24 11:10
来源:澎湃新闻·澎湃号·湃客
字号

从去年下半年到现在,短短一年不到的时间,人工智能出现了跨越式的发展。原本离生活还很远,感觉只能在手机上帮人问个时间天气的“人工智能”,突然变得非常跨界,大量AIGC式人工智能开始出现。画图的,写作的,做PPT的,生成视频的……对于很多人来说,人工智能已经大幅度改变了他们的工作方式和工作流程,也给目前正准备选择专业的高考生们提出了新的思考维度。

我选择的专业,会因为人工智能出现改变吗?这些改变会怎样影响我未来的就业呢?

这个问题极为现实。

比如一些语言类专业的学生就有这样的担心——目前许多翻译类的人工智能性能已经非常强大,之前只能做一些在线翻译,现在连同声传译,摄像头拍照翻译都能做到。设计、美术相关的专业,在Stable Diffusion、Midjourney和Adobe的压力下,也遇到了同样的问题。

当然,在目前的技术水平上,这些软件目前只能使用来满足不太复杂或者不是特别定制化的需求,因此对于专业中的顶尖人才来说,其工作暂时无虞。但对于专业技术能力一般的,占每个行业绝大部分的从业者来说,人工智能的产出效果正在实实在在地逼近甚至超过他们,而其价格和时间耗费却又要比人类从业者低得多。对于这些人来说,他们的工作岗位正在实实在在地被人工智能所威胁,甚至替代。

在之前的推送中,我们分析了什么样的职业可能会被GPT(们)影响以及替代,当时我们沿用了OpenAI对美国劳动力市场的分析方法,分析了中国的劳动力市场。在高考成绩即将公布的今天,我们再来看一看,哪一些专业的就业更容易被这类人工智能替代?

一,从16.4亿条招聘岗位中获取专业需求——每个专业的学生去向了哪一个岗位?

如何研究每个专业被人工智能所影响的程度呢?

有人可能会从专业的脉络、原理和产出上进行研究。比如我们前面举出的一些例子中,语言专业的可能会去翻译岗位,而翻译这一个行当会被人工智能影响;美术专业的可能会去设计岗位,而设计这一行当会被人工智能影响。这是从供给侧上判断。这都是从能力的供给侧和人工智能的发展趋势来判断的。

但是,每个专业的学生毕业后,会去哪一些岗位,哪一些职业,其对应关系真的会如此明显吗?我们手中正好有从2015年到2022年共8年16.4亿个岗位的招聘数据。在这些招聘数据中,有相当一部分会写出非常明确的专业需求来,一个典型的例子如下:

前端开发工程师 15-20K·13薪

1、计算机相关专业本科以上学历,4年及其以上工作经验;

2、熟练掌握HTML5、JS、Jquery、React等前端技术;

3、熟悉jQueryMobile、AngularJS、VUE等常用的JS框架;

4、有响应式布局开发基础,如:Bootstrap;

5、有良好的代码习惯,要求结构清晰,命名规范,逻辑性强,代码冗余率低;

6、有大型互联网(移动互联网)WEB开发经验者优先。

我们将16.4亿条招聘岗位的专业需求,和中国的本科、高职、高专的专业列表做了一一匹配,其中约2亿条招聘对专业有着明确需求。相对供给侧来说,我们希望从需求侧来研究不同的专业在劳动力市场上的位置是怎样的。

本科专业目录

举个例子,对于一个“外国语言文学类”专业的毕业生来说,他的毕业去向可能会在哪里?

我们使用招聘数据随机抽取了几条专业需求为“外国语言文学类”或者其下具体专业细类的招聘广告,他们的具体要求如下:

外贸单证员:

1.负责公司一切与储运有关的运费管理;

2.负责公司一切与储运有关的供应商管理;

3.负责协调各个环节,保证公司储运安全顺畅的进行;

4.负责报关、清关、商检、结汇所需的全套单据资料的制作及领取;

5.负责有关纸质单证的申领和保管;

6.负责妥善管理文件,进行分类、归档;

7.负责海关、商检、保险、产证等有关单位的年检或合同续签、续费工作;;

8.;负责公司交办的其他事宜;

任职要求:1.工作认真,细心,为人谨慎,有耐心;2.思维清晰,做事有条理,沟通能力,应变能力强;3.国际贸易或英语相关专业,英语四级及以上;;4.有外贸单证员资格证书、报关员证的优先考虑

雅虎外贸业务员:

1、利用雅虎网店上传产品,邮件对应,商品发货;

2、按时完成公司、部门制定的销售目标;

3、配合公司做好售后服务;

4、完成上级领导安排的其他工作。

任职资格:1、日语相关专业,或者日语交流良好,男女不限,30岁以下;2、有梦想、有勇气,敢于挑战高薪;3、具有强烈的责任心,团队协作意识强。

留学文案:

1.负责翻译材料,对英语文件的翻译审核、校队;

2.负责英语文书的写作以及修改;

3.为学生翻译,准备全套签证材料;

4.对客户提供的材料进行真实性调查;

5.与客户沟通了解学生申请签证所需相关背景情况。

任职要求:1.本科以上学历,英语相关专业,专八或者同等水平,有很强的英语笔译能力;2.有一年以上英语文案相关工作经验优先;3.优秀的英语翻译能力,熟练掌握办公软件;4.具有较高的素质,能够迅速掌握公司的业务相关知识;5.具备较强的学习能力和沟通能力;6.工作细致、认真、有责任心,热爱留学行业;7.欢迎英语专业,热爱文书写作的优秀应届毕业生应聘。

可以看到,这三个岗位都在专业需求中列出了对于英语、日语的专业要求,但是在具体工作中,涉及到语言的部分其实很少。

外贸单证员,虽然需要英语,但其实大部分工作都是各种具体的流程处理和关节打通。

外贸业务员,虽然需要日语,但却更像是一个完整的销售人员,售前售后都得一把抓。

留学文案,虽然对英语的要求更高,但本质上是在各种了解客户需求,以及与各方做沟通和调查。

所以,职位对专业的需求,和这个职位真正在做的工作,可能完全不一样,甚至差十万八千里。

大家都是去做销售,这项销售工作可能只有5%的工作和外语的听说读写相关,而就是在这5%的工作中,外语专业的毕业生可能可以替公司省1块钱,快1分钟,沟通起来成单率高那么一点点。

好的那么就是你了,外语专业的毕业生!

限定专业,对于绝大部分岗位来说,并不是该岗位确实需要大量专业知识,而是需要在更低的用人成本上,保证这个岗位的某一项任务的某一个环节上,最终应聘者的表现更好的概率更大一些、成本更低一些。

在这样的供需背景下,选择某一个专业,不是选择了它的专业知识,而是在广泛的职位需求组合中找到一个相对更大的公约数,而如果你的专业,能在这个公约数上,比起其他人存在一些比较优势。

是的,人工智能确实在许多场合已经非常优秀。但在大量工作中,人工智能还是只能承担一小部分任务,而这一小部分任务是被链接在各种任务组合当中,无法独立出来。此时,某一个专业的毕业生只要在某一个环节存在一个微弱优势——哪怕是在这个领域的人工智能的利用得比别人更熟练一些,这个优势也会在高度同质化的岗位需求以及海量的应聘者供给的今天被成倍放大。

二,从每一条职业需求中获取具体工作任务(考生可以跳过)

评估一个具体的职位的各种性质,是一件很困难的事。一些岗位的人口多,收入高,声音大,我们可能相对比较熟悉。但如果要评估另一些岗位,比如我们前文举例中出现的一个岗位——外贸单证员——有多大可能性会被人工智能的发展所影响?那行业外人士可能根本难以说出个一二三,因为大部分人不知道这个岗位具体是做什么的。

只有当我们将“外贸单证员”这一项工作的具体职责一项项剖开后,拆解成一个个工作任务后,人们才能对这个岗位稍微有一些实感。

在之前那篇文章中,我们用了下图这样的方法来拆分职业。一个职业可以按照一定标准被拆分成具体的任务和具体工作,然后使用GPT来判断每一项具体工作被替代的可能性。

拆分职业

由于时间所限,当时这一项工作基本上是完全复制了openAI的做法,即使用O*NET的数据库,将不同职位拆分成具体的task(任务),再把每一个task(任务)给拆分成具体工作(detailed working activity)。

我们用O*net的数据,将中国的职业映射到O*net,再分拆成19265条工作任务和23534种工作内容。

而这个步骤对于中国劳动力市场来说,其实存在一系列不太合理的假设:

1,O*NET给出的工作任务拆分,是针对美国劳动力市场进行问卷调查得到的,这是一个基本保持静态的数据库。而这个拆分并不一定适合中国。同一个岗位,比如都是销售,都是设计,都是程序员,在美国的具体工作任务和在中国可能是不一定相同的。

2,就算大家都是程序员,在北京、上海和三线城市,在大厂和外包公司,在初创企业和成熟企业,具体工作是一样的吗?显然也是有差别的。

我们需要更好的方法来拆分每一个岗位的具体工作内容。

而每一个招聘广告的招聘需求,就是一个天生已经做好的工作拆分。比如在上面引用的招聘广告中,一个外贸单证员的工作内容包括这些:

1.负责公司一切与储运有关的运费管理;

2.负责公司一切与储运有关的供应商管理;

3.负责协调各个环节,保证公司储运安全顺畅的进行;

4.负责报关、清关、商检、结汇所需的全套单据资料的制作及领取;

5.负责有关纸质单证的申领和保管;

6.负责妥善管理文件,进行分类、归档;

7.负责海关、商检、保险、产证等有关单位的年检或合同续签、续费工作;

8.负责公司交办的其他事宜;

不过,如果我们直接把这些文本作为每一个工作的任务来进行分析,那么16.4亿条岗位中,可能会存在至少5亿条不同的“职责”。

但是,如果我们把这些文本,变成一条条动宾结构再来处理,会怎么样呢?

比如第一条职责:负责公司一切与储运有关的运费管理。实际上其中心的动宾结构就是“管理-运费”。

第二条职责:负责公司一切与储运有关的供应商管理。其实中心的动宾结构就是“管理-供应商”。

第三条如果用动宾结构来总结,就是“协调-环节”、“保证-储运”。

在成千上万个外贸工作人员中,可能存在成千上万种和储运相关的具体工作职责,但其中相当一部分在抽取了具体动宾结构后,就能得到“保证-储运”这一条。复杂而多样的职业职责文本,经过这样的处理,变得更加标准,其分析数量也下降了至少100倍。

我们对招聘数据进行了这样的处理,最终获得了约80万条动宾结构,而其中出现频率最高的10万条就占据了所有岗位所有职责的93.2%,频率最高的5万条就占所有岗位的90%左右。

其中出现频率最高的20条动宾结构如下所示:

动宾结构高频组合

光是看不同的职业的动宾结构变化,其实就能对中国的经济形势变化有所判断。比如从2015年到2022年,销售代表的工作内容出现了什么变化?从动宾结构的抽取结果看,结果如下:

动宾结构反映销售代表的工作内容变化

随着经济增速的放缓,需求潜力开发已经基本完成,即使同样叫做“销售代表”的一个岗位,其具体工作内容也随时间出现了不小的变化,从向外扩张发展新客户开拓新市场,变成了维护和现有客户的关系。

这部分工作,为我们下文的人工智能暴露计算打下了良好的计算基础。

三,什么样的工作任务更容易暴露在人工智能的发展路径上?(考生可以跳过)

评估每一个具体的工作任务是否会受到人工智能的影响,我们依然要使用GPT-4。

现在看来,人工智能多模态地存在于各种平台上的日子,眼看着就越来越近了,人工智能的特点,其实就是用现存知识,模拟了人类大脑“慢思考”的过程。考虑到这一点,我为GPT-4提供了这样略显激进的prompt——

**背景:你是一名职业发展评估专家。随着人工智能的发展,我们试图理解它对不同行业和职位的影响。你将评估一系列动宾结构所代表的工作任务,在同等完成情况下,人工智能参与时可被减少的人类工作时间,即人工智能可以替代人类劳动的程度。评分范围为0-5,其中5表示此任务只能由人类单独完成,人工智能的参与不能减少人类劳动时间;0表示此任务已经能够由人工智能单独完成,人工智能可以替代100%的人类劳动时间。

每一个技能都用动宾结构来表示,例如“开拓-市场”表示开拓潜在市场,“收集-信息”则表示搜索可能得信息。例如,"翻译-文章"可能得到较低分数,因为人工智能已经能够进行高质量的文本翻译。相反,"维护-关系"可能得到较高分数,因为它涉及到人际交往和情绪处理,这是人工智能难以模拟的。

你所考虑的人工智能发展背景更倾向于替代人类思考功能,即“思考脑”。若是一项任务只需要人类用到眼睛、耳朵输入信息,再结合推断、分析、总结、撰写、编辑等大脑的“慢思考”步骤,并用代码、文字、语音、图片、音像或者视频的方式输出结果,那么这项工作的人类劳动便有较高可能被人工智能所替代。如果一项任务更多使用到人类大脑思考功能以外的其他感官和肢体的任务(例如需要手、脚和皮肤触感)以及在处理信息时使用到“反射脑”与“储存脑”(例如抚触、共情、反射、回忆),则该任务的人类劳动更难被人工智能替代。

但也有一些动宾结构并没有实际的职业意义,例如“使-顾客”,“有-感”,这并不是一个具体的职业任务,也并非对该岗位的具体要求。对这些动宾结构,请不要评分,不需要返回任何数值。

**任务:请对以下每一条动宾结构所代表的工作任务按照上面的背景要求评分,将能够评分的结果以“id,评分”的格式返回,id和评分中间用逗号分隔,一行一条。

使用GPT-4的API对于出现频率最高的前5万条动宾结构进行打分后,下表列出了GPT-4在我给出的prompt下,打分最高和最低的动宾结构。

受人工智能影响最大与最小的动宾结构

说实话,对于GPT-4的打分结果,左边的这一列,受影响最小的动宾结构,并不令人觉得很意外。而右边这一列,GPT-4还是在用自己的理解,给我们提供了一个可能性不小的未来。

四,不同专业的人工智能暴露率

前面的三项工作中,我们将每一个具体的工作岗位首先和专业列表进行了映射,再把每一个工作岗位拆分成了不同的工作动宾结构,最后使用GPT-4对于每一项动宾结构进行了打分,看这项具体的工作任务有多大可能性会暴露在人工智能发展的路径上。

接下来,我们将三个结果合并在一起。

首先,根据每一个岗位的动宾结构打分,再将0-5分换算成一个0-1的人工智能暴露系数。(之所以用0-5分,而不直接用0-1分,是因为GPT-4似乎不太擅长给出小数)

接下来,给每一个岗位的专业需求赋予权重——如果这个岗位只要某一个专业,那么权重为1。如果这个岗位需要N个不同的专业,那么每个专业的权重为1/N

最后,对于每一个专业,加权平均计算它在所有岗位中的平均暴露系数,得到这个专业的人工智能暴露系数。下表列出了在对应招聘岗位较多的本科专业中,20个暴露系数最高的专业和暴露系数最低的专业。

人工智能暴露程度最高与最低的专业

这个结果,可以说在一定程度上是较为出人意料的。

比如同样属于经济学大类的金融学在表格左边,而财政学却在表格右边。

比如许多医学大类专业,包括口腔医学,中西医结合,心理学,中医学,动物医学等,出现在了表格左边。但药学类、公共卫生和预防医学类,却又出现在了表格右边。

这是为什么?

关键在于,GPT-4会对于每一个岗位的动宾结构进行打标,而需要每一个专业的岗位,他们的责任分布和动宾结构,是完全不一样的。

从医学大类的分布来看,越是在左边,暴露率更低的医学大类专业,都是越需要和病人打交道,并且抚慰病人痛苦的专业。甚至包括动物医学,因为需要动物医学的许多岗位都是宠物医院的医生,他们面对的“病人”可能并不会表达心情,但是这些病人的主人是非常需要安慰的。

而越是在右边,暴露率更高的医学大类专业呢,不管是药学还是预防医学,相对来说与病人大量交流的频率就要低得多了。在这张表格中,还没有出现的还有临床医学、基础医学、法医学,这几个医学专业的人工智能暴露率从低到高,也与我们的直观感受相吻合。

将所有本科专业的暴露率和2021年的平均工资放在一张散点图上,可以看到,两者出现了较强的相关性。毕业后去向岗位平均工资越高的专业,其岗位的人工智能暴露率也越高。

专业毕业起薪与人工智能暴露程度

工资是由劳动生产率确定的,而劳动生产率,在很大程度上是由每个人的专业知识确定的。脑子更聪明,更努力,专业知识掌握得越多,经验越丰富,其工资也越高。

但目前的人工智能,正是在挑战这一点。如果说专业知识和经验之前是一个山峰,目前的人工智能的发展趋势,就是要削平整座山峰——但还留下山顶那些,因为山顶代表了人工智能知识的边界——在山顶以下,人人平等。

所以我们才会看到,医学的真谛“总是安慰,常常帮助,偶尔治愈”中,“总是安慰”会变得越来越重要,心理学,口腔医学,中医学,动物医学,更多地处在了暴露率最低的区间。更多负责“偶尔治愈”的基础医学和临床医学出现在了暴露率中等的区间,而以“治未病”为天职的的药学、预防医学正处在高暴露区间。

所以我们才会看到,同属经济学大类,金融学的暴露率较低,而财政学暴露率较高。因为“编制-预算”这样的动宾结构被GPT-4列为最容易替代的工作内容。而在最难替代的动宾结构中,赫然出现了“引入-资金”。

在专业知识之外,人和人的交流变得前所未有的重要。现在,如果你想成为一个不与客户和同事打交道的专业人才,那么你最好做到顶尖。如果做不到顶尖,那么你至少得有客户、渠道或者资源这些人工智能更难替代的东西。“人际交往的事情,你们不用管,你们就负责研究和开发”这样的日子,对于大部分专业人才来说,一去不复返了。

五,为了帮助考生选专业,我们做了一个小工具

AI带来的变化,目前可能只是出现在了地平线的远端。但这一届高考考生毕业时,他们可能就不得不面临更大的挑战。因此,选择专业也就成为了更重要也更为复杂的一件事。

我们在微信小程序“数据团+”中(是的,就是去年给出了各城市疫情预测的那个小程序),便更新了这样的内容。填入你的分数和科类,你可以看到2022年时你的排名可以去向的专业。

点进每一个专业的“趋势/薪资”页面,你将能看到每个学校、专业从2016年开始的排名变化。越高的排名表示录取名次越靠后,即趋势上越容易被录取。

在页面下方,还能看到每一个专业的趋势变化和薪资变化。

这里的红绿色柱状图,表示的是经济学专业总体的录取趋势,这个数值是根据所有学校的所有经济学专业的专业百分位排序计算的,红色柱越高,表示该专业在每个学校的录取排位名次在该学校的总位次的百分位中上升,即热门程度上升;绿色柱状图代表了相反的趋势。

而薪资则是使用16.4亿个带专业需求的岗位工资平均计算的,从这里也能看到不同专业的绝对工资和相对工资变化。我们仍在用招聘数据复核计算各专业的详细人工智能暴露率,未来两天会更新到小程序中。

希望小程序提供的数据,能够帮助各位高考考生结合学校、专业的位次变化以及专业总体的报录趋势、薪资趋势和人工智能替代等信息,选择适合自己的专业。

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈