- +1
为什么很多人对数据科学工作失望了?
来源:Medium
作者:Luna、笪洁琼
数据科学最近火到几乎全民皆知。入门看上去很容易,把数据和模型还有代码稍微研究一下,在代码没有Bug的情况下,基本上都能出结果。
但问题就在于,模型跑出来的结果到底评价如何?刚入门的人可能就会比较疑惑,评价结果需要通过长期的研究经验才能判断,跑出来的结果在什么情况下,趋于哪个位置是比较合理的。
Reddit上最近有一个关于数据科学方向的工作的帖子,获得了不少网友的热情回应,也表达出了很多人对数据科学的爱恨交加。
不少看似简单的经验,都是经过大量的重复而繁琐的工作得到的,而如果你不考虑从最基础的工作进行沉淀和积累,那么就难以成为有经验的人,自然就与数据科学的研究产生了隔阂。
接下来就让文摘菌给大家总结一下,数据科学工作的失望来自于哪些因素?
数据科学曾是最受喜爱的热门职业之一,而现在,这个趋势正在改变。
较早的时候,几乎每个计算机专业的学生都想从事数据科学领域的职业,该领域也吸引了来自许多其他专业的学生。现在,尽管围绕数据科学的炒作仍然存在,但并非所有人都可以轻松获得相关的职位。
过去的二十年对数据科学界来说是一场革命。这二十年来的发展是惊人的,影响所有传统领域、影响了很多人。
数据科学的应用已经覆盖了所有行业,理论上,在市场上应该会看到源源不断的对数据科学家的需求。
但是如今,这个趋势正在发生变化,市场的需求不再像以前一样。即使需要数据科学家,很多求职者也缺乏技能或经验。当看到数据科学领域逐渐失去魅力时,我试图列出所有我能想到的潜在原因。
1.人们无法一毕业就立刻在这一领域找到工作
大学毕业后,应届毕业生希望能立刻找到数据科学家的职业。但是在大多数情况下,雇主愿意招聘的数据科学家,至少需要2至3年的工作经验。因此,人们不能直接以数据科学家的身份开始工作,而必须从别的领域方式开始自己的职业生涯。
公司不准备将时间投入到新来的人才上,而是希望招入在该领域已经具有出色技能和经验的人才。虽然几乎所有的高科技公司都有自己的数据科学部门,但其他没有此部门的公司,却只能招聘有丰富业界工作经验的数据科学家。
我认为,只有一种方法可以帮助他们:在他们学习期间,同时进行实习,来积累经验以满足公司的需求。
2.人们不了解数据分析师,业务分析师和数据科学家之间的区别
另一个主要原因是,当今的数据科学爱好者,不知道该领域中不同工作细分之间的区别。他们所有人都希望获得“数据科学家”的头衔,却不知道数据科学家的实际工作是什么。他们错误地将数据分析师,业务分析师和数据科学家视为相似的工种。
在不知道自己想从事什么工作的情况下,就无法胜任工作。
3.人们发现数据科学太容易了
人们直接开始研究算法,调整数据的方法,但是他们不考虑的是算法背后的数学。凭借入门级别的编程知识和机器学习算法的知识,他们便认为自己已准备好面对现实世界中的问题。
人们通常会忽略统计学和模型背后的原理,这是真正意义上需要大量付出才能理解的数据科学的垫脚石,因为他们觉得它无趣。数据科学本质上,是需要人们不停学习的,一个发展不会停滞的领域。在过去的2-3年中,自然语言处理取得了巨大的发展,在这个领域人们必须随时了解最新的模型。
人们误以为数据科学很容易,这是因为他们没有处理现实数据。在教育系统中,他们花了很多年学习的时间,一直在处理结构化数据或一些可供人们学习的预处理过的数据。
然而,现实世界中几乎99%的数据都是非结构化的。在业界,数据科学家需要花费大部分时间对数据进行预处理,才可以从数据中提取有意义的信息。
4. AutoML正在使人们找到工作的道路更加艰难
科技巨头Google,Microsoft推出AutoML之后,就震惊了有抱负的数据科学家。公司对数据领域的兴趣和好奇心,逐渐演变成了对AutoML的投入和期待,而数据科学家开始担心自己会因此失去工作。
AutoML自动化了将机器学习应用于数据集的这个过程,它也可以预处理和转换数据。与此同时,AutoML涵盖了从处理原始数据到部署机器学习算法的完整流程。
AutoML擅长构建模型,但是在预处理方面,它们暂时还无法替代人类,进行准确标注分类。由于数据科学家的主要工作,在于对数据进行预处理,所以显然的,到目前为止,AutoML不能替代人类数据科学家。
尽管AutoML降低了成本这一事实不容忽视。在美国,数据科学家的平均年薪约为12万美元,而Google和Microsoft AutoML的使用成本约为4千美元至4万美元一年。
由于现实世界中的数据是高度非结构化的,需要大量的预处理,我们并不能否认数据科学家在预处理数据方面的优势。
有太多东西要学,而没有人愿意做艰苦的工作。对于普通人而言,他们很难从基础知识入手,并在该领域表现出色:这将花费大量时间,并且需要人们又足够的耐心。数据科学的领域范围很广,但是行业中缺乏具有实际技能的优秀从业人员这一点,导致数据科学里最有前景的工作内容从数据科学手中流失。人们正在远离它。
相关报道:
https://towardsdatascience.com/why-is-data-science-losing-its-charm-3f7780b443f5
https://www.reddit.com/r/datascience/comments/gv3i57/so_many_people_disappointed_with_their_jobs_you/?utm_medium=android_app&utm_source=share
原标题:《为什么很多人对数据科学工作失望了?》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司