数据科学家在21世纪被人们称作最性感的工作,而且,社会对这个岗位的需求还在不断地增长。

  • 你在追求数据科学的工作吗? 
  • 你知道2021年就业市场需要哪些编程语言和技能吗?
  • 你知道你目前的技能可能适合哪些职位吗? 

希望你能在阅读本文后能找到一些答案。

我开始这个项目的原因是什么?

“数据科学家”这个职位名称在2015年被发明出来。即使经过了5年,我和朋友们也经常看到和听到在同样职称的情况下,工作内容和职责的巨大差异。观察这些工作差异的巨大,以及这些职称有没有被更详细地定义,是很有意思的。

据美国劳工局预测,数据科学家的职位将从2019年的33,200人增加到2029年的43,400人。对于现在和将来的求职者来说,了解最新的求职市场和要求会很有帮助。

职位中常见的关键词是什么?

显然是“数据科学家(Data Scientist)”。数据中还流行着其他的职称,比如“ 数据分析师(Data Analyst)”,“ 数据工程师(Data Engineer)”。我们在这之后可以来比较一下这些职称。

这些职位来自哪些行业?

这个数据集拥有很多来自以下行业的职位:信息技术(n = 1764; 33.7%)生物技术与制药(n = 914; 17.4%)商业服务(n = 829; 15.8%)财务(n = 295; 5.6%)卫生保健(n = 269;5.1%)。要记住的是,5500个样本可能不足以代表整个工作群体。因此,这里的数据可能因为它的来源而更偏向于这些部门。

最受欢迎的语言和技能是什么?

总体而言,Python,Excel,SQL是最常被提及的三大语言和技能。但是,我们知道这个数据集里面有数据科学家,数据分析师和数据工程师。我们可以进一步研究不同的职务是否需要不同的技能。

数据科学家,数据工程师和数据分析师都分别在做什么?

对于不熟悉它们之间差异的人,以下有关于每个职称内容的说明。如果你清楚它们的区别,那么可以跳过这一部分。

Glassdoor对数据工程师的职位描述:

数据工程师的主要任务是将数据转换为容易分析的格式。为此,他们通过开发,维护和测试用数据生成的基础架构来实现这一目标。数据工程师通常和数据科学家紧密合作,主要负责为数据科学家设计解决方案,帮助他们完成自己的工作。

Glassdoor对数据科学家的职位描述:

数据科学家运用他们的分析,统计和编程的技能来收集,分析和解析大型数据库。然后,他们使用这些信息来开发数据驱动的解决方案,来应对棘手的业务挑战。数据科学家通常来自统计学,数学,计算机科学或经济学的学位。数据科学家具有广泛的技术能力,包括:统计和机器学习,编码语言,数据库,机器学习和报告技术。

Indeed对数据分析师的职位描述:

数据分析师主要是通过研究数据来帮助解决业务问题,例如,如何优化利润,如何最大程度地减少周转率,以及如何简化物流流程。数据分析师着眼于复杂的信息集来得出结论,他们还可能会指引收集新数据和报告新数据的过程。他们帮助确保那些花在优化上的任何金钱是谨慎的,付出的努力是值得的。他们可以在金融,市场营销,医疗保健和制造业等行业工作。

简而言之,数据工程师会确保数据可供数据科学家和分析师使用。数据科学家和分析师都可以分析数据,但数据科学家需要更高级的编程,统计和机器学习。

作为数据科学家,工程师和分析师,是否需要不同的技能?

为了回答这个问题,首先,我根据职称是否包含“数据科学家”、“工程师”或“分析员”对职位进行了分类。我还过滤掉了一些包括两个以上职称的职位,因为它们可能会造成混淆。

答案是肯定的,下图展示了数据的结果。82%的数据科学家,70%的数据工程师和34%的数据分析师需要使用Python。数据科学家明显更需要使用Python(82%;卡方独立性检验p = 1.1E-140)。数据分析师需要更多的Excel技能(66%; p = 5.9E-45)。所有人都需要SQL技能,但没有发现显著差异(〜60%;p = 0.3)。数据工程师最需要Spark(83%; p = 2.6E-253)。数据分析师需要更多Tableau技能(34%; p = 1.0E-36)

每个职位的前五种技能

问题是,我们仍然可以发现一些雇主可能并不了解职称之间的差异。例如,有1%的分析师需要了解深度学习框架(PyTorch,Tensorflow,Keras);4%的分析师需要了解C / C ++;10%的工程师需要了解Tableau。如果你找到了类似这样的职位描述,他们可能暗示了这个雇主并不知道他们想要什么样的人,或对这一领域的了解并不够。

有趣的是,我发现,对于每种技能,数据科学家通常在这三个职称的技能百分比中排名第二高。这可能是因为数据分析师和工程师的工作比数据科学家更细化而导致的。

这些工作分布在哪些州?

  • 1.加利福尼亚(1,054)
  • 2.马萨诸塞州(794)
  • 3.华盛顿(593)
  • 4.纽约(472)
  • 5.弗吉尼亚州(378)
  • 6.伊利诺伊州(261)
  • 7.德克萨斯州(215)

这些工作在哪些城市?

热门城市有:西雅图,纽约,波士顿,旧金山,剑桥,华盛顿特区,以及芝加哥。有意思的是,这个数据集里有91个(1.6%)远程办公岗位。而令人惊讶的是,超过一半的职位是被分散在美国各地的。

欢迎随时在下面留下您的意见和建议。如果你喜欢这篇文章,请点赞并分享,谢谢。

原文作者:Jack Chih-Hsu Lin
翻译作者:Jiawei Tong
美工编辑:过儿
校对审稿:Dongdong
原文链接:https://medium.com/@chihhsulin/5-500-data-scientist-jobs-report-2020-adefe1d364d3

如何在2022年成为全栈数据科学家?

Feb 26, 2022

在 2021 年之前,数据科学家的职位快速增长,特别是在新冠疫情高峰期间,许多行业都在利用数据科学的力量为其产品带来最大价值。

被AI影响的科技人员如何进行职业规划?

Mar 09, 2024

尽管未来几年,越来越多的软件工程师、程序员、手工测试人员、技术支持人员和数据分析师的工作可能会被人工智能(AI)颠覆。

人工智能创新将如何为企业带来优势

Sep 16, 2024

人工智能虽然仍处于发展的早期阶段,但我们已经看到了许多积极的进展,这些进展有助于企业及其员工更加智能、高效地运作。

Leave a Comment

Your email address will not be published. Required fields are marked *

Comment *