想转行数据科学,你需要做什么?

Oct 13, 2021 by Zhang in  Blog

2018 年初,我很想成为一名数据科学家。这个职位听起来很厉害,构建“机器学习模型”听起来很酷,还非常热门。如果你对以上观点产生了共鸣,那么我鼓励你继续读下去。

经常有人问我,一个人如何才能从会计或化学工程等完全不相干的行业转行到数据科学?

关于这个问题我想了很多。第一,当我想要进入数据科学领域时,我也经常问自己这个问题。第二,因为我认为大家对数据科学存在很大的误解——这也是本文的主要目的。

所以我想谈谈关于数据科学的一些真相。

1. 并非每个数据科学家都从事“数据科学”工作

“数据科学”这个术语涵盖技能和工作职责非常广泛,所以,一家公司的数据科学家可能和另一家公司的数据科学家完全不同。从我的经验来看,几乎没有数据科学家会把所有时间都花在构建机器学习模型上。许多数据科学家还会扮演数据工程师和数据分析师的角色。

2. 并非每个从事“数据科学”工作的人都拥有数据科学家的头衔

另一方面,我认识很多数据分析师和数据工程师,他们从事数据科学项目,例如预测模型、异常检测模型和推荐系统。

综上,你可以从中得到一些启示:

  • 1. 想想你对数据科学家角色的哪一部分感兴趣,而不是只考虑职位本身。你喜欢构建机器学习模型这个想法吗?你想钻研统计学世界吗?现在,我意识到,虽然我最初想成为一名数据科学家的理由可以理解,但这种想法也让我一开始就抱着错误的心态——意识到这一点,也会给你的职业生涯提供更多方向,使你的职业生涯变得更加有意义。
  • 2. 任何与数据相关的工作都是进入数据科学领域的良好开端。除了寻找“数据科学”工作之外,我还建议查看商业分析师、数据分析师职位、Python 开发人员职位、产品分析师职位等,因为你需要不停地提高核心数据科学技能,如 SQL 和 Python,同时也能为你自己创造许多机会。

下一步是什么?做一个项目。

如果你弄清楚了你对数据科学地哪一部分兴趣,接下来要做的就是做一个自己的项目。我个人认为,完成个人项目的价值是完成在线证书的 100 倍,因为它可以让你更好地为数据科学家的实际工作做好准备。

我也明白,构想出一个项目理念可能很难,所以,下面我会提供给你一些我的个人想法:

  • 如果你是一名篮球迷,你是不是可以收集数据,看哪些因素最能反应球队即将赢得比赛?是三分命中率最高的球队吗?是主场球队吗?等等…
  • 如果你喜欢烹饪,是不是可以找食谱的数据集(或收集自己的数据)并创建一个模型,补充缺少的内容。
  • 如果你想钻研深度学习的世界,你可不可以创建模型来检测某人是否戴口罩?

如果你还没有准备好做自己的项目……

如果你还没有准备好做自己的项目,以下步骤也可供你在实际操作中使用,你可以用来指导自己的学习:

  • 1. 从学习统计学开始

我认为统计学非常重要,因为大多数机器学习概念和数据科学应用都围绕着统计学展开。如果你不喜欢统计学,那数据科学可能不适合你。

  • 2. 学习 Python 和 SQL

你可以学习Python和SQL。如果你更喜欢 R 语言,那也可以继续,先我个人并没有用过R语言,所以我无法发表意见。但是,你越擅长使用 Python 和 SQL ,在数据收集、操作和使用方面就越容易。也要慢慢熟悉 Pandas、NumPy 和 Scikit-learn 等 Python 库。我还建议你了解二叉树,因为它是许多高级机器学习算法(如 XGBoost)的基础。

  • 3. 学习线性代数基础

当你处理矩阵的项目时,线性代数尤为重要。线性代数经常出现在推荐系统和深度学习应用中。如果你对这些内容感兴趣,请不要跳过此步骤。

  • 4. 学习数据操作

数据操作至少占数据科学家工作的 50%。更具体地说,你需要了解更多有关特征工程、探索性数据分析和数据准备的信息。

感谢阅读!

我希望我的这些见解可以帮到你!虽然这篇文章有很多个人观点,但我觉得很多人都会同意本文关于数据科学家的两个事实:

  • 1. 并非每个数据科学家都从事“数据科学”工作
  • 2. 并非每个从事“数据科学”工作的人都拥有数据科学家的头衔

希望你一如既往地在学习中取得优异成绩!:)

原文作者:Terence Shin
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/heres-the-honest-truth-about-making-a-career-switch-into-data-science-2e5a42d24879

数据科学家八大最常见统计面试题

Mar 28, 2021

统计学是数据科学的重要基础之一,在数据科学家的工作中发挥着重要的作用。因此,每一个数据科学家都必须拥有充足的统计知识。

如何准备商业分析面试的Case Study问题?

Sep 21, 2021

作为数据分析师或数据科学家,我们不仅需要了解概率和统计、机器学习算法、编码,更重要的是,我们需要知道如何使用这些技术来解决业务问题。

进阶为Sr. Developer的面试之路

May 25, 2021

高级开发者的面试是一个谜,而初级开发者的面试则是一部恐怖片。在初级开发者的面试中,会涉及到很多的算法。只有消耗大量的糖和咖啡因,才有可能在模拟面试中泰然处之。

Leave a Comment

Your email address will not be published. Required fields are marked *

Comment *