放弃一份高薪的工作,去做自己感兴趣的事情,这是一个艰难的决定。我们被各种各样的事情束缚着,这些事情可能会让我们无法转行,让我们在目前的道路上感到安全。
但是要成为一个梦想的追随者,你需要走出自己的安全区去探索。
我对数据科学的兴趣和热情在2016年底开始了,在此之前,我从未听说过数据科学这个领域。
艺术家不仅要训练自己的眼睛,还要训练自己的灵魂。
上面这句话也适用于任何有抱负的数据科学家。我的数据科学之旅是因为Blogspot而开始的。
我对2016年美国大选结果公布前几天发表的一些意见一致的博客文章非常感兴趣,这篇博文称,唐纳德·特朗普将赢得大选。该帖子声称已经用推特情绪分析预测了它。我并没有真正关注这篇文章,起初以为这是我们日常生活中遇到的一些随机的帖子,但当特朗普的胜利被确认后,我又找到这篇文章,重新试着理解了twitter的情绪分析。(这篇文章看起来很容易读,但在2016年我试着在twitter上进行情绪分析时,就不是这样了)。
我是一个没有任何辅助的人,只是站在喜马拉雅山下,渴望触摸它的顶峰,没有辅助工具。我搜索了很多关于数据科学的文章,发现使用的是“R”语言,于是我开始学习R并尝试进行这样的分析。这是容易的吗?一点也不。一个人能在几天内精通武术吗?不能。即使没有一点领域知识,单凭热情做一个数据科学项目也是很复杂的,但出于好奇心,我开始探索理论概念,并一直在学习R。
了解R和python技能并不意味着你就是数据科学家!
要将头脑中的逻辑转换为系统中的工作程序,这些语言是有帮助的,但是数据科学的概念呢?比如什么算法适用于什么情况,如何处理时间序列数据?如果问题中存在随机性,该怎么办?检验假设在总体上的显著性的统计程序是什么?如何进行动态价格优化?
那么,从哪里开始学习数据科学的概念呢?从统计学课程或机器学习的基础知识来看,这是最大的难题。我认为仅学习Python和R是不够的,对了解数据科学的概念也没有帮助。但是,我还是不满意,总感觉缺少了一些东西——网络课程简单、不详细。所以我决定攻读数据科学专业的全日制硕士学位,这将给数学和机器学习带来更多的权重。要把数据科学从基础知识学习到核心知识,既需要时间,也需要努力。所以我决定辞掉工作,寻找一所能够满足我对数据科学知识渴求的大学。
要想了解这些概念,需要全身心地投入到数据科学领域的学习中去。在熟悉了这些数据科学概念和编程之后,从数据中获益就变得简单多了。要开始学习基础知识,关于机器学习和数据科学的在线课程就足够了,但其中会缺少更大的部分:统计、数学和数据可视化。
在线课程就够了吗?
相信我,你肯定不想在Facebook上发这样的帖子。数据科学领域包含了大量的技能集合,包括统计学、数学、机器学习、数据库、深度学习等等。我很感激自己选择了攻读能传授数学、统计、机器学习等更多技能的硕士学位……在行业中,不仅仅是python和R能在每个场景中使用,Pyspark、Hadoop以及许多基于云的服务和不同类型的数据库系统也被使用。随着新工具的出现,数据科学领域也在不断发展。要想在科技行业谋得一份职业,你需要了解所有这些趋势概念的概念。
我选择这所大学不仅仅是基于它的声誉,也是基于它所教授的课程。在两年的教育中,你不会想每周至少有三天在家闲着吧?
陶罐的形状取决于陶工
我选择了一门课程,它将成为我的陶工,将我塑造成可用的工艺。我想要的课程在大数据、SAS、高级可视化、关系数据库、OLAP立方体、高级数据库、非关系数据库、优化(确定性、随机)、Monte Carlo技术、启发式、元启发式、约束编程、机器学习、时间序列分析和预测方面提供了坚实的基础。作为一名教师,我想了解这个领域的许多学科,所以我决定加入一个课程,会教授所有的这些概念,这些概念在数据科学家的生活中非常重要。
你的动机是什么呢?你想学什么?如果你的目标只是成为一名机器学习工程师、数据工程师、数据科学家、商业智能或数据分析师,那就明智地去选择课程和大学。
我辞掉月薪2.2K美元的工作,全职学习,是不是太蠢了?
薪水不错,但辞职是一个复杂的决定,对学习数据科学的渴望和热情先于我从薪水中获得的舒适。所以我在经济上和心理上都做好了准备,准备在法国学习两年的数据科学。
不要抱着“机器学习和数据科学是最酷的热门话题,一旦你完成了教育,你就能赚更多钱”的心态进入这个领域。培养对数据的热情,处理数据的方法不止一种,而是多种多样。因此,除非产生了热情,否则很难从多种角度看待数据和方法。在这个领域总是有新的东西要学习,因此,提高你的思维能力以适应不同的技术和工具。
那么我作为数据科学家的生活如何呢?
自主工作和团队合作的能力,与不同年龄段的人打交道的能力,研究方法的知识,快速理解研究论文和研究领域的能力是教师的特殊素质。我喜欢我对数据科学的热情,每个数据都不一样,解决每个问题的方法也不一样,每次看到新的数据和解决问题的新方法都会给我带来快乐。只有当你对这个领域有热情时,这种兴奋才会到来。揭开数据背后隐藏的真相,建立一个无需显式编程就能学习的系统,这是一个非常有趣的工作领域。
作为一名数据科学家,我首先看到的是,数据科学是一个迭代的过程。创建的单一解决方案永远不会让你和客户满意。通过对问题的各种方法反复迭代,可以找到最佳的解决方案。一个人不仅要准备好会机器学习或数据分析,还要准备好使用javascript开发API的交互式仪表盘的技能。帮助系统处理数据集的一种常见方法是“CRISP”跨行业标准平台。遵循“CRISP”的指导方针有助于组织和实现构建数据科学项目的目标。强化学习,计算机视觉,基于转换的模型,流媒体分析,在线学习模型,等等都在创造奇迹,有很多东西需要学习,所以数据科学家的旅程不会仅仅停留在毕业进入一家公司,而是继续不断的学习。
武士是通过大量的训练和实践练成的而不是天生的。追随你的梦想和热情,就会成功的,坚持不懈地学习吧。
非统计或非计算机领域的数据科学家,请记住,要想成为一名数据科学家,需要像武士一样培养热情,并经过严格训练,才能成为一名熟练的数据科学家。
原文作者:Induraj
翻译作者:过儿
美工编辑:过儿
校对审稿:Dongdong
原文链接:http://fanyi.youdao.com/?keyfrom=dict2.top