面试中,面试官总是会问你“有没有什么问题想问的”。你可能和我一样,因为脑子短路而问了一些非常傻的问题。比如,有一次我太紧张了,我问:“到办公室需要多长时间?”
意料之内,我没有拿到那份工作的Offer。当然,其他应聘者也给我说过一些他们干过的“傻事”。
但你需要记住,没有所谓“愚蠢的”问题,但在面试过程中,有些问题更能帮到你。你可能没有考虑过下面这五个问题,但如果你正在面试数据科学或机器学习方面的工作,你真的应该思考一下。
公司的机器学习成熟度如何?
如果你想评估某公司在机器学习方面的成熟度,这个问题很重要。你可以把这个当成一个热身问题,在今后的工作中进一步探讨。
成熟的公司可能会描述现有团队、基础设施和工具、以及正在进行的项目。如果你得到的答案非常含糊不清,这可能表明该公司正处于机器学习早期阶段。
你可能不在乎公司到底处于哪个阶段,但你应该明白你将要面对的是什么。
如果你是第一个接手这份工作的人,那么你的工作难度将会非常大。如果你几乎没有什么工作经验,那你要谨慎一些了。还有一种可能性是,该公司正在招聘分析师,但出于市场需求,将该职位称为“数据科学家”。在这种情况下,你可以提这样问来了解详情:
公司目前是否在构建机器学习模型?
如果答案是“Yes”,表明该公司还是很成熟的,你还可以问清楚公司都构建过哪些模型。
公司目前拥有哪些
用于机器学习的基础设施和工具?
你必须知道你可以使用哪些工具。如果你提出这个问题,答案其实很简单,但我面试过的大多数人都没有想到这个问题。想象一下,你正参加数据科学岗位的面试。如果我告诉你,我们公司主要使用 Office 2010 Excel 电子表格,而且不打算更换工具,你还会愿意来我们公司工作吗?我猜你不会,所以不要等到你被录用才知道。
没有合适的工具,就无法成为优秀的机器学习工程师或数据科学家。我们很多人选择这条职业道路是为了做出点成绩,如果没有合适的工具和基础设施,会受到许多限制,甚至可能会遭受挫折。
做数据不要只想到Python。
公司还要有Hadoop 或 Spark等框架,一些适合运行计算的硬件,甚至更好的启动和运行云平台。
AWS、Azure、GCP 并不是那么重要,所有云平台都可以运行机器学习。
你需要一个舒适的地方来构建原型,因此,良好的实验室环境必不可少,可以是云端实验室,如 Data Bricks、Amazon Sagemaker ;或来自 Dataiku、SAS 或 Data Robot 等公司的本地解决方案。
如果没有合适的工具,你应该了解公司是否制定了部署这些工具的计划,以及谁负责管理这些工具。如果他们说会由你负责,那相应的,你的薪资也应该更高一些。
公司有哪些团队(或人员)来支持机器学习?
机器学习是一项团队活动,成熟的公司应该明白这一点。我希望有一些关键人物支持你,包括:数据工程师、云平台技术人员、业务分析师、其他数据科学家,在某些情况下甚至是 Scrum 管理员或项目经理。
如果答案是“你是第一个负责这项工作的员工”,那就准备好谈论负责人和人员扩充吧,因为你以后可能需要公司雇佣其他员工来帮助你。
在大多数公司中,作为一名独立的数据科学家,你无法取得多大成就,而且你不太可能掌握机器学习所需的所有技能。
公司董事会/管理层是否制定机器学习策略?
如果没有高层的支持,正式入职后,你会发现很难获得其他人的的信任。
公司内部必须认可机器学习,通常情况下由上而下驱动执行。
对你来说,最坏的结果是被调至数据科学职位,而整个公司都不支持数据科学项目。在这种情况下,最终,大家可能会把你看成一个“前卫的书呆子,拥有很多不切实际的想法”。
如果幸运的话,你的一些利益相关者可能会给你一些问题陈述,你可以在这些陈述的基础上开发出一些原型。但即便如此,你也很难说服公司投资并扩大其规模。最坏的情况是,你不得不提交一些 MI 和 BAU 报告,这并也不一定是坏事,但可能也不是你想成为数据科学家的原因。
不要认为,因为一家公司正在招聘数据科学家,那他们在文化上已经为你铺好了道路。
如果你认为你能靠自己改变公司文化(用埃隆马斯克(Elon Musk)的数学和逻辑风格),那是不可能的……永远也不可能。但在结构非常扁平的小公司或初创公司中则是例外。
我可以使用哪些资金?
如果你想做出来点成绩,你会花大笔的资金。这是一个需要注意的关键点,大规模运行机器学习非常烧钱,你需要资金才能实现。我发现,将预算分配给创新公司是最好的选择。机器学习具有很强的创新性,创新预算也意味着公司必须愿意一试、学习并接受失败(在一定程度上)。
如果面试官在不能给你一个决定性的回答,那可能暗示该公司不是很成熟。他们可能还没有意识到需要投入多少资金。注意,他们可能希忘你魔法般做出成绩改变公司,而会在你无法做到这一点的时候感到失望,即使是由于缺乏资金导致的。
⭐️差点忘了,还要问下面这些问题。最后一个必须要问!
- 1. 入职后的前六个月,公司希望我做些什么?
- 2. 是否有从构思到生产的框架?— 这是针对机器学习的问题
- 3. 我要向谁报告?— 如果这一点前面没有明确说明,可以问这个问题。
- 4. 我可以雇人吗?
我的数据从何而来?
没有人能在没有数据的情况下开展机器学习。不要假设你可以访问所有你需要的数据。如果数据管道和基础设施已经到位,那就太好了。如果公司要求你必须构建这些,那么你最好具备数据工程技能。
数据工程是一门很深奥的技能,所以不要天真地认为你可以独自完成这项工作。
你应该认真考虑一下,在一家几乎没有数据访问权的公司工作,真的是你想要的吗……
我希望这篇文章可以帮助你踏上梦想的职业生涯。如果你觉得有用,那么你要明白,提出周到的问题会让你看起来和听起来都知道自己在说什么。
希望我分享的数据科学的经验有帮助到你。欢迎订阅我们的公众号,了解更多数据科学相关内容!
原文作者:John Ade-Ojo
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/5-questions-you-need-to-ask-employers-at-data-science-interviews-a9ea10c45d6