大数据在金融行业的应用

Apr 23, 2021 by Zhang in  Blog

如果你想从事金融方向的数据科学工作,这里有几个数据科学的知识,你可能需要知道。首先,由社交媒体所衍生出的非结构化大数据集合,使得越来越多的战略优势可以被实时获取。

其次,尽管数据策略的构建模块(数据存储和管理)日益普遍化,但数据科学家在应用数据栈过程中仍发挥着重要的作用。

数据工程团队正在将他们的焦点从简单的数据库存储和管理中,转移到高附加值的数据链部分,投资企业Man Numeric (Man Group子公司)alpha技术主管Tom Taylor表示,该发言于最近人工智能与数据科学的贸易会议上发表。

据Taylor说,信用卡交易或品牌评估等数据流在金融领域已经成为常态,并且在大数据的环境下,不单单需要一组调研者去分析它的意义,还需要“培训行业模式下进行应用大数据的科学家们”

有些基金公司,比如Two Sigma,已经外包了清理数据的这个过程,这样就可以很容易地将数据整合到它们的系统中。而且像Crux Informatics(由Two Sigma使用)类型的公司,正在成为所谓“数据整理”方面的专家:他们消化、清理和构建数据集合。

然而,尽管数据整理很重要,但它并不是最吸引人的数据工作。如果你想在金融领域从事一些最有趣、最有价值的数据工作,Taylor建议你应该把自己置于“数据栈”的顶端。Man Numeric公司的Taylor说数据堆叠如下图所示。最高价值定位是最顶端,最低价值在低端:

如果你是SQL, Kafka 或Kubernetes方面的专家,你可能会得到一份金融方面的数据工作,但仅通过了解数据存储和计算包,你并不会得到最好的数据工作。而且机器学习和开源Python库(在前台,Man 就是Python 的房子)也不会成为决定性因素。

Taylor说,现在对于数据开发的公司而言,最有前景的的数据科学工作是给那些能够向公司其他部门提供数据的人。他补充道,未来会公司会增加“数据速度”,而这意味着能实现“自助式的数据服务”。尽管数据摄入和储存很重要,但是它们都处于商业化堆叠的末尾。现在真正的焦点是允许“来自各个组织的用户可以操作并分析数据”。

也就是说,最有价值的数据科学家是那些能够建立起允许同事直接访问数据的自定义仪表板或视觉化的人。数据科学团队也发挥着促进作用。Taylor认为,随着现有员工技能的提高以及对新数据充满信心毕业生的聘用,各组织的数据流利度正在提高。

如果你想要在金融领域作为一位长期性且报酬丰富的数据科学家,那么你就需要把自己定位在上述的表格的顶端。Taylor说:如果你能开发出自助式的分析工具,你就能够为接下来几年做好准备。

作者:Sarah Butcher

如何回答ML机器学习的面试问题?

Nov 10, 2021

设想一下,你申请了梦寐以求的公司的ML工程师职位,接到了该公司HR的电话,告知你准备好参加面试。接到电话后,你想跟着ML学习指南,打算开始学习相关知识。

远程办公是否会带来降薪困扰?

Jul 16, 2021

公司是否在薪酬方面区别对待全职的远程员工?Dice多次进行调查,技术人员是否愿意用减薪换取永久在家工作的权利。大部分受访者表示他们不会接受任何形式的减薪。

如何把一次失败的技术面试变成一次学习机会

Sep 27, 2023

无论做了多少准备和学习,在技术面试中还是很容易出错。特别是当面试官想深入了解工具、平台、语言或服务的技术细节时。

Leave a Comment

Your email address will not be published. Required fields are marked *

Comment *