准备好学习更多货真价实的数据科学知识了吗?这五本数据科学书籍可以帮到你。本文中,我将分享数据的初学者在第一次学习数据科学时可以选择的最佳书籍。
这些书帮助成千上万的人学习了数据分析、可视化、高级编程技能、机器学习等等,甚至还帮助他们找到了工作!让我们直接开始吧。
1.Python数据分析-学习数据科学编程技能《Python for Data Analysis — Learn Programming Skills for Data Science》
如果你有基本的Python编程技能,这会是你下一本很好的读物。这本书涵盖了几乎所有可能的数据分析方法,以及Python编程语言的基础知识。
我特别喜欢这本书的一点是,作者给了你一个很好的概念,作为一名数据分析师/科学家你应该期待要做什么工作。总而言之,这本书内容组织良好,读起来很顺畅,节奏很完美,每件事也解释得很简单。
你会深入研究Pandas、数据存储格式、数据预处理方法、数据整理、分组,还会有一些数据可视化和时间序列分析——所有这些大约500页内容。
2.数据可视化基础——一幅画抵得上千言万语《Fundamentals of Data Visualization — A Picture is Worth a Thousand Words》
能传达分析结果的最佳方式是什么?你想得没错——数据可视化。这本书将引导你解决最常见的数据可视化问题,并教你在哪种情况下最好的可视化类型是什么。
这本书只有大约350页,但涵盖了所有必需的主题——色标、条形图、分布图、QQ图、饼图、马赛克图、树形图、散点图、时间序列、地理空间数据等等。它还会教你图表设计的原则,这会是数据科学家必须掌握的技能。
3.用数据讲故事——学会传达正确的信息《Storytelling With Data — Learn to Convey the Right Message》
这本书是基于一个简单的前提写的——只展示你的数据是不够的,你应该用它来讲述一个故事。这是在上一本书的基础上一次极好的后续阅读,因为你已经熟悉了基本的数据可视化原理。
你将了解为什么在选择有效的数据可视化之前,数据的环境是一件非常重要的事情。你还将学习作为设计师要如何思考,以及如何避免数据可视化中的混乱。
这本书只有大约250页,所以你能很快读完。
4.从头开始的数据科学——python的第一原则
只学习数据科学工具和库是不够的。你应该理解基本原则,这也是我们推荐这本书的原因。当然了,如果你读过我们上面列出的书籍,你大概已经知道了基础知识。这本书提供了一个很好的概述,除了可以帮你整体的回顾Python,还有更多内容。
这本400页的书为你提供Python编程、数据可视化、线性代数、统计学、假设检验方面的知识,并将教你使用数据和机器学习算法的基本原理——从简单线性回归到深度学习、NLP和推荐系统等等。
5.使用Scikit Learn、Keras和TensorFlow进行机器学习《Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow》
这本书内容很多—有800多页!但它绝对值得!这是亚马逊上长期以来的畅销书,因为它涵盖了人们在数据领域工作可能需要的一切,而且解释得非常清晰。说真的,这本书涵盖了从机器学习、到GANs和强化学习的主题。
这本书从简单的主题,如数据收集、EDA、特征缩放,到通过决策树、随机森林和梯度提升等算法进行的实际机器学习。它还涵盖了主要的降维技术和无监督学习。所有这些都在前300页中!
剩下的部分留给了神经网络和深入学习,从理论到TensorFlow库的应用。你会学习更多关于人工神经网络、CNN、RNN、自动编码器、GAN和强化学习的知识。
总结
数据科学是一个广阔的领域,你需要掌握大量的技能。这五本书是一个很好的起点。阅读它们后,你就能将新学到的知识应用到你感兴趣的领域。
如果你想深入了解这些学习材料,你可能需要花6-12个月的时间来阅读。当然,实际需要多长时间还是取决于你之前的知识基础和你个人的可用时间。
今天就会是个很好的开始。你能做到,加油!
原文作者:Dario Radečić
翻译作者:Chuang Zhang
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://medium.com/geekculture/top-5-books-to-learn-data-science-in-2022-for-complete-beginners-ad96bc911e63