数据科学初学者起航——六本免费书籍

Mar 12, 2022 by Zhang in  Blog

数据科学是一个跨学科领域,需要计算机科学、数学、统计学和机器学习等多个领域的技能。作为学习数据科学的初学者,你可能不太了解怎么开始学习。

图源:Unsplash 摄影:Tom Hermans

免费资源在网上随处可见,但很难找到好的资源。对初学者来说,书籍是一个很好的学习资源,幸运的是,现在有几本免费书籍,涵盖了所有初学者需要了解的概念。

在接下来的文章中,我将为初学者介绍我最喜欢的六本免费书籍。本文中的每本书都涵盖了数据科学中最重要的基本概念之一。我按照我个人推荐的顺序整理了话题,具体如下:

  • Python 编程的基础知识
  • 数据科学统计学
  • 数据分析中的Pandas
  • Python 数据科学工具包
  • 机器学习
  • 深度学习

1. Learn Python the Right Way
(正确学习Python)

作者:Peter Wentworth、Jeffrey Elkner、Allen B. Downey 和 Chris Meyers

点击此处免费阅读: https://learnpythontherightway.com/#about

Python 是数据科学的首选编程语言。因此,学习Python的编程基础知识是该领域初学者应该学习的首要内容。本书并非专门针对数据科学编程,而是涵盖了编写 Python 代码的一般性概念。我建议先从这本书开始,然后再继续阅读本文后面推荐的书籍中介绍的数据科学 Python包。

本书假设读者没有任何编程知识,介绍了 Python 语言和基本的一般编程原则。每一章都包含一个补充的 YouTube 视频,有助于进一步解释所涵盖的概念。

本书的作者还提供了一套实践教程,其中包含超过 15 个实用的 Python 项目,可以让你在实际操作中运用学到的知识。

2. Practical Statistics for Data Science
(数据科学家的实用统计知识)

作者:Peter Bruce & Andrew Bruce

图源:amazon.co.uk

点击此处免费阅读:

https://github.com/ghoshark/E_Books/blob/master/Practical%20Statistics%20for%20Data%20Scientists.pdf

这是迄今为止我发现的最好的书籍之一,可以向初学者介绍数据科学中最重要的统计概念。本书涵盖了各种主题,包括数据采样、分布、统计实验和机器学习。

所有概念都以适合初学者的术语进行解释,包括使用 R 和 Python 混合的实际代码示例。我们的读书会也有讲过这本书,欢迎加入会员观看相应视频和资料:

https://mp.weixin.qq.com/s?__biz=MzIzMDA1MTM3Mg==&mid=2653120512&idx=2&sn=40ee399621105ff9fa8b2ee0ffc3c1ed&chksm=f36e9343c4191a551c7d20fc0bf9f391cd1578d78959bea942fd2a6845057a6e6e7308575186&token=829375037&lang=zh_CN#rd

3. Pandas: Powerful Python Data Analysis Toolkit
(Pandas:强大的 Python 数据分析工具包)

作者:Wes McKinney 以及 Pandas 开发团队

图源:pandas.org

点击此处免费阅读:

https://pandas.pydata.org/docs/pandas.pdf

这本书被称为 Pandas 的 Python 包是数据科学中探索、转换、清理和处理数据的首选工具。本书是这个d工具的完整用户指南。

本书涵盖所有内容,包括安装、基本操作、绘图和数据分析。本书假设读者具备 Python 基本知识,因此首先了解Learn Python the Right Way中的概念非常重要,但对于初学者以及进阶的学习者来说,本书可以说是绝佳的参考指南。

4. Hands-on Machine Learning with Scikit-learn, Keras and Tensorflow
(使用 Scikit-learn、Keras 和 Tensorflow 进行机器学习)

作者:Aurelien Geron

图源:amazon.co.uk

在这里免费阅读:

https://www.knowledgeisle.com/wp-content/uploads/2019/12/2-Aur%C3%A9lien-G%C3%A9ron-Hands-On-Machine-Learning-with-Scikit-Learn-Keras-and-Tensorflow_-Concepts-Tools-and-Techniques-to-Build-Intelligent-Systems-O%E2%80%99Reilly-Media-2019.pdf

本书详细通过介绍一些人气很高的 Python 机器学习包,包括Scikit-learn、Keras 和 Tensorflow ,对机器学习进行了详细的实践介绍。

本书很好地介绍了机器学习的重要理论概念,包括机器学习系统的类型、过拟合和欠拟合,以及常见算法的工作原理。

书中很多内容都很实用,包括典型的端到端机器学习项目的完整演练。本书将为该领域的初学者提供完整的介绍。

5. Python Data Science Handbook
(Python 数据科学手册)

作者:Jake Vanderplus

图源:jakevdp.github.io

点击此处免费阅读:

https://jakevdp.github.io/PythonDataScienceHandbook/

这本书是对 Python 数据科学工具包的概括性介绍。本书介绍了 NumPy 库,包括数组、数组计算和 Python 中的数据类型等概念。

本书还很好地介绍了通过 Pandas 进行数据分,以及荣夫妇 Scikit-learn 进行机器学习,对初学者来说非常友好。

6. Deep Learning for Coders with Fastai and Pytorch: AI Applications Without a PHD
(用 Fastai 和 Pytorch 的深度学习:不需要PHD的 AI 应用)

作者:Jeremy Howard and Sylvain Gugger

图源:amazon.co.uk

点击此处免费阅读:

https://github.com/fastai/fastbook

本书是深度学习的实用入门教程,其目标读者为编程人员,因此在深入阅读本书之前,了解 Python 编程相关知识是必不可少的。但是,本书并没有假设读者对数学和统计学有深度的了解,而是可以对深度学习背后的理论进行了出色但简单的解释。

本书是学习深度学习的理想入门书籍,可以帮你开发人生中的第一个深度学习模型。

互联网上有大量免费或低成本的学习资源,包括免费课程、大学讲座、教程、视频、博客文章和书籍。在本文中,我提供了六本免费阅读书籍的链接,仅这些书籍就可以为初学者打好数据科学领域的优秀知识基础。

感谢您的阅读!

原文作者:Stephen Miracle
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://levelup.gitconnected.com/the-2-types-of-software-engineers-every-successful-product-team-needs-11952e937def

北美求职60秒:如何防范求职过程中的招聘欺诈?(10月第3周)

Oct 24, 2023

本期话题,带你了解“如何防范求职过程中的招聘欺诈?”

JavaScript会被替代吗?

Sep 17, 2021

JavaScript 是全球最流行的编程语言之一。它不仅在 RedMonk、Stack Overflow和其他公司生成的编程语言中数一数二,而且还拥有世界最大的开发者社区,至少根据SlashData最近的《开发者报告》来看是这样。

北美求职指北-E周报(11月第1周)

Nov 10, 2021
  • 十月非农就业数据好于预期
  • 硅谷科技大厂改革股票分配方案招揽人才
  • 美国众议院提案:增加H-1B申请附加费

Leave a Comment

Your email address will not be published. Required fields are marked *

Comment *