机器学习和数据科学领域必读的10本免费书籍

摘要: 暑期来了,别出去溜达了,看书学习一波~

在这个暑假,有兴趣的可以阅读一下这些免费的有关机器学习和数据科学的书籍,他们能给你打开一扇看清机器学习和数据科学的窗。如果在阅读完这一文章后想知晓更多免费的好书,请查看本系列的前一篇或下面的相关内容。


1. Python Data Science Handbook

作者:Jake VanderPlas

本书介绍了在Python中处理数据所必需的核心库,特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Lean和相关的软件包。在此之前您需要掌握Python这种语言,如果您想快速掌握这门语言,可以参阅这个针对研究人员和科学家的Python语言快速入门的“Python的旋风之旅(A Whirlwind Tour of Python)”。

2. Neural Networks and Deep Learning

作者:Michael Nielsen

这是一本免费的在线书籍。通过这本书你会知道神经网络是一个美丽的生物启发式编程范例,使计算机可以从观测数据中学习。而深度学习则是一套强大的神经网络学习技术。

目前,神经网络和深度学习为图像识别、语音识别和自然语言处理(NLP)中的问题提供了很多效果不错的解决方案。通过这本书您将会知道更多神经网络和深度学习背后的核心概念。

3. Think Bayes

作者:Allen B.Downey

这本书主要介绍了如何使用计算方法处理贝叶斯统计。

如果您想使用本书中的技能来学习其他技能,您需要知道如何编程。

贝叶斯统计是根据数学概念(如微积分)提出的,有关它的大多数书籍也都使用的是数学符号。本书使用Python代码而不是数学,因此“积分”变成了“总和”。这是书中的一个特色。

4. Machine Learning & Big Data

作者:Karee Alkaseer

这本书背后的目的是为了让软件工程师在不依赖库的情况下可以轻松使用机器学习模型。大多数情况下,模型或技术背后的概念很简单、直观,但在细节或行话中会丢失。另外,一般情况下,现有的库可以解决手头的问题,但是有时候它们会用自己的方式抽象和隐藏基本概念,这就是它们被称为“黑盒子”的原因。这本书也尝试着将“黑盒子”里被抽象和隐藏的基本概念清晰化。它是一个还在进行中的作品,它的内容将慢慢的丰富。

5. Satistical Learning with Sparsity:The Lasso and Generalizations

作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright

在过去的十年中,计算和信息技术得到了迅猛发展。随着它的应用,在医学、生物学、金融和市场营销等领域中涌现出了大量的数据。本书在一个共同的概念框架下,阐述了这些领域中的一些重要观点。

6. Statistical inference for data science

作者:Brian Caffo

作为数据科学专业的一部分 ,本书是统计推理课程(Statistical Inference)的一本配套书籍。如果你没有上这门课,也可以配着YouTube上有关视频单独学习这本书。

本书旨在以低成本介绍统计推理这一重要领域,使得具有编程能力的学生将这些技能用到数据科学或统计学当中去。

7. Convex Optimization

作者:Stephen Boyd & Lieven Vandenberghe

这本书的主要内容是关于凸优化(convex optimization),这是一类特殊的数学优化问题,它包括最小二乘和线性规划问题。众所周知,最小二乘和线性规划问题有一个相当完整的理论,出现在各种应用中,并且可以非常有效地用数值求解。本书的基本观点是,对于较大类的凸优化问题也可以如此。

8. Natural Language Processing with Python

作者:Steven Bird & Ewan Klein & Edward Loper

本书基于Python编程语言和一个叫自然语言工具包(NLTK)的开源库写作而成的。“自然语言”是指用于人类日常交流的语言,与编程语言和数字符号等语言不同,自然语言在代代相传的过程中不断发展,并且很难用明确的规则来确定。为了让计算机更好地理解自然语言,我们开发运用了自然语言处理(NLP)。这本书就是有关自然语言处理(NLP)的书。

9. Automate the Boring Stuff with Python

作者:AI Sweigart

你是否有过为花费数小时为文件重命名或更新表格里的数百个单元格而烦躁的经历?在这本书中,你将会学到如何使用Python来轻松搞定这些问题。Python十分好上手,一旦掌握了编程的基础知识,就可以创建Python程序,就此轻松解决那些繁琐的事情。

10.Social Media Mining: An Introduction

作者:Reza  Zafarani & Mohammad Ali Abbasi & Huan Liu

社交媒体在过去十年的发展已经彻底革新了个人互动和行业开展业务的方式。个人通过社交媒体互动、共享产生了大量的数据。

在这本书中,你将了解到社交媒体挖掘(Social Media Mining)整合了社交媒体,社交网络分析和数据挖掘,为学生、从业人员、研究人员等提供了一个方便而一致的平台。同时也将会了解到社交媒体挖掘(Social Media Mining)的潜力。

原文链接

本文为云栖社区原创内容,未经允许不得转载。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521646.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

microsoft账号登陆一直在加载_英雄联盟手游下载,附带拳头账号注册教程

欢迎关注【花卷来了】公众号。如果喜欢本期节目请点赞、再看、分享给朋友吧~软件资源请回复文章底部今日关键词获取/排版:萌萌哒花卷/来源:采集自网络今日主题:最新英雄联盟手游下载,附带拳头账号注册教程英雄联盟手游今天正式公测…

机器学习者都应该知道的五种损失函数!

摘要: 还不知道这五种损失函数?你怎么在机器学习这个圈子里面混?在机器学习中,所有的机器学习算法都或多或少的依赖于对目标函数最大化或者最小化的过程,我们常常把最小化的函数称为损失函数,它主要用于衡量…

linux服务器监控zabbix,Linux监控之--使用ZABBIX监控web服务器

使用ZABBIX监控web服务器实验拓扑图:实验思路:nginx添加状态统计模块,编写nginx对应的状态统计脚本。zabbix-server导入nginx模板,并对主机实现监控。实验环境角色IP地址操作系统版本软件包Zabbix_server192.168.0.158/24Centos6.…

Facebook 约十亿美元收购脑机技术公司,助攻AR研发;苹果宣布新款 Mac Pro 在美国生产;谷歌称已实现量子霸权…...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go 小米MIX Alpha手机官方概念图…

知道这些用于数据科学和机器学习的GitHub存储库和Reddit主题吗?

摘要: 5月最热门的GitHub存储库和顶级Reddit讨论,戳进来~GitHub和Reddit都是比较有趣的平台,在这里,我不仅学习了数据科学的一些最佳应用,而且还了解数据科学家们是如何编程的。一直以来,GitHub都是开发人员…

l2-008 最长对称子串 (25分)_小学数学关于时间认识(时、分、秒)的几点总结

本文将通过对照学习一个个知识点,延伸出各种知识点的常用题型。一、时、分、秒之间的换算:1时60分 1分60秒这类题型考的是时间单位之间的换算,一种是大单位换小单位,一种是小单位换大单位。在之前的一篇文章里有关于换算的计算方法…

如何在阿里云上构建一个合适的Kubernetes集群

摘要: 声明 本文主要介绍如何在阿里云上构建一个K8S集群的实践,只是作为参考,大家可以根据实际情况做出调整。 集群规划 在实际案例中发现,有不少同学使用了很多的小规格的ECS来构建K8S集群,这样其实即没有达到省钱的目…

360断网急救箱_万事不求人,教你自己动手修复网络断网

日常使用中,我们经常会遇到原来好好的网络忽然无法上网的问题。在排除宽带没有问题,硬件交换机、路由器、网线没有问题的情况下,我们可以充分利用第三方工具的修复功能。前几天,我就遇到一例电脑不能上网的问题,同一办…

linux 网络dma驱动,S3C2410的Linux下DMA驱动程序开发

网上介绍Linux下的一般驱动程序开发示例浩如烟海,或是因为简单,关于DMA驱动的介绍却寥寥无几;近期因工作需要,花了几日时间开发了某设备在S3C2410处理器Linux下DMA通信的驱动程序,有感于刚接手时无资料借鉴的茫然&…

Pivotal冯雷:以数字化为核心竞争力的时代 自主可控是企业的“必然选择”

戳蓝字“CSDN云计算”关注我们哦!随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发…

druid去掉广告

定位问题 产生广告的JS文件在 druid-1.1.19.jar/support/http/resources/js/common.js。 查看源码可知是buildFooter方法进行植入,由init方法调用。 解决方案: 找到对应的依赖jar包,如druid-1.1.19.jar 找到support/http/resource/js/comm…

阿里巴巴的AI算法程序媛是怎样的一种存在?

摘要: 一个专注人脸识别技术长达11年的程序媛。程序媛、AI、算法、人脸识别、阿里安全图灵实验室……这些标签任何一个都极具话题性,但如果一个女子同时拥有这些标签,那会是怎样的存在?在见到于鲲之前,我的脑子里是各种…

Hadoop 中zoo_数据分析中的Excel、R、Python、SPSS、SAS和SQL

作为一直想入门数据分析的童鞋们来说,如何选定一门面向数据分析的编程语言或工具呢?注意是数据分析,而不是大数据哦,数据分析是基础了。数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管…

linux下装sqlserver安装包,【sqlServer】CentOS7.x 上Microsoft SQL Server for Linux安装和配置...

SQL Server Documentationhttps://docs.microsoft.com/en-us/sql/sql-server/sql-server-technical-documentation?viewsql-server-2017Installation guidance for SQL Server on Linuxhttps://docs.microsoft.com/en-us/sql/linux/sql-server-linux-setup?viewsql-server-20…

2019云栖大会:逍遥看巅峰,张勇提“百新”,平头哥“再亮剑”

文 | 阿晶、丹丹、王银发于阿里云栖大会现场 出品 | CSDN云计算(ID:CSDNcloud) “今天不是马云的退休,而是制度传承的开始。”9月10日,阿里20周年的大日子,逍遥子接棒风清扬,跟唱《追梦赤子心》…

10行代码让你轻松搞定对象检测

摘要: 十行代码轻松搞定对象检测?快来看看如何使用ImageAI。计算机视觉是人工智能领域中最重要的一个分支。计算机视觉是一门能够识别和理解图像及其场景的计算机软件系统的科学。计算机视觉包括图像识别、对象检测、图像生成、图像超分辨率等多个方面。…

项目集成Flowable工作流

企业级项目集成Flowable工作流,基于(师父)的开源项目的集成,此开源项目是师傅十几年的经验和实战总结而成,直接可以用于企业开发,旨为帮助更多需要帮助的人! 说明链接项目开原地址https://gitee.com/lwj/flowable博客链接https://…

这个阿里程序员,干了件很轴的事儿

摘要: 我叫孤尽,是一名阿里程序员。 如果说,我身上有一点点和普通程序员不一样,也许是更轴一点。比如我觉得JAVA是世界上最好的语言,没有之一。 最近,我又干了一件比较轴的事情。 我因为这件事曾被大家群嘲…

360路由器v2刷第三方固件_魔百盒M301H-BYT代工MV300H芯片第三方优化刷机卡刷固件下载_移动魔百和 ROM固件...

魔百盒M301H-BYT代工MV300H芯片第三方优化刷机卡刷固件下载固件介绍:1、不带ROOT权限,适用于魔百盒M301H-BYT代工MV300H芯片。2、调出原厂固件屏蔽的wifi,开放原厂固件屏蔽的市场安装和u盘安装apk;3、无开机广告,无系统…

CVPR!你凭什么收录我3篇论文!?

摘要: 在近日举行的年度计算机视觉和模式识别盛会CVPR上,阿里云ET城市大脑的三项视觉技术论文成功入选。 别急着找原因,咱们先了解下什么是CVPR。 这个由专业技术学会IEEE(电气和电子工程师协会)主办的组织全称叫Confe…