《Python机器学习 》书籍分享

文章目录

  • 前言
  • 内容介绍
  • 作者简介
  • 书籍目录

前言

随着计算能力的快速增长,大量任务都可在台式机上完成;在这样的背景下,机器学习应运而生,成为当今炙手可热的话题。但初出茅庐的新手常对机器学习感到十分畏惧;为给这些新手扫清障碍,《Python机器学习》采用循序渐进的方式,先讲解底层技术,然后引导读者学习更高级的机器学习技巧。

《Python机器学习》首先介绍Python机器学习的一些基本库,包括NumPy、Pandas和matplotlib。一旦牢固地掌握了基础知识,即可开始基于Python和Scikit-learn库进行机器学习,深入了解各种机器学习算法(如回归、聚类和分类)的底层工作原理。本书专门用一章的篇幅讲解如何使用Azure Machine Learning Studio进行机器学习;利用该平台,开发人员不必编写代码即可开始构建机器学习模型。本书最后讨论如何部署供客户端应用程序使用的已构建模型。

京东:https://item.jd.com/12672565.html

在这里插入图片描述

内容介绍

《Python机器学习》面向机器学习新手,主要内容如下:

● Python机器学习的一些基本库,包括NumPy、Pandas和matplotlib库

● 常见的机器学习算法,包括回归、聚类、分类和异常检测

● 使用Python和Scikit-learn库进行机器学习

● 将机器学习模型部署为Web服务

● 使用Microsoft Azure Machine Learning Studio进行机器学习

● 演习机器学习模型构建方案的实例

作者简介

Wei-Meng Lee是一名技术专家,也是Developer Learning Solutions公司(http://www.learn2development.net)的创始人,该公司专门从事新技术的实践培训。

Wei-Meng具有多年的培训经验,他的培训课程特别强调“边做边学”。他动手学习编程的方法使理解这个主题比仅阅读书籍、教程和文档容易得多。

Wei-Meng这个名字经常出现在网上和印刷出版物,如DevX.com、MobiForge.com和CoDe杂志。

书籍目录

第1章 机器学习简介 1

1.1 什么是机器学习? 2

1.1.1 在本书中机器学习将解决什么问题? 3

1.1.2 机器学习算法的类型 4

1.2 可得到的工具 7

1.2.1 获取Anaconda 8

1.2.2 安装Anaconda 8

1.3 本章小结 17

第2章 使用NumPy扩展Python 19

2.1 NumPy是什么? 19

2.2 创建NumPy数组 20

2.3 数组索引 22

2.3.1 布尔索引 22

2.3.2 切片数组 23

2.3.3 NumPy切片是一个引用 25

2.4 重塑数组 26

2.5 数组数学 27

2.5.1 点积 29

2.5.2 矩阵 30

2.5.3 累积和 31

2.5.4 NumPy排序 32

2.6 数组赋值 34

2.6.1 通过引用复制 34

2.6.2 按视图复制(浅复制) 35

2.6.3 按值复制(深度复制) 37

2.7 本章小结 37

第3章 使用Pandas处理表格数据 39

3.1 Pandas是什么? 39

3.2 Pandas Series 40

3.2.1 使用指定索引创建Series 41

3.2.2 访问Series中的元素 41

3.2.3 指定Datetime范围作为Series的索引 42

3.2.4 日期范围 43

3.3 Pandas DataFrame 44

3.3.1 创建DataFrame 45

3.3.2 在DataFrame中指定索引 46

3.3.3 生成DataFrame的描述性统计信息 47

3.3.4 从DataFrame中提取 48

3.3.5 选择DataFrame中的单个单元格 54

3.3.6 基于单元格值进行选择 54

3.3.7 转置DataFrame 54

3.3.8 检查结果是DataFrame还是Series 55

3.3.9 在DataFrame中排序数据 55

3.3.10 将函数应用于DataFrame 57

3.3.11 在DataFrame中添加和删除行和列 60

3.3.12 生成交叉表 63

3.4 本章小结 64

第4章 使用matplotlib显示数据 67

4.1 什么是matplotlib? 67

4.2 绘制折线图 67

4.2.1 添加标题和标签 69

4.2.2 样式 69

4.2.3 在同一图表中绘制多条线 71

4.2.4 添加图例 72

4.3 绘制柱状图 73

4.3.1 在图表中添加另一个柱状图 74

4.3.2 更改刻度标签 76

4.4 绘制饼图 77

4.4.1 分解各部分 79

4.4.2 显示自定义颜色 79

4.4.3 旋转饼状图 80

4.4.4 显示图例 81

4.4.5 保存图表 83

4.5 绘制散点图 83

4.5.1 合并图形 84

4.5.2 子图 85

4.6 使用Seaborn绘图 86

4.6.1 显示分类图 87

4.6.2 显示lmplot 89

4.6.3 显示swarmplot 90

4.7 本章小结 92

第5章 使用Scikit-learn开始机器学习 93

5.1 Scikit-learn简介 93

5.2 获取数据集 93

5.2.1 使用Scikit-learn数据集 94

5.2.2 使用Kaggle数据集 97

5.2.3 使用UCI机器学习存储库 97

5.2.4 生成自己的数据集 97

5.3 Scikit-learn入门 100

5.3.1 使用LinearRegression类对模型进行拟合 101

5.3.2 进行预测 101

5.3.3 绘制线性回归线 102

5.3.4 得到线性回归线的斜率和截距 103

5.3.5 通过计算残差平方和检验模型的性能 104

5.3.6 使用测试数据集评估模型 105

5.3.7 持久化模型 106

5.4 数据清理 108

5.4.1 使用NaN清理行 108

5.4.2 删除重复的行 110

5.4.3 规范化列 112

5.4.4 去除异常值 113

5.5 本章小结 117

第6章 有监督的学习——线性回归 119

6.1 线性回归的类型 119

6.2 线性回归 120

6.2.1 使用Boston数据集 120

6.2.2 数据清理 125

6.2.3 特征选择 126

6.2.4 多元回归 129

6.2.5 训练模型 131

6.2.6 获得截距和系数 133

6.2.7 绘制三维超平面 134

6.3 多项式回归 136

6.3.1 多项式回归公式 138

6.3.2 Scikit-learn中的多项式回归 138

6.3.3 理解偏差和方差 142

6.3.4 对Boston数据集使用多项式多元回归 145

6.3.5 绘制三维超平面 146

6.4 本章小结 149

第7章 有监督的学习——使用逻辑回归进行分类 151

7.1 什么是逻辑回归? 151

7.1.1 理解概率 153

7.1.2 logit函数 153

7.1.3 sigmoid曲线 155

7.2 使用威斯康星乳腺癌诊断数据集 156

7.2.1 检查特征之间的关系 157

7.2.2 使用一个特征训练 161

7.2.3 使用所有特性训练模型 164

7.3 本章小结 174

第8章 有监督的学习——使用支持向量机分类 175

8.1 什么是支持向量机? 175

8.1.1 最大的可分性 176

8.1.2 支持向量 177

8.1.3 超平面的公式 178

8.1.4 为SVM使用Scikit-learn 179

8.1.5 绘制超平面和边距 182

8.1.6 进行预测 183

8.2 内核的技巧 184

8.2.1 添加第三个维度 185

8.2.2 绘制三维超平面 187

8.3 内核的类型 189

8.3.1 C 193

8.3.2 径向基函数(RBF)内核 195

8.3.3 gamma 196

8.3.4 多项式内核 198

8.4 使用SVM解决实际问题 199

8.5 本章小结 202

第9章 有监督的学习——使用k-近邻(kNN)分类 203

9.1 k-近邻是什么? 203

9.1.1 用Python实现kNN 204

9.1.2 为kNN使用Scikit-learn的KNeighborsClassifier类 209

9.2 本章小结 218

第10章 无监督学习——使用k-means聚类 219

10.1 什么是无监督学习? 219

10.1.1 使用k-means的无监督学习 220

10.1.2 k-means中的聚类是如何工作的 220

10.1.3 在Python中实现k-means 223

10.1.4 在Scikit-learn中使用k-means 228

10.1.5 利用Silhouette系数评价聚类的大小 230

10.2 使用k-means解决现实问题 234

10.2.1 导入数据 234

10.2.2 清理数据 235

10.2.3 绘制散点图 236

10.2.4 使用k-means聚类 236

10.2.5 寻找最优尺寸类 238

10.3 本章小结 239

第11章 使用 Azure Machine Learning Studio 241

11.1 什么是Microsoft Azure Machine Learning Studio? 241

11.1.1 以泰坦尼克号实验为例 241

11.1.2 使用Microsoft Azure Machine Learning Studio 243

11.1.3 训练模型 254

11.1.4 将学习模型作为Web服务发布 258

11.2 本章小结 263

第12章 部署机器学习模型 265

12.1 部署ML 265

12.2 案例研究 266

12.2.1 加载数据 267

12.2.2 清理数据 267

12.2.3 检查特征之间的相关性 269

12.2.4 绘制特征之间的相关性 270

12.2.5 评估算法 273

12.2.6 训练并保存模型 275

12.3 部署模型 277

12.4 创建客户机应用程序来使用模型 279

12.5 本章小结 281

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/836409.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试集中营—Seata分布式事务

一、分布式事务 本地事务 在计算机系统中,更多的是通过关系型数据库来控制事务,这是利用数据库本身的事务特性来实现的, 因此叫数据库事务,由于应用主要靠关系数据库来控制事务,而数据库通常和应用在同一个服务器&am…

数据结构:包装类初始泛型

目录 1.包装类1.1 基本数据类型和对应的包装类1.2 装箱和拆箱 2.什么是泛型3.引出泛型3.1 语法3.2 泛型的使用 4.泛型是如何编译的4.1 擦除机制4.2 为什么不能实例化泛型类型数组 5.泛型的上界5.1 语法5.2 示例5.3 复杂示例 6.泛型方法6.1 定义语法6.2 示例6.3 使用示例-可以类…

【CMU 15-445】Proj4 Concurrency Control

Concurrency Control 通关记录Task1 TimestampsTask2 Storage Format and Sequential ScanTask3 MVCC ExecutorsTask3.1 Insert ExecutorTask3.2 CommitTask3.3 Update and Delete ExecutorTask3.4 Stop-the-world Garbage Collection Task4 Primary Key IndexTask4.0 Index Sc…

Springboot+logback 详细配置

一、添加依赖 这里使用springboot3.0.2 依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId> </dependency><dependency><groupId>org.projectlombok</grou…

macos使用yarn创建vite时出现Usage Error: The nearest package directory问题

步骤是macos上使用了yarn create vite在window上是直接可以使用了yarn但是在macos上就出现报错 我们仔细看&#xff0c;它说的If /Users/chentianyu isnt intended to be a project, remove any yarn.lock and/or package.json file there.说是要我们清除yarn.lock和package.js…

yolo world 瑞芯微芯片rknn部署、地平线芯片Horizon部署、TensorRT部署

特别说明&#xff1a;参考官方开源的 yoloworld 代码、瑞芯微官方文档、地平线的官方文档&#xff0c;如有侵权告知删&#xff0c;谢谢。 模型和完整仿真测试代码&#xff0c;放在github上参考链接 模型和代码。 yoloworld出来的有一段时间了&#xff0c;还没有盘到板端上玩一玩…

芸众商城电商专业版400+插件源码+搭建教程

介绍&#xff1a; 芸众商城社交电商系统SAAS平台前端基于vue开发&#xff0c;后端基于研发积分商城系统源码 php&#xff0c;本文安装芸众商城全插件&#xff08;400多个&#xff09;商业版平台源码&#xff0c;可同时支持多端口部署运行&#xff1b;使用宝塔面板一键部署的形…

LibreNMS简介

目录 1 LibreNMS简单介绍1.1 LibreNMS介绍 2 安装2.1 Ubuntu安装1、安装依赖2、添加 librenms 用户3、下载 LibreNMS4、设置权限5、安装 PHP 依赖项6、设置时区7、配置 MariaDB8、配置 PHP-FPM9、配置 Web 服务器10、启用 lnms 命令11、配置 snmpd12、cron13、启用调度程序14、…

贪吃蛇(c实现)

目录 游戏说明&#xff1a; 第一个是又是封面&#xff0c;第二个为提示信息&#xff0c;第三个是游戏运行界面 游戏效果展示&#xff1a; 游戏代码展示&#xff1a; snack.c test.c snack.h 控制台程序的准备&#xff1a; 控制台程序名字修改&#xff1a; 参考&#xff1a…

练习队列的相关操作:循环队列

1. 思路解析 循环队列就是在只有有限的空间时使用队列实现循环存储数据&#xff0c;有双向链表和数组两种选择&#xff0c;这里我们使用数组实现循环队列&#xff08;因为链表我不会 >-<&#xff09; 2. 相关函数及其实现 2.1 判空与判满 判空&#xff1a;直接返回头尾…

Leetcode—946. 验证栈序列【中等】

2024每日刷题&#xff08;133&#xff09; Leetcode—946. 验证栈序列 实现代码 class Solution { public:bool validateStackSequences(vector<int>& pushed, vector<int>& popped) {int left 0;for(int i 0; i < popped.size(); i) {while(left &…

关于我转生从零开始学C++这件事:获得神器

❀❀❀ 文章由不准备秃的大伟原创 ❀❀❀ ♪♪♪ 若有转载&#xff0c;请联系博主哦~ ♪♪♪ ❤❤❤ 致力学好编程的宝藏博主&#xff0c;代码兴国&#xff01;❤❤❤ 几天不见 &#xff0c;甚是想念&#xff01;哈咯大家好又是我大伟&#xff0c;五一的假期已经结束&#xff0…

超绝git

我们应该学会使用超绝git了&#xff0c;首先&#xff0c;什么是git&#xff1f; git是超绝版本控制器&#xff08;去中心化的分布式系统&#xff09;&#xff0c;什么又是版本控制&#xff0c;git和Gitee又有什么牵扯&#xff1f; git安装 这是安装git&#xff1a; yum ins…

Kexp 动态展示 k8s 资源对象依赖关系

kexp[1] 旨在以可视化的方式帮助用户理解和探索 Kubernetes 的能力。 适用场景&#xff1a; 学习和探索 Kubernetes 的功能。 应用开发&#xff0c;提供每个应用的对象图预设。 控制器和操作器的开发&#xff0c;支持动态对象图。 即将推出类似 Postman 的 Kubernetes API …

Python深度学习基于Tensorflow(9)注意力机制

文章目录 注意力机制是怎么工作的注意力机制的类型 构建Transformer模型Embedding层注意力机制的实现Encoder实现Decoder实现Transformer实现 注意力机制的主要思想是将注意力集中在信息的重要部分&#xff0c;对重要部分投入更多的资源&#xff0c;以获取更多所关注目标的细节…

GoF之代理模式(静态代理+动态代理(JDK动态代理+CGLIB动态代理带有一步一步详细步骤))

1. GoF之代理模式&#xff08;静态代理动态代理(JDK动态代理CGLIB动态代理带有一步一步详细步骤)&#xff09; 文章目录 1. GoF之代理模式&#xff08;静态代理动态代理(JDK动态代理CGLIB动态代理带有一步一步详细步骤)&#xff09;每博一文案2. 代理模式的理解3. 静态代理4. 动…

整理好的中债国债3年期到期收益率数据集(2002-2023年)

01、数据简介 国债&#xff0c;又称国家公债&#xff0c;是由国家发行的债券&#xff0c;是中央ZF为筹集CZ资金而发行的一种ZF债券&#xff0c;是中央ZF向投资者出具的、承诺在一定时期支付利息和到期偿还本金的债权债务凭证。 中债&#xff0c;是指由中国中债登记结算有限责…

Jetpack Compose一:初步了解Compose

Intellij IDEA构建Android开发环境 IntelliJ IDEA 2023.2.1 Android开发变化 IDEA配置使用Gradle 新建Compose工程&#xff0c;取名ComposeStudy 可以看到的是IDEA为项目初始化了部分代码 使用Compose开发不再需要使用xml文件来设计布局了 Compose中的Text也不同于Android V…

机器学习特征降维

目录 特征降维概念 低方差过滤法 PCA主成分分析 相关系数法 小结 特征降维概念 特征对训练模型时非常重要的&#xff1b;用于训练的数据集包含一些不重要的特征&#xff0c;可能导致模型性能不好、泛化性能不佳&#xff1b;例如&#xff1a; 某些特征的取值较为接近&…

部署Gerapy

1.Gerapy 是什么&#xff1f; Gerapy 是一款基于 Python 3 的分布式爬虫管理框架&#xff0c;它旨在简化和优化分布式爬虫的部署、管理和监控过程。 2.作用与功能&#xff1f; 2.1分布式管理&#xff1a; Gerapy 允许用户在多台机器上部署和管理Scrapy爬虫&#xff0c;实现爬虫…