Sklearn学习-iris数据集学习

Sklearn学习-逻辑回归（iris数据集）

使用load_iris加载数据集，查看包含的keys
查看数据的列名，分类目标的名称
获取data和target，并打印各自的shape
拆分训练集和测试集
使用逻辑回归训练。在测试集上计算准确率
在测试集上实现预测
输出和理解混淆矩阵
输出和理解分类报告

使用load_iris加载数据集，查看包含的keys

知识点
sklearn的数据集在datasets模块，自带的数据集以"load_"开头
加载的iris数据集是可以字典类型使用
对应的Keys包含 [‘data’, ‘target’, ‘frame’, ‘target_names’, ‘DESCR’, ‘feature_names’, ‘filename’]

from sklearn.datasets import load_iris# 1-load_iris加载数据集
iris = load_iris()# 查看包含的keys
iris.keys()

dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename'])

iris['filename']

'D:\\Anaconda3\\lib\\site-packages\\sklearn\\datasets\\data\\iris.csv'

查看数据的列名，分类目标的名称

“feature_names”:表示数据data每列的特征值的名称
“target_names”:分类目标对应的名称

# 查看数据的列名，分类目标的名称
iris['feature_names']

['sepal length (cm)','sepal width (cm)','petal length (cm)','petal width (cm)']

# DataFrame
import pandas as pdpd.DataFrame(data=iris['data'],columns=iris['feature_names'])

	sepal length (cm)	sepal width (cm)	petal length (cm)	petal width (cm)
0	5.1	3.5	1.4	0.2
1	4.9	3.0	1.4	0.2
2	4.7	3.2	1.3	0.2
3	4.6	3.1	1.5	0.2
4	5.0	3.6	1.4	0.2
...	...	...	...	...
145	6.7	3.0	5.2	2.3
146	6.3	2.5	5.0	1.9
147	6.5	3.0	5.2	2.0
148	6.2	3.4	5.4	2.3
149	5.9	3.0	5.1	1.8

获取data和target，并打印各自的shape

通过字典的键值可以直接获取到对应的数据
data和target对应的数据类型是numpy的ndarry类型，可以用shape获取其大小

# 分类目标的名称
iris['target_names']

array(['setosa', 'versicolor', 'virginica'], dtype='<U10')

# 获取data和target，并打印各自的shapedata = iris['data']
print(type(data),data.shape)
target = iris['target']
print(type(target),target.shape)

<class 'numpy.ndarray'> (150, 4)
<class 'numpy.ndarray'> (150,)

拆分训练集和测试集

在model_selection模块中使用train_test_split对数据集进行训练集和测试集的划分

from sklearn.model_selection import train_test_split

'''
第一个参数：数据集
第二个参数：目标集
第三个参数：测试集所占比例
'''
data_train,data_test,target_train,target_test = \
train_test_split(data,target,test_size=0.3)

data_train.shape

(105, 4)

使用逻辑回归训练。在测试集上计算准确率

使用模型：linear_modeld的LogisticRegression
步骤：

导入模块linear_modeld.LogisticRegression
初始化模型 LogisticRegression()
训练fit()
查看分数（效果）score()

from sklearn.linear_model import LogisticRegression

model = LogisticRegression(max_iter=1000) # 定义最大迭代次数

model.fit(data_train,target_train) # 进行训练

LogisticRegression(max_iter=1000)

# 查看在训练集上评分
model.score(data_train,target_train)

0.9619047619047619

# 查看在测试集上的评分
model.score(data_test,target_test)

0.9555555555555556

在测试集上实现预测

预测，使用模型提供的predict方法执行预测

LogisticRegression(max_iter=1000)
target_predict = model.predict(data_test)import pandas as pd
df = pd.DataFrame(target_predict,columns=["预测结果"])df['实际结果'] = target_test
df.shape #(45, 2)

输出和理解混淆矩阵

衡量预测结果的好坏
使用metrics.confusion_matrix

from sklearn.metrics import confusion_matrix

# 输出混淆矩阵
confusion_matrix(target_test,target_predict)

array([[13,  0,  0],[ 0, 14,  1],[ 0,  1, 16]], dtype=int64)

# 查看分类错误的数据
df.loc[df['实际结果']==0]

	预测结果	实际结果
0	0	0
2	0	0
11	0	0
13	0	0
18	0	0
20	0	0
22	0	0
25	0	0
31	0	0
33	0	0
39	0	0
40	0	0
44	0	0

输出和理解分类报告

from sklearn.metrics import classification_report

# 输出混淆矩阵
print(classification_report(target_test,target_predict,target_names=iris['target_names']))

              precision    recall  f1-score   supportsetosa       1.00      1.00      1.00        13versicolor       0.93      0.93      0.93        15virginica       0.94      0.94      0.94        17accuracy                           0.96        45macro avg       0.96      0.96      0.96        45
weighted avg       0.96      0.96      0.96        45

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/15965.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Sklearn学习-iris数据集学习

Sklearn学习-逻辑回归（iris数据集）

使用load_iris加载数据集，查看包含的keys

查看数据的列名，分类目标的名称

获取data和target，并打印各自的shape

拆分训练集和测试集

使用逻辑回归训练。在测试集上计算准确率

在测试集上实现预测

输出和理解混淆矩阵

输出和理解分类报告

相关文章

【云原生】Docker容器资源限制（CPU/内存/磁盘）

React几种避免子组件无效刷新的方案

平面设计软件都有哪些？推荐这7款

如何通过企业工商信息初步判断企业是否靠谱？

Bug记录： CUDA error_ device-side assert triggered

python在不同坐标系中绘制曲线

CloudDriver一款将各种网盘云盘挂在到电脑本地变成本地磁盘的工具教程

sql-从一个或多个表中向一个表中插入多行

短视频平台视频怎么去掉水印？

数据结构--基础知识

K8S暴露pod内多个端口

matlab进阶：求解在约束条件下的多元目标函数最值（fmincon函数详解）

Vue 基础语法（二）

vue中在使用keep-alive时，会出现在页面跳转后el-tooltip或el-dropdown不消失的问题以及解决方法

[运维|系统] Centos设置本地编码

这就是ChatGPT，走进我们的生活！

docker小记-容器中启动映射端口号但访问不到

【雕爷学编程】MicroPython动手做（10）——零基础学MaixPy之神经网络KPU2

无人机调试笔记——常见参数

【分享帖】LCD的MCU接口和SPI接口详解

	sepal length (cm)	sepal width (cm)	petal length (cm)	petal width (cm)
0	5.1	3.5	1.4	0.2
1	4.9	3.0	1.4	0.2
2	4.7	3.2	1.3	0.2
3	4.6	3.1	1.5	0.2
4	5.0	3.6	1.4	0.2
...	...	...	...	...
145	6.7	3.0	5.2	2.3
146	6.3	2.5	5.0	1.9
147	6.5	3.0	5.2	2.0
148	6.2	3.4	5.4	2.3
149	5.9	3.0	5.1	1.8

	sepal length (cm)	sepal width (cm)	petal length (cm)	petal width (cm)
0	5.1	3.5	1.4	0.2
1	4.9	3.0	1.4	0.2
2	4.7	3.2	1.3	0.2
3	4.6	3.1	1.5	0.2
4	5.0	3.6	1.4	0.2
...	...	...	...	...
145	6.7	3.0	5.2	2.3
146	6.3	2.5	5.0	1.9
147	6.5	3.0	5.2	2.0
148	6.2	3.4	5.4	2.3
149	5.9	3.0	5.1	1.8

	sepal length (cm)	sepal width (cm)	petal length (cm)	petal width (cm)
0	5.1	3.5	1.4	0.2
1	4.9	3.0	1.4	0.2
2	4.7	3.2	1.3	0.2
3	4.6	3.1	1.5	0.2
4	5.0	3.6	1.4	0.2
...	...	...	...	...
145	6.7	3.0	5.2	2.3
146	6.3	2.5	5.0	1.9
147	6.5	3.0	5.2	2.0
148	6.2	3.4	5.4	2.3
149	5.9	3.0	5.1	1.8