1 2 3 4 5 6 | <br><br> # 1. 安装scipy,numpy,sklearn包 import numpy from sklearn.datasets import load_iris # 2. 从sklearn包自带的数据集中读出鸢尾花数据集data print (data.data) |
1 2 3 | # 3.查看data类型,包含哪些数据 data = load_iris() print (data.keys()) |
1 2 3 4 | # 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 print (data.target_names) print (data.target) type (data.target) |
1 2 | # 5.取出所有花的花萼长度(cm)的数据 print (numpy.array( list ( len [ 0 ] for len in data[ 'data' ]))) |
1 2 3 | # 6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据 print (numpy.array( list ( len [ 2 ] for len in data[ 'data' ])) ) print (numpy.array( list ( len [ 3 ] for len in data[ 'data' ]))) |
1 2 3 | # 7.取出某朵花的四个特征及其类别。 print (data.data[ 0 ]) print (data.target_names[ 0 ]) |
1 2 3 4 | # 8.将所有花的特征和类别分成三组,每组50个 setosa_data = [] versicolor_data = [] virginica_data = [] |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | # 9.生成新的数组,每个元素包含四个特征+类别 for i in range ( 0 , 150 ): #生成为setosa类的鸢尾花花数据 if data.target[i] = = 0 : data1 = data.data[i].tolist() data1.append( 'setosa' ) setosa_data.append(data1) #生成为versicolor类的鸢尾花数据 elif data.target[i] = = 1 : data1 = data.data[i].tolist() data1.append( 'versicolor' ) versicolor_data.append(data1) #剩下的为virginica类的鸢尾花数据 else : data1 = data.data[i].tolist() data1.append( 'virginica' ) virginica_data.append(data1) #生成新的数组,每个元素包含四个特征+类别 newdata = (setosa_data ,versicolor_data,virginica_data) print (newdata) |