# 将数据集按照比例划分为训练集和测试集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,labels,random_state=random_state,# 作用是通过随机数来随机取得一定量得样本作为训练样本和测试样本train_size,test_size)return train_data, test_data, train_label, test_label
在运行上面代码的时候出现了错误
查了一下sklearn.model_selection.train_test_split函数的参数,发现两个参数第二个是超参数,因此我们在传入参数的时候需要指明变量,而不是直接传入
数据集划分:sklearn.model_selection.train_test_split(*arrays, **options)
主要参数说明:
*arrays:可以是列表、numpy数组、scipy稀疏矩阵或pandas的数据框
# 将数据集按照比例划分为训练集和测试集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,labels,random_state=random_state,# 作用是通过随机数来随机取得一定量得样本作为训练样本和测试样本train_size = train_size,test_size = test_size)return train_data, test_data, train_label, test_label
这样就不会报错啦