python将数据集分成训练样本和类标签

这里假设类标签为largeDoses, smallDoses, didntLike三类，假设训练样本有三个特征属性，类标签放在数据集的最后一列

import numpy as npdef file2matrix(filename):  # filename是文件保存地址love_dictionary = {'largeDoses':3, 'smallDoses':2, 'didntLike':1}fr = open(filename)arrayOLines = fr.readlines()numberOfLines = len(arrayOLines)            # 获得文件的行数returnMat = np.zeros((numberOfLines, 3))        # 用于存放训练数据classLabelVector = []                       # 用于存放类标签index = 0for line in arrayOLines:line = line.strip() # 截取掉所有的回车字符listFromLine = line.split() returnMat[index, :] = listFromLine[0:3] # 存放训练样本if(listFromLine[-1].isdigit()): # 如果标签字符串是数字，用int（）函数转换为数字类型classLabelVector.append(int(listFromLine[-1]))else: # 如果标签字符串不是数字，利用字典转换为数字类型classLabelVector.append(love_dictionary.get(listFromLine[-1]))index += 1return returnMat, classLabelVector

isdigit()判断一个字符串是否为数字

b = ['a', '2a', '2']
print(b[0].isdigit())
print(b[1].isdigit())
print(b[2].isdigit())False
False
True

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/491811.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python将数据集分成训练样本和类标签

相关文章

图像处理-5

量子算法、DNA计算与后经典计算时代

Oracle Comment 获取并修改表或字段注释

使用Matplotlib创建散点图

数字图像-6空域滤波

特斯拉烧，特斯拉烧完蔚来烧

超出内容用省略号替代

python数据归一化

数字图像处理-7频域滤波

福布斯发布2019全球品牌价值100强：华为上榜苹果夺冠

python读取图像矩阵文件并转换为向量

PHP中一些有用的函数

一文读懂你该了解的5G知识：现在别买5G手机

mnist手写数字数据集下载

C#黑白棋制作~

未来可能发生的十大颠覆性创新

Python计算信息熵

Delphi Format函数功能及用法详解

Python绘制决策树的节点

IBM对话智能+未来：十年提升AI性能效率千倍？