python将数据集分成训练样本和类标签

这里假设 类标签为largeDoses, smallDoses, didntLike三类,假设训练样本有三个特征属性,类标签放在数据集的最后一列

import numpy as npdef file2matrix(filename):  # filename是文件保存地址love_dictionary = {'largeDoses':3, 'smallDoses':2, 'didntLike':1}fr = open(filename)arrayOLines = fr.readlines()numberOfLines = len(arrayOLines)            # 获得文件的行数returnMat = np.zeros((numberOfLines, 3))        # 用于存放训练数据classLabelVector = []                       # 用于存放类标签index = 0for line in arrayOLines:line = line.strip() # 截取掉所有的回车字符listFromLine = line.split() returnMat[index, :] = listFromLine[0:3] # 存放训练样本if(listFromLine[-1].isdigit()): # 如果标签字符串是数字,用int()函数转换为数字类型classLabelVector.append(int(listFromLine[-1]))else: # 如果标签字符串不是数字,利用字典转换为数字类型classLabelVector.append(love_dictionary.get(listFromLine[-1]))index += 1return returnMat, classLabelVector

isdigit()判断一个字符串是否为数字

b = ['a', '2a', '2']
print(b[0].isdigit())
print(b[1].isdigit())
print(b[2].isdigit())False
False
True

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/491811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图像处理-5

1.图像的数学变换 空间域:图像的代数运算和几何运算都是利用对输入图像进行加工而得到输出图像 转换空间:最典型的有离散傅里叶变换将原定义在图像空间的图像以某种形式转换到另外一些空间,并利用输入图像在这些空间的特有性质有效而快速地…

量子算法、DNA计算与后经典计算时代

来源:资本实验室二进制与伟大的计算机相结合,推动人类进入了信息化时代。在这个基于物质世界的,由0和1构成的新世界中,我们依靠算法和电子技术不断解决了大量曾经无法解决的问题。然而,好奇的人类总是善于提出新的、更…

Oracle Comment 获取并修改表或字段注释

select * from dba_tables where owner DINGYINGSI; select * from user_col_comments where table_name STUDENT;comment on table "STUDENT" is 这是学生信息表; comment on column STUDENT.ID is 这是一个学生的ID;注意表名的大小写 转载于:https://www.cnblogs…

使用Matplotlib创建散点图

假设data是m行两列的训练样本,labels是m行一列的类标签,类标签一共有3类,分别用1、2、3表示,现将data用散点图表示出来,且不同类的样本有不同的颜色: import matplotlib.pyplot as pltfig plt.figure() a…

数字图像-6空域滤波

空域处理 基本概念: 理论基础——线性系统响应:卷积理论 卷积的离散表达式,基本上可以理解为模板运算的数学表达式 由此,卷积的冲击响应函数h(x,y),称为空域卷积模板。 空域滤波及滤波器的定义 使用空域模板进行的…

特斯拉烧,特斯拉烧完蔚来烧

来源:36氪最关键的问题还是在电池。又一台蔚来汽车自燃了。5月16日,上海嘉定一个小区的地下车库,一台黑色的蔚来ES8突然冒出大量浓烟。消防人员及时赶到,扑灭烟雾并封锁了现场,才没有引起火灾。根据车主的描述&#xf…

超出内容用省略号替代

最近学习了一下怎么用省略号代替超出的文本。 虽然网上的资料很多&#xff0c;但俗话说得好&#xff0c;好记性不如烂笔头&#xff0c;还是记一下吧&#xff01; 有两种方法&#xff0c;第一是用CSS实现&#xff1b;第二是用js HTML <p id"text">9月10日&#…

python数据归一化

在机器学习中&#xff0c;往往需要归一化数据集&#xff0c;下面的公式可以把数据归一化到0~1区间&#xff1a; newvalue &#xff08;oldvalue - min&#xff09;/&#xff08;max - min&#xff09; python实现的代码如下&#xff1a; def autoNorm(dataSet):minVals da…

数字图像处理-7频域滤波

傅里叶变化特性及其应用

福布斯发布2019全球品牌价值100强:华为上榜苹果夺冠

来源&#xff1a;世界科技创新论坛百强品牌中&#xff0c;有56个来自美国公司&#xff0c;前10名中有80%是美国公司的品牌。德国、法国和日本排在美国之后&#xff0c;分别有11个、7个、6个品牌上榜。上榜品牌共来自16个国家。5月23日&#xff0c;福布斯发布了一年一度的全球品…

python读取图像矩阵文件并转换为向量

假设图像矩阵大小为3232&#xff0c;将其转换为向量&#xff0c;首先创建11024的NumPy数组&#xff0c;然后打开给定的文件&#xff0c;循环读出文件的前32行&#xff0c;并将每行的头32个字符值存储在NumPy数组中 import numpy as npdef img2vector(filename):returnVect np…

PHP中一些有用的函数

<?php/** * 加密解密* * param string $key* param string $string* param string $decrypt* return string */ function encryptDecrypt($key, $string, $decrypt) {if($decrypt){$decrypted rtrim(mcrypt_decrypt(MCRYPT_RIJNDAEL_256, md5($key), base64_decode($stri…

一文读懂你该了解的5G知识:现在别买5G手机

来源&#xff1a; 腾讯科技2019年是中国全力布局5G的一年&#xff1a;三大运营商纷纷搭建基站&#xff0c;手机厂商发布5G手机&#xff0c;部分城市已经开启了5G测试……在电信日这天&#xff0c;腾讯科技联合知乎推出重磅策划&#xff0c;聚焦和5G相关的小知识&#xff0c;精选…

mnist手写数字数据集下载

下载地址&#xff1a;http://yann.lecun.com/exdb/mnist/

C#黑白棋制作~

前些天自己复习一下C#语言 做了个黑白棋&#xff0c;望大家看一下&#xff0c;可能有些bug嘿嘿 链接如下 http://files.cnblogs.com/files/flyingjun/%E9%BB%91%E7%99%BD%E6%A3%8BV1.2.rar 还有源文件 http://files.cnblogs.com/files/flyingjun/%E9%BB%91%E7%99%BD%E6%A3%8B.r…

未来可能发生的十大颠覆性创新

转自&#xff1a;工信头条本文发表于《中国工业和信息化》杂志2019年5月刊总第12期科技作家凯文凯利认为&#xff1a;“未来在其初期将发展得非常缓慢&#xff0c;随之便可一蹴而就。”随着时间缓慢出现的规模化变革很容易被忽视&#xff0c;但实际上在一个快速创新的世界中&am…

Python计算信息熵

计算信息熵的公式&#xff1a;n是类别数&#xff0c;p(xi)是第i类的概率 假设数据集有m行&#xff0c;即m个样本&#xff0c;每一行最后一列为该样本的标签&#xff0c;计算数据集信息熵的代码如下&#xff1a; from math import logdef calcShannonEnt(dataSet):numEntries …

Delphi Format函数功能及用法详解

DELPHI中Format函数功能及用法详解 DELPHI中Format函数功能及用法详解function Format(const Format: string; const Args: array of const): string; $[SysUtils.pas 功能&#xff1a;返回按指定方式格式化一个数组常量的字符形式 说明 这个函数是Delphi中用得最多的函数&…

Python绘制决策树的节点

import matplotlib.pyplot as pltdecisionNode dict(boxstyle"sawtooth", fc"0.8") # 决策节点的属性。boxstyle为文本框的类型&#xff0c;sawtooth是锯齿形&#xff0c;fc是边框线粗细 # 可以写为decisionNode{boxstyle:sawtooth,fc:0.8} leafNode dic…

IBM对话智能+未来:十年提升AI性能效率千倍?

来源&#xff1a;云科技时代140多前的1879年&#xff0c;爱迪生经过几千次试验发明了电灯&#xff1b;之后过了90年的1969年美国把人类送到了月球&#xff0c;1970年空中客车公司诞生。在1870年代&#xff0c;人类初次进入电力时代的时候&#xff0c;没有人能够想到有一天人类可…