机器学习——文件的读取
- (一).txt文件的读取
- (二)excel文件读取操作
(一).txt文件的读取
txt的链接
链接:https://pan.baidu.com/s/1fIAUdCDTpR7TiqLHZtx1yg
提取码:0929
python strip() 函数和 split() 函数的详解及实例
一直以来都分不清楚strip和split的功能,实际上strip是删除的意思;而split则是分割的意思。因此也表示了这两个功能是完全不一样的,strip可以删除字符串的某些字符,而split则是根据规定的字符将字符串进行分割。
split()函数
split():拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)
inst=[]data=[]with open('lenses.txt', 'r') as fr:for inst in fr.readlines():#一行一行的读取print(inst.strip().split('\t'))data.append(inst.strip().split('\t'))print('输出读取到的全部数据:')print(data)
(二)excel文件读取操作
excel文件链接:
链接:https://pan.baidu.com/s/1JTX7a4qwi9biuLecQfleUQ
提取码:0929
使用pandas读取文件,使用numpy选取那几列,和切片
import pandas as pd
import numpy as np
import xlrd
from numpy import *
import matplotlib.pyplot as plt
data = pd.read_excel('02.美国新冠肺炎疫情历史总数据9.9.xlsx')
X = np.array(data.drop(['时间','总确诊'],axis=1))
y = np.array(data['总确诊'])
print("新增_治愈_死亡(这三列数据)")
print(X)
print("总确诊(这列数据)")
print(y)# 划分训练集和测试集X_train = X[0:217] # 0~216 作为训练集
y_train = y[0:217]
print("训练集:新增_治愈_死亡(这三列数据)")
print(X_train)
print("训练集:总确诊(这列数据)")
print(y_train)X_test = X[217:226] # 216~225 作为测试集
y_test = y[217:226]
print("测试集:新增_治愈_死亡(这三列数据)")
print(X_test)
print("测试集:总确诊(这列数据)")
print(y_test)