python实现表格线性回归_Python实现线性回归

一、线性回归原理

二、python实现线性回归

1.基本矩阵运算

pratice1.py:

# Author:WYC

import numpy as np

from numpy.linalg import inv

from numpy import dot

from numpy import mat

print('-------------给定矩阵A,B----------')

A = np.mat([1,1])

print ('A:\n',A)

B = mat([[1,2],[2,3]])

print ('B:\n',B)

print('--------------矩阵乘法-----------')

print('A.B:\n',dot(A,B))

print('--------------矩阵变形----------')

print('A.T:\n',A.T)

print('A.reshape(2,1):\n',A.reshape(2,1))

print('B.reshape(1,4):\n',B.reshape(1,4))

print('B的逆:\n',inv(B))

print('B[0,:]:\n',B[0,:])

print('B[:,0]:\n',B[:,0])

#print('A.B:',dot(B,A))

2.实现最小二乘法

pratice2.py:

# Author:WYC

import numpy as np

from numpy.linalg import inv

from numpy import dot

from numpy import mat

#y=2x

X = mat([1,2,3]).reshape(3,1)

Y = 2*X

#theta = (X'X)~-1X`Y

theta = dot(dot(inv(dot(X.T,X)),X.T),Y)

print(theta)

3.实现梯度下降法

pratice3.py:

# Author:WYC

import numpy as np

from numpy.linalg import inv

from numpy import dot

from numpy import mat

#y=2x

X = mat([1,2,3]).reshape(3,1)

Y = 2*X

#theta = theta - alpha*(theta*X -Y)*X

theta = 1.

alpha = 0.1

for i in range(100):

theta = theta + np.sum(alpha * (Y- dot(X, theta))*X.reshape(1,3))/3.

print(theta)

4.回归分析实战

注:从笔记上copy一个网友的数据生成,列数不够,缺少y和x0部分,进行了修改,后面很多次试验用梯度下降方法求解thera都是NAN的结果,经过调试,发现可能是小数保留位数太多所致,所以用round函数保留一位小数,做到和讲解的数据一致:

data.py:

# Author:WYC

import random

def Y(X0, X1, X2, X3):

return 0.65 * X1 + 0.70 * X2 - 0.55 * X3 + 1.95

def Produce():

filename = 'data.csv'

with open(filename, 'w') as file:

file.write('X0,Y,X1,X2,X3,\n')

for i in range(200):

random.seed()

x0 = i

x1 = round(random.random() * 2,1)

x2 = round(random.random() * 2,1)

x3 = round(random.random() * 2,1)

y = round(Y(x0 , x1, x2, x3),1)

try:

file.write(str(x0) + ',' + str(y) +',' + str(x1) + ',' + str(x2) + ',' + str(x3) + '\n')

except e:

print ('Write Error')

print (str(e))

if __name__ == '__main__':

Produce()

#打印csv中的数据格式,后面几行可以不要

import pandas as pd

dataset = pd.read_csv('data.csv')

print(dataset)

获得x

获得y

通过最小二乘法计算thera值

# Author:WYC

import numpy as np

from numpy.linalg import inv

from numpy import dot

from numpy import mat

import pandas as pd

dataset = pd.read_csv('data.csv')

# print(dataset)

temp = dataset.iloc[:, 2:5]

temp['X0'] = 1

X = temp.iloc[:, [3, 0, 1, 2]]

# print(X)

# Y = dataset.iloc[:,1]

# print(Y)

Y = dataset.iloc[:,1].values.reshape(200,1)#Y需要转置

# # 通过最小二乘法(向量法)算theta

theta = dot(dot(inv(dot(X.T, X)),X.T), Y)

print(theta)

通过梯度下降法计算thera值

pratice4.py全部代码如下:

# Author:WYC

import numpy as np

from numpy.linalg import inv

from numpy import dot

from numpy import mat

import pandas as pd

dataset = pd.read_csv('data.csv')

# print(dataset)

temp = dataset.iloc[:, 2:5]

temp['X0'] = 1

X = temp.iloc[:, [3, 0, 1, 2]]

# print(X)

# Y = dataset.iloc[:,1]

# print(Y)

Y = dataset.iloc[:,1].values.reshape(200,1)#Y需要转置

# # 通过最小二乘法(向量法)算theta

theta = dot(dot(inv(dot(X.T, X)),X.T), Y)

print(theta)

# 通过梯度下降方法算theta

theta = np.array([1., 1., 1., 1.]).reshape(4, 1)

alpha = 0.1

temp = theta #使用缓存,使得梯度下降的时候更新

#200一般是lenth(Y)得到

# X0 = X.iloc[:, 0].reshape(200, 1)

# X1 = X.iloc[:, 1].reshape(200, 1)

# X2 = X.iloc[:, 2].reshape(200, 1)

# X3 = X.iloc[:, 3].reshape(200, 1)

# reshape 运行报错的话,是因为在pandas里面已经过时

X0 = X.iloc[:, 0].values.reshape(200, 1)

X1 = X.iloc[:, 1].values.reshape(200, 1)

X2 = X.iloc[:, 2].values.reshape(200, 1)

X3 = X.iloc[:, 3].values.reshape(200, 1)

# 同步更新

for i in range(1000):

temp[0] = theta[0] + alpha*np.sum((Y- dot(X, theta))*X0)/200.

temp[1] = theta[1] + alpha*np.sum((Y- dot(X, theta))*X1)/200.

temp[2] = theta[2] + alpha*np.sum((Y- dot(X, theta))*X2)/200.

temp[3] = theta[3] + alpha*np.sum((Y- dot(X, theta))*X3)/200.

theta = temp

print(theta)

(完结)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/534782.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux后台启动脚本nohup,linux下后台执行shell脚本nohup

【GSM】GTM900C的应用——短信虽说GSM已经很老旧,但其低廉的价格,非常适合一些需要小数据上网传输和短信等功能的应用场合. 不知道GSM能否像51单片机一样,在低端应用中长久不衰.GTM900C发送短信,支持两种模式,TXT和PD ...iOS UITabBarController的使用UITabBarController 和 UI…

华为4g模块 linux驱动程序,定制Android之4G-LTE模块驱动

定制Android之4G-LTE模块驱动一. 简介本文讲述在Android内核中,添加中国移动4G-LTE制式华为MU909模块驱动,实现通过4G上网业务,电话业务,短信业务。CPU:Samsung 6410Kernel:linux 2.6.36…

软件测试用例_软件测试用例设计实战场景法

不点蓝字,我们哪来故事? 目录场景法扩展例子场景法介绍影子场景法用例设计举例场景法设计用例步骤和表示场景法举例 总结 场景法的注意点场景法影子本来想直接跳过场景法的,今天群友提出问题:1、面试官问:场景…

linux下printf语句执行时间,linux下printf中\n刷新缓冲区的疑问(已解决)

#include #include int main(void){ printf("hello world");close(STDOUT_FILENO); return 0;}//什么都不输出12345678910111234567891011#include #include int main(void){ printf("hello world\n");close(STDOUT_FILENO); …

树莓派摄像头_Arducam 8MP重磅来袭,为树莓派4B构建完全同步的双摄像头方案~

大家好,我是小月月。双目立体景深一直是很热门的项目,最近已经有不少小伙伴学会在树莓派上插两个USB摄像头了,这个方案可以识别静态场景中各个物体的距离远近。但是两个USB摄像头捕获到的两组图像序列的时间并不是严格同步的,对运…

linux 获取设备树源文件(dts)里描述的资源,Linux 获取设备树源文件(DTS)里描述的资源...

在linux使用platform_driver_register() 注册 platform_driver 时, 需要在 platform_driver 的probe() 里面知道设备的中断号, 内存地址等资源。这些资源的描述信息存放在 resource 数据结构中, 相同的资源存放在一个树形树形数据结构中&…

python无法安装第三方库read time out_解决pip install的时候报错timed out的问题

安装包的时候报错,执行:pip install pyinstaller问题:File "c:\python\python35\lib\site-packages\pip\_vendor\requests\packages\urllib3\response.py", line 357, in streamdata self.read(amtamt, decode_contentdecode_cont…

嵌入式linux文件系统类型,嵌入式Linux 的Cramfs 根文件系统配置的解决方案

当系统启动并执行到系统初始化脚本/etc/init.d/rcS 时,mount 命令将/mnt/yaffs 目录挂载 为ramfs 类型的随机存储文件系统,并在此文件系统上建立Qtopia 和Qtopia/tmp 目录[5], /Qtopia/tmp 目录即为应用程序可能对文件系统进行写操作的临时文…

python nlp data_Python nlpaug包_程序模块 - PyPI - Python中文网

NLPAUG这个python库帮助您为机器学习项目增加nlp。访问此简介了解Data Augmentation in NLP。Augmenter是增广的基本元素,而Flow是将多个增广器组合在一起的管道。起动指南增强器TargetAugmenterActionDescriptionCharacterRandomAuginsertInsert character randoml…

Linux创始人数据结构,Linux 通用数据结构说明

device_driver include/linux/device.h struct device_driver {const char * name; /* 驱动名称 */struct bus_type * bus; /* 总线类型 */struct completion unloaded; /* 卸载事件通知机制 */ struct kobject kobj; /* sys 中…

python在浏览器运行一片空白_Webdriver启动Firefox浏览器后,页面显示空白

在使用pycharm码代码时编译总是出错,后来验证发现浏览器启动后出现问题。白白耗了我2个小时。我把我的解决方案写出来,希望对大家有帮助。1.现象:起初安装的时候总是能正常运行,有一天突然发现Webdriver打开fFirefox浏览器后&…

centos linux7修改主机名,CentOS7操作系统下永久修改主机名

操作系统:CentOS Linux release 7.8任务:修改主机名为sky9899操作步骤如下:[root146 ~]# hostname*.*.*.*.adsl-pool.jx.chinaunicom.com[root146 ~]# hostnamectlStatic hostname: localhost.localdomainTransient hostname: *.*.*.*.adsl-…

稀疏自编码器_自编码(AutoEncoder)模型及几种扩展之二

4. 稀疏自编码假设我们只有一个没有类别标签的训练样本集合{x(1),x(2)...},一个自编码神经网络就是一种非监督学习算法,它使用BP算法,并将目标值设为: y(i)x(i)。我们的目标是希望得到hW,b(X)≈x。用aj(2)(x)表示输入向量x对隐藏层单元j的激活…

linux x86 关机 过程,linux在x86上的中断处理过程(详细)

Linux在x86上的中断处理过程一:引言在Intel的文档中,把中断分为两种。一种是异常,也叫同步同断。一种称之为中断,也叫异常中断。同步中断指的是由CPU控制单元产生,之所以称之为同步,是因为只有一条指令执行完毕后才会发出中断。例如除法运算中,除数为零的时候,就会产…

thymealf 高级用法_Thymeleaf

JSP 已经存在很长时间了,很多公司还在用,它看起来像 HTML,但其实并不是,它有一些缺陷。比如,每个页面顶部都需要有如下声明与 Servlet 规范紧密耦合的,依赖 Servlet 容器(意味着无法直接浏览效果)。工作过的…

linux 显卡转码,ffmpeg用GPU转码

8种机械键盘轴体对比本人程序员,要买一个写代码的键盘,请问红轴和茶轴怎么选?有些视频编码太屌,播放起来对CPU消耗巨大,而在电视上或者电视盒子上看视频,编码就需要合适,楼主用的FireTV Stick&a…

ant实例 jmeter_Jmeter+ant搭建环境

1.将jmeter3.3和ant1.9.6放在一个文件夹下2.配置环境a、安装jdk,配置环境变量变量名: JAVA_HOME变量值: C:\Program Files\Java\jdk1.8.0_91 (即jdk安装的位置)变量名: Path (这个变量名已在系统变量中存在,现只需在这…

c语言课程设计作业五子棋,C语言课程设计报告五子棋游戏课程设计

C语言课程设计报告五子棋游戏课程设计 C语言课程设计报告_五子棋游戏-课程设计C语言课程设计报告_五子棋游戏|c语言程序代码编程小程序设计|c语言课程设计报告课程案例**********************************************************//* 本程序在Turbo C或Borland C下编译通过 */…

sqlmap图形化_Web安全:SQL注入工具

原标题:Web安全:SQL注入工具SQL注入工具主要是针对Web服务器后台数据库的注入,其主要目的是获取数据库中的数据。以前常用的SQL注入工具有啊D注入工具及Domain(明小子注入工具),现在常用的SQL注入工具有HackBar、SQLMap、Pangolin…

在c语言程序中 对文件进行操作首先要,《C语言程序设计》试题八及答案

版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如果有侵权请立即联系:55525090qq.com,我们立即下架或…