python线性回归代码_day-12 python实现简单线性回归和多元线性回归算法

1、问题引入

在统计学中，线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。一个带有一个自变量的线性回归方程代表一条直线。我们需要对线性回归结果进行统计分析。

例如，假设我们已知一些学生年纪和游戏时间的数据，可以建立一个回归方程，输入一个新的年纪时，预测该学生的游戏时间。自变量为学生年纪，因变量为游戏时间。当只有一个因变量时，我们称该类问题为简单线性回归。当游戏时间与学生年纪和学生性别有关，因变量有多个时，我们称该类问题为多元线性回归。

2、常见的统计量

在研究该问题之前，首先了解下编程中用到的常见的统计量：

序号

概念

公式

算法

说明

均值

整体的均值

中位数

排序后取中间值

众数

出现次数最多的数

出现频率

方差

数据的离散程度

标准差

方差的开方

2、简单线性回归实例及编程实现

研究一个自变量(X)和一个因变量（y）的关系

简单线性回归模型定义：

简单线性回归方程：

其中：

为回归线的截距

为回归线的斜率

通过训练数据，求取出估计参数建立的直线方程：

实际编程时，主要是根据已知训练数据，估计出

和

的值

和

以下面实例为例，第一列表示每月投放广告的次数，第二列表示汽车向量，通过Python编程求取线性回归方程：

投放广告数

汽车销量

编程关键在于如何求取b0和b1的值，我们引入一个方程（sum of square）：

当上述方程的值最小时，我们认为求取到线程回归方程参数的值，对该方程求最小值可以进一步转化为求导和求极值的问题，求导过程省略，最后结论如下：

实际代码：

importnumpy as npfrom matplotlib importpylab as pl#定义训练数据

x = np.array([1,3,2,1,3])

y= np.array([14,24,18,17,27])#回归方程求取函数

deffit(x,y):if len(x) !=len(y):returnnumerator= 0.0denominator= 0.0x_mean=np.mean(x)

y_mean=np.mean(y)for i inrange(len(x)):

numerator+= (x[i]-x_mean)*(y[i]-y_mean)

denominator+= np.square((x[i]-x_mean))print('numerator:',numerator,'denominator:',denominator)

b0= numerator/denominator

b1= y_mean - b0*x_meanreturnb0,b1#定义预测函数

defpredit(x,b0,b1):return b0*x +b1#求取回归方程

b0,b1 =fit(x,y)print('Line is:y = %2.0fx + %2.0f'%(b0,b1))#预测

x_test = np.array([0.5,1.5,2.5,3,4])

y_test= np.zeros((1,len(x_test)))for i inrange(len(x_test)):

y_test[0][i]=predit(x_test[i],b0,b1)#绘制图像

xx = np.linspace(0, 5)

yy= b0*xx +b1

pl.plot(xx,yy,'k-')

pl.scatter(x,y,cmap=pl.cm.Paired)

pl.scatter(x_test,y_test[0],cmap=pl.cm.Paired)

pl.show()

蓝色表示测试数据，橙色表示预测数据。

3、多元线性回归实例及编程实现

多元线性回归方程和简单线性回归方程类似，不同的是由于因变量个数的增加，求取参数的个数也相应增加，推导和求取过程也不一样。

y=β0＋β１x1+β2x2+ ... +βpxp+ε

对于b0、b1、…、bn的推导和求取过程，引用一个第三方库进行计算。以如下数据为例，对运输里程、运输次数与运输总时间的关系，建立多元线性回归模型：

运输里程

运输次数

运输总时间

100

9.3

4.8

100

8.9

100

6.5

4.2

6.2

7.4

6.0

7.6

6.1

代码如下：

importnumpy as npfrom sklearn importdatasets,linear_model#定义训练数据

x = np.array([[100,4,9.3],[50,3,4.8],[100,4,8.9],

[100,2,6.5],[50,2,4.2],[80,2,6.2],

[75,3,7.4],[65,4,6],[90,3,7.6],[90,2,6.1]])print(x)

X= x[:,:-1]

Y= x[:,-1]print(X,Y)#训练数据

regr =linear_model.LinearRegression()

regr.fit(X,Y)print('coefficients(b1,b2...):',regr.coef_)print('intercept(b0):',regr.intercept_)#预测

x_test = np.array([[102,6],[100,4]])

y_test=regr.predict(x_test)print(y_test)

如果特征向量中存在分类型变量，例如车型，我们需要进行特殊处理：

运输里程

输出次数

车型

隐式转换

运输总时间

100

010

9.3

100

4.8

100

010

8.9

100

001

6.5

001

4.2

010

6.2

010

7.4

100

6.0

100

7.6

100

010

9.3

100

4.8

100

010

8.9

100

001

6.5

importnumpy as npfrom sklearn.feature_extraction importDictVectorizerfrom sklearn importlinear_model#定义数据集

x = np.array([[100,4,1,9.3],[50,3,0,4.8],[100,4,1,8.9],

[100,2,2,6.5],[50,2,2,4.2],[80,2,1,6.2],

[75,3,1,7.4],[65,4,0,6],[90,3,0,7.6],

[100,4,1,9.3],[50,3,0,4.8],[100,4,1,8.9],[100,2,2,6.5]])

x_trans=[]for i inrange(len(x)):

x_trans.append({'x1':str(x[i][2])})

vec=DictVectorizer()

dummyX=vec.fit_transform(x_trans).toarray()

x= np.concatenate((x[:,:-2],dummyX[:,:],x[:,-1].reshape(len(x),1)),axis=1)

x=x.astype(float)

X= x[:,:-1]

Y= x[:,-1]print(x,X,Y)#训练数据

regr =linear_model.LinearRegression()

regr.fit(X,Y)print('coefficients(b1,b2...):',regr.coef_)print('intercept(b0):',regr.intercept_)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/469016.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python线性回归代码_day-12 python实现简单线性回归和多元线性回归算法

相关文章

基于Springboot外卖系统14：菜品新增模块+多个数据表操作+文件上传下载复用

python层次聚类_python实现层次聚类

解析统计文本文件中的字符数、单词数、行数。

shell自动生成的文件有一个问号的后缀

基于Springboot外卖系统15：菜品分页查询模块+根据类别ID填充类别信息

python 3d渲染_python老司机带你玩玩炫酷的3D渲染，酷毙了！

Linux内存管理（最透彻的一篇）

基于Springboot外卖系统16：菜品修改模块+菜品信息回显+ID查询口味列表+组装数据并返回

POJ - 2385 Apple Catching （dp）

基于Springboot外卖系统17：新增套餐模块+餐品信息回显+多数据表存储

cocoscreator editbox 只允许数字_用Cocos做一个数字调节框

Android Jni 例程

Xshell 无法连接虚拟机中的ubuntu的问题

基于Springboot外卖系统18：套餐分页查询模块+删除套餐+多数据表同步

jsp项目开发案例_Laravel 中使用 swoole 项目实战开发案例一 (建立 swoole 和前端通信)life...

Service rootservice does not have a SELinux domain defined

Docker系列第01部分：介绍+虚拟化+什么是Decker+组件

1.7.08:字符替换

net.conn read 判断数据读取完毕_1.5 read, write, exit系统调用

Android内核学习笔记