零基础机器学习(5)之线性回归模型的性能评估

文章目录

    • 线性回归模型的性能评估
      • 1.举例1-单一特征
      • 2.举例2-多特征

线性回归模型的性能评估

评估线性回归模型时,首先要建立评估的测试数据集(测试集不能与训练集相同),然后选择合适的评估方法,实现对线性回归模型的评估。

回归任务中最常用的评估方法有均方误差、均方根误差和预测准确率(确定系数)。

1.举例1-单一特征

分别对两个模型进行评估,输入的测试集如表所示。

面积/(m2)售价/(万元)面积/(m2)售价/(万元)
103301115344
9027589276
6020670210
5016045124
5519078235
#输入测试集
x_test=np.array([[103],[115],[90],[89],[60],[70],[50],[45],[55],[78]])							  #房屋面积
y_test=np.array([[301],[344],[275],[276],[206],[210],[160],[124],[190],[235]])						  #售价
#计算三个值
mse=np.average((y2-np.array(y))**2)	  #均方误差
rmse=np.sqrt(mse)		  #均方根误差
r2=model.score(x_test,y_test)	  #预测准确率
#输出三个值
print("均方误差为:",mse)		  #输出均方误差
print("均方根误差为:",rmse)		  #输出均方根误差
print("预测准确率为:",r2)		  #输出预测准确率

2.举例2-多特征

利用Sklearn中自带的数据集——糖尿病数据集训练一个模型,然后对这个模型进行评估。

#导入线性回归模型、糖尿病数据集及划分样本的方法
from sklearn.linear_model import LinearRegression 
from sklearn.datasets import load_diabetes	   #导入糖尿病数据集
from sklearn.model_selection import train_test_split 
#将数据集划分为训练集和测试集
x,y=load_diabetes().data,load_diabetes().target
x_train,x_test,y_train,y_test=train_test_split(x,y,random_state=8)
#train_test_split()函数用于将数据集划分为训练集和测试集,该函数默认把数据集的75%作为训练集,把数据集的25%作为测试集,也可使用test_size设置测试集所占的比例;
#random_state的值相当于一种规则,通过设定为相同的数值,每次划分样本时,分割的结果都相同。#训练模型
model=LinearRegression()
model.fit(x_train,y_train)
#求解线性回归方程参数
print("w=",model.coef_,"b=",model.intercept_)

w= [ 11.51226671 -282.51443231 534.2084846 401.73037118
-1043.90460259 634.92891045 186.43568421 204.94157943
762.46336088 91.95399832] b= 152.5625670974632

从代码的运行结果可以看到,w的值有多个,说明数据集的维度有多个,数据集的复杂性很高。

#计算模型的预测准确率
r21=model.score(x_train,y_train)	#计算模型在训练集上的预测准确率
r22=model.score(x_test,y_test)	#计算模型在测试集上的预测准确率
#输出模型的预测准确率
print("模型在训练集上的预测准确率为:",r21)	
print("模型在测试集上的预测准确率为:",r22)

该模型的预测准确率比二手房模型低了很多,在训练集上的预测准确率约为53%,而在测试集上的预测准确率只有约46%。在训练集与测试集的预测准确率之间存在很大差异,这是过拟合的表现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/765759.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

设计模式——模板方法模式封装.net Core读取不同类型的文件

1、模板方法模式 模板方法模式:定义一个操作中的算法骨架,而将一些步骤延迟到子类中,模板方法使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤。 特点:通过把不变的行为搬移到超类,去除子类中重复的代…

css的transition详解

CSS的transition属性是一个简写属性,用于设置四个过渡效果属性,以在元素的状态改变时创建平滑的动画效果。这四个属性分别是: transition-property: 定义应用过渡效果的CSS属性名称。当指定的CSS属性改变时,过渡效果将…

【保姆级讲解Linux常见命令】

🌈🌈🌈🌈欢迎 🌈🌈🌈 🎉👍点赞⭐评论⭐收藏🎉 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让…

力扣---零钱兑换---动态规划

思路: 这是一道典型的动态规划问题(希望下次不用提示,能直接认出来):我将g[i]定义为总金币为i所需的最少硬币个数。所以递推公式可以表示为:g[i]min(g[i-1],g[i-2],g[i-5])1,也就是g[i]min(g[i-…

类似于 FastAdmin的快速后台开发框架都有哪些

类似于FastAdmin,能够根据数据表直接生成程序、语言包和界面的框架,确实存在一些其他的选项。以下是一些推荐: ThinkPHP框架的扩展与工具:除了FastAdmin,ThinkPHP作为一个流行的PHP框架,有很多扩展和工具可…

【算法】棋盘(模板题)

小蓝拥有 nn 大小的棋盘,一开始棋盘上全都是白子。 小蓝进行了 m 次操作,每次操作会将棋盘上某个范围内的所有棋子的颜色取反(也就是白色棋子变为黑色,黑色棋子变为白色)。 请输出所有操作做完后棋盘上每个棋子的颜色。 输入格式 输入的第…

【Python音视频技术】玩AI视频创作引发写Python音视频技术系列文章1---视频添加字幕

最近对视频创作感兴趣, 详情见之前写的几篇文章。 【AI应用】模仿爆款视频二次创作短视频操作步骤 【人工智能】AI数字人视频演示 【人工智能】AI视频二次创作演示 作为程序员出身的我,看到一些功能, 我都有猎奇的习惯, 想着自己用什么技…

js数据流详细讲解

文章目录 单向数据流单向数据流示例: 双向数据流双向数据流示例: 延伸和扩展状态管理Redux 示例: 异步数据流异步操作示例(使用 async/await): 数据转换和处理数据处理示例(使用 lodash): 实时数…

【软件测试】探索和学习在模型中的软件测试

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法|MySQL| ​💫个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-JIGESSc1ecUpVUnH {font-family:"trebuchet ms",verdana,arial,sans-serif;f…

Hive自定义GenericUDF函数

Hive自定义GenericUDF函数 当创建自定义函数时,推荐使用 GenericUDF 类而不是 UDF 类,因为 GenericUDF 提供了更灵活的功能和更好的性能。以下是使用 GenericUDF 类创建自定义函数的步骤: 编写Java函数逻辑:编写继承自 GenericUDF…

七种查找方式(Java)

一、基本查找 也叫做顺序查找 说明:顺序查找适合于存储结构为数组或者链表。 基本思想:顺序查找也称为线形查找,属于无序查找算法。从数据结构线的一端开始,顺序扫描,依次将遍历到的结点与要查找的值相比较&#xff…

数字功放VS模拟功放,选择适合你的音频解决方案

数字功放和模拟功放是音频系统中常用的两种功放技术,适用于不同的音频应用,都具有各自的优势和特点。本文将为您详细介绍数字功放和模拟功放的差异,并帮助您找到适合自己的音频解决方案。 1、数字功放是一种利用数字信号处理技术的功放。它将…

Unity:2D

目录 1. 简介 2. 2D Sorting 3. 9-slicing Sprites 3.1 9-slicing and Colliders 4. Sprite Renderer 5. Sprite Creator 6. Sprite Editor 6.1 Slice 6.1 Resize polygons 6.2 Custom Outline 6.3 Custom Physics Shape 6.4 Secondary Textures 6.5 Data Provider…

基础:TCP四次挥手做了什么,为什么要挥手?

1. TCP 四次挥手在做些什么 1. 第一次挥手 : 1)挥手作用:主机1发送指令告诉主机2,我没有数据发送给你了。 2)数据处理:主机1(可以是客户端,也可以是服务端)&#xff0c…

常见六大WEB安全问题

一、XSS跨站脚本攻击 1.Cross-Site Scripting(跨站脚本攻击)简称 XSS(因为缩写和 CSS重叠,所以只能叫 XSS),是一种代码注入攻击。攻击者通过在目标网站上注入恶意脚本,使之在用户的浏览器上运行…

错误groupadd: cannot open /etc/group的解决方法

今天在客户的服务器上安装mysql创建用户时遇到了groupadd: cannot open /etc/group错误,记录一下错误解决方法。 该错误的原因是因为对系统的关键文件进行了锁定,防止篡改,可以通过以下命令查看是否锁定: lsattr /etc/group 显…

力扣---全排列---回溯

思路: 递归做法,一般会有visit数组来判断第 i 位是否被考虑了。我们先考虑第0位,再考虑第1位,再考虑第2位...dfs函数中还是老套路,先判定特殊条件,再从当下的角度(决定第 j 位是哪个元素&#x…

Java 枚举(超详细讲解)

Java语言的强大之处在于它提供了多种多样的类库,从而大大提高了程序的编程效率和质量。 一、枚举 事先考虑到某一变量可能的取值,尽可能用自然语言忠表意清楚的单词来表示它的每一个值,用这中思路定义的类型被称为枚举类型。 枚举事由一组固…

获取淘宝商品评论的爬虫技术分享(已封装API,可测试)

item_review-获得淘宝商品评论 公共参数 请求地址: taobao/item_review 名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)secretString是调用密钥api_nameString是API接口名称(包括在请求地址中)[item_search,it…

零基础机器学习(4)之线性回归的基本原理

文章目录 一、线性回归的基本原理1.相关与回归2.线性回归的原理分析①线性回归的一般公式②线性回归的损失函数③线性回归方程的参数求解方法A.最小二乘法B.梯度下降法 一、线性回归的基本原理 1.相关与回归 相关描述的是变量之间的一种关系。 从统计角度看,变量之…