使用 scikit-learn进行简单回归分析

使用 scikit-learn(简称 sklearn)进行简单回归分析的教程。这里我们以波士顿房价数据集(Boston House Prices dataset)为例,介绍如何使用线性回归(Linear Regression)模型

环境准备

确保已经安装了 scikit-learn 库,如果没有安装,可以使用 pip 进行安装:

pip install scikit-learn

导入库

首先,我们需要导入所需的库。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

加载数据集

使用 sklearn 内置的 load_boston 函数来加载波士顿房价数据集。

# 加载数据集
boston = load_boston()
X = boston.data
y = boston.target

数据预处理

将数据集分为训练集和测试集。

# 分割数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

创建模型

创建一个线性回归模型的实例。

# 创建线性回归模型
lr = LinearRegression()

训练模型

使用训练集数据来训练模型。

# 训练模型
lr.fit(X_train, y_train)

模型评估

使用测试集数据来评估模型的性能。

# 预测测试集
y_pred = lr.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")

使用模型预测

使用训练好的模型进行预测。

# 使用模型预测单个数据点的房价
sample = X_test[0].reshape(1, -1)  # 确保形状正确
prediction = lr.predict(sample)
print(f"Predicted House Price: ${prediction[0]}")

可视化

我们可以选择数据集的一个特征来与目标值一起可视化,并展示回归线。

# 选择一个特征进行可视化
feature_index = 5  # 例如,使用第六个特征(房间数)
# 绘制散点图
plt.scatter(X_train[:, feature_index], y_train, color='blue', label='Training data')
# 绘制回归线
plt.plot(X_train[:, feature_index], lr.predict(X_train), color='red', label='Regression line')
# 设置图表标题和图例
plt.title('Linear Regression on Boston Housing Dataset')
plt.xlabel('Number of rooms (RM)')
plt.ylabel('House price ($1000s)')
plt.legend()
# 显示图表
plt.show()

以上就是一个使用 sklearn 进行线性回归分析的基本流程。在实际应用中,可能需要对数据进行更复杂的预处理,或者尝试不同的模型和参数来优化性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/860198.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

疲劳驾驶智能识别摄像机

疲劳驾驶智能识别摄像机在道路安全管理中扮演着越来越重要的角色。这些先进的设备不仅仅是简单的监控工具,它们通过先进的技术和算法,有效地识别和预防司机疲劳驾驶,从而大大减少了交通事故的风险。 首先,这些智能识别摄像机采用高…

IP地址的数量限制

IP地址(IPv4)是一个4字节32位的正整数,因此一共有个IP地址,即将近43亿个IP地址。但TCP/IP协议规定,每个主机都要有一个IP地址 现在全世界人口已经有70多亿了,电脑、手机等都需要IP地址。随着科技的发展&am…

如何通过数据驱动的动态调度来优化pcdn的效率?

要通过数据驱动的动态调度来优化P2P内容分发网络(PCDN)的效率,可以采取以下几个关键步骤: 一.数据收集与分析 1.流量监控:收集PCDN网络中每个节点的流量数据,包括上传、下载、转发量等。 2.性…

Android ANR日志分析指南

Android ANR日志分析指南 定义ANR类型ANR出现的原因ANR案例分析过程一、 查看events_log二、 traces.txt 日志分析 ANR 案例整理参考 定义 ANR(Application Not Responding) 应用程序无响应。如果你应用程序在UI线程被阻塞太长时间,就会出现ANR,通常出现…

2024年希望杯数学竞赛各年级100道练习题及答案

链接里面有无答案版本链接:https://pan.baidu.com/s/1nTIVJrTEWUzb0LJNo4mI_Q 提取码:0548 –来自百度网盘超级会员V7的分享 一年级 二年级 三年级 四年级 五年级 六年级 七年级 八年级

【博士每天一篇文献-算法】Fearnet Brain-inspired model for incremental learning

阅读时间:2023-12-16 1 介绍 年份:2017 作者:Ronald Kemker,美国太空部队;Christopher Kanan,罗切斯特大学 期刊: arXiv preprint 引用量:520 Kemker R, Kanan C. Fearnet: Brain-…

基于Java中的SSM框架实现萌宠优购系统项目【项目源码】计算机毕业设计

基于Java中的SSM框架实现萌宠优购系统演示 研究背景 现在人们在生活中、工作中压力与日俱增,而宠物也在人们的生活扮演者越来越重要的角色。然而,对于一些宠物爱好者来说,宠物早已经是他们生活中不可或缺的一部分。因为宠物能与人有心灵的沟…

为element-ui 打个补丁修复el-form的label width问题

为element-ui 打个补丁修复el-form的label width问题 问题回顾 用 element-ui 遇到一个奇怪的问题,控制台老是抛错 [Vue warn]: Error in beforeDestroy hook: "Error: (ElementForm]unpected width 最终排查下来是 el-form 设置了 label-width"auto" 然后又处…

Python实践项目 - 猜数字

实践项目 为了巩固所学知识并培养实践能力,我们可以设计一些有趣的实践项目。以下是一个简单的实践项目示例: 猜数字游戏 项目描述:编写一个猜数字游戏,程序随机生成一个1到100之间的整数,让玩家输入猜测的数字。如…

计算机进入安全模式

最近老是蓝屏------显示是REGISTRY_ERROR(注册表错误) 重启之后选择进入安全模式 我重启之后,按F8进不了安全模式。通过另一种方式进入,按住Shift键再按重启 重启之后出现以下界面 选择疑难解答,再选择高级选项 在高…

pandas保存成CSV格式时数据换行:SQL的REPLACE函数过滤掉数据的回车符

在使用Pandas保存数据到CSV文件时,如果数据中包含换行符(例如\n),这可能会导致数据在CSV文件中被分割成多行,影响数据的完整性和可读性。为了解决这个问题,你可以在保存CSV之前使用Pandas的replace函数来替…

【华为OD机试】日志限流(C++/Java/Python)

题目 题目描述 某软件系统会在运行过程中持续产生日志,系统每天运行N单位时间,运行期间每单位时间产生的日志条数保行在数组records中。records[i]表示第i单位时间内产生日志条数。 由于系统磁盘空间限制,每天可记录保存的日志总数上限为total条。 如果一天产生的日志总条数…

vue3 axios封装接口请求 useAxiosWithCancel hook

实际项目需求,类似机器人对话。生成对话过程中有个停止生成。点击停止生成中断请求。axios提供两种方法 1 .使用 AbortController2CancelToken 取消请求机制说明: 从 v0.22.0 开始,Axios 支持以 fetch API 方式—— AbortController 取消请求…

20240623日志:大模型压缩-sliceGPT

context 1. 剪枝方案图释2. 正交矩阵Q 1. 剪枝方案图释 Fig. 1.1 剪枝方案 图中的阴影是表示丢弃掉这部分数据。通过引入正交矩阵 Q Q Q使 Q ⊤ Q Q Q ⊤ I \mathrm{Q}^\top\mathrm{Q}\mathrm{Q}\mathrm{Q}^\top\mathrm{I} Q⊤QQQ⊤I,来大量缩减 X X X的列数和 W …

androidx.preference框架介绍

一,概要 Preference作为setting核心框架,笔者对此框架做一个简单的解析,androidx.preference本质是对设置领域提供了一层View封装,以android view本身的策略模式进行二次开发,将常用的一些设置样式封装到不同的Preference中,以达到快速开发设置相关功能。并且,此风格与…

将 MinIO 与 Keycloak OIDC 集成

Keycloak是一种单点登录解决方案。使用Keycloak,用户使用Keycloak而不是MinIO进行身份验证。如果没有Keycloak,您将不得不为每个用户创建一个单独的身份 - 从长远来看,这将很麻烦。您需要一个集中身份解决方案来管理 MinIO 的身份验证和授权。…

OpenHarmony 5.0 纯血鸿蒙系统

OpenHarmony-v5.0-Beta1 版本已于 2024-06-20 发布。 OpenHarmony 5.0 Beta1 版本标准系统能力持续完善,ArkUI 完善了组件通过 C API 调用的能力;应用框架细化了生命周期管理能力,完善了应用拉起、跳转的能力;分布式软总线连接能力…

每日一练 - IGMP Snooping工作机制详解

01 真题题目 关于 IGMP Snooping 工作机制的描述,正确的是? A.如果主机发出的 IGMP 离开报文时,交换机将该主机加入到相应的组播表中 B.如主机发出的 IGMP 主机撒告文时交换机将翻除与读主机对的组播表项 C.二层交换机通过不断听 IGMP 报文在二层建立和维护 MAC 广播地址表…

【面试题】漏洞复现的步骤

漏洞复现是信息安全工作中非常重要的一个环节,它通过对已发现的漏洞进行模拟攻击,来验证漏洞的存在性并深入理解其影响。以下是漏洞复现的主要步骤,并尽量以分点表示和归纳的形式呈现: 1. 收集漏洞信息 从漏洞公告、CVE&#xf…

laravel 使用RabbitMQ作为消息中间件

先搞定环境,安装amqp扩展 确保已安装rabbitmq-c-dev。 比如 可以使用apk add rabbmit-c-dev安装 cd ~ wget http://pecl.php.net/get/amqp-1.10.2.tgz tar -zxf amqp-1.10.2.tgz cd amqp-1.10.2 phpize ./configure make && make install cd ~ rm -rf am…