支持向量机回归(概念+实例)

目录

前言

一、基本概念

1. 支持向量机回归的原理

2. 支持向量机回归的工作方式

3. 支持向量机回归的优缺点

4. 支持向量机回归的应用

二、实例


前言

支持向量机(Support Vector Machine,SVM)是一种强大的机器学习算法,最初是用于分类问题,但后来也被扩展用于回归问题。支持向量机回归(Support Vector Regression,SVR)是一种非常有用的技术,特别适用于具有复杂特征关系的数据集。

一、基本概念

1. 支持向量机回归的原理

支持向量机回归的核心原理是通过最小化预测误差来拟合数据,并且在拟合过程中保持一个边界(间隔),使得大部分数据点都落在这个边界之内。SVR与分类问题中的支持向量机(SVC)有些相似,但其目标是拟合数据而不是分离数据。

在SVR中,我们定义一个边界,由一个中心线和两个平行的边界线组成。这些边界线之间的距离称为间隔,它由用户预先设定。支持向量机的目标是找到一个函数,使得大部分数据点都落在间隔内,并且使得落在间隔之外的数据点的预测误差最小化。这些落在间隔之外的数据点被称为支持向量。

2. 支持向量机回归的工作方式

SVR的工作方式可以通过以下步骤来理解:

a. 数据准备: 首先,将数据准备成特征矩阵和目标向量的形式。

b. 定义边界: 在SVR中,我们需要定义一个边界,即间隔。这个间隔由用户根据数据集的特点预先设定。

c. 拟合数据: SVR尝试找到一个函数,使得大部分数据点都落在间隔之内,并且最小化间隔之外的数据点的预测误差。这通常通过优化算法(如梯度下降)来实现。

d. 模型评估: 训练完成后,需要评估模型的性能。通常使用一些指标(如均方误差、R²分数等)来评估模型对未见过的数据的预测能力。

e. 参数调优: 在训练完成后,可能需要调整模型的参数,例如间隔的大小或核函数的选择,以进一步提高模型的性能。

3. 支持向量机回归的优缺点

优点:

  • 在高维空间中表现良好:SVR适用于具有大量特征的数据集,并且可以处理高维数据。
  • 对异常值的鲁棒性:由于SVR关注的是间隔和支持向量,因此对于异常值具有一定的鲁棒性。
  • 可解释性强:支持向量通常决定了模型的决策边界,这增强了模型的可解释性。

缺点:

  • 参数敏感:SVR的性能非常依赖于参数的选择,不同的参数可能会导致完全不同的结果。
  • 计算复杂度高:在处理大规模数据集时,SVR的训练和预测可能会非常耗时。

4. 支持向量机回归的应用

SVR在各个领域都有广泛的应用:

  • 金融领域:股票价格预测、汇率预测等。
  • 医学领域:疾病预测、药物研发等。
  • 工程领域:工程设计、预测材料性能等。

二、实例

这段代码会生成一个简单的正弦函数数据集,并且在数据集上拟合一个支持向量机回归模型。我们使用了径向基函数(RBF)作为核函数。最后,我们计算了模型的均方误差,并将数据集和模型的拟合结果可视化出来。

代码:

# 导入所需的库
import numpy as np
import matplotlib.pyplot as plt
from sklearn.svm import SVR
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置中文显示字体为黑体
plt.rcParams['axes.unicode_minus'] = False  # 解决负号'-'显示为方块的问题# 创建示例数据集
np.random.seed(42)
X = np.sort(5 * np.random.rand(100, 1), axis=0)
y = np.sin(X).ravel()# 添加噪声到目标变量
y[::5] += 3 * (0.5 - np.random.rand(20))# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 构建支持向量机回归模型
svr_rbf = SVR(kernel='rbf', C=100, gamma=0.1, epsilon=0.1)# 训练模型
svr_rbf.fit(X_train, y_train)# 预测
y_pred = svr_rbf.predict(X_test)# 计算模型的均方误差
mse = mean_squared_error(y_test, y_pred)
print("均方误差(MSE):", mse)# 可视化结果
plt.scatter(X_test, y_test, color='darkorange', label='data')
plt.plot(X_test, y_pred, color='navy', lw=2, label='SVR RBF')
plt.xlabel('数据')
plt.ylabel('目标变量')
plt.title('支持向量机回归')
plt.legend()
plt.show()

结果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/5165.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构与算法(Java版) | 详解十大经典排序算法之一:插入排序

接下来,我来给大家讲解第三种排序算法,即插入排序。 基本介绍 首先,我们来看下插入排序的基本介绍。 插入排序,其属内部排序法,是对于欲排序的元素以插入的方式来找寻该元素的适当位置,以便最终达到排序…

2024年十五届蓝桥杯省赛大学B组真题(Java完整版)

2024年十五届蓝桥杯省赛大学B组真题(Java) 前言: 赛后一直犹豫要不要对比赛进行复盘出个题解,拖到了现在,终于也是等到比赛结果出来,看到没有辜负个人期望成功取得省一,决定在国赛前对省赛进行…

根据txt文件绘制词云 -- python

根据一段文字绘制词云,我们有两种方法 ,一种是登录专业的绘图网站http://yciyun.com/ 不过,貌似这个网站需要会员才可以体验,他只是给出了一些形状图案的词云,虽然看起来很精美,但是他不能让我们自己随意更…

第三节课,功能2:开发后端用户的管理接口5min(用户的查询/状态更改)【4】【9开始--本人】

一、代码任务 【录个屏】 二、写代码 2.1 代码文件位置 2.2 代码如下: 2.3 官方文档: 网址: 逻辑删除 | MyBatis-Plus (baomidou.com) 三、代码有bug,没有鉴权,表里添加一个字段。role 管理员 3.1 判断操作的人&am…

Slave SQL线程与PXB FTWRL死锁问题分析

1. 问题背景 2.27号凌晨生产环境MySQL备库在执行备份期间出现因FLUSH TABLES WITH READ LOCK未释放导致备库复制延时拉大,慢日志内看持锁接近25分钟未释放。 版本: MySQL 5.7.21PXB 2.4.18 慢查询日志: 备份脚本中的备份命令:…

spring boot 基础案例【3】构建RESTful API与单元测试

教程1 案例教程 案例仓库 在线编程 教程2 基础教程 教程仓库 在线编程 本案例所在的仓库 本案例所在的文档 进入正文 1.文件目录 1. Chapter21Application.java 地址:chapter2-1/src/main/java/com/didispace/chapter21/Chapter21Application.java package com.d…

Flink checkpoint 源码分析- Flink Checkpoint 触发流程分析

序言 最近因为工作需要在阅读flink checkpoint处理机制,学习的过程中记录下来,并分享给大家。也算是学习并记录。 目前公司使用的flink版本为1.11。因此以下的分析都是基于1.11版本来的。 在分享前可以简单对flink checkpoint机制做一个大致的了解。 …

人工智慧时代的引擎:揭开机器人核心零部件的奥秘

机器人核心零部件技术现状及趋势 工业机器人是我国制造业的“顶冠明珠”,在机器人核心零部件的研发制造上,我国在很多方面已经接近国际顶尖水平,但一些核心技术仍无法满足复杂高端领域应用需求,如精密减速器的传动精度与寿命间竞争…

深度学习的瓶颈是什么!

深度学习主要的瓶颈: 数据依赖与标注问题:深度学习模型通常需要大量的标注数据来进行训练。然而,获取大量的标注数据不仅成本高昂,而且在某些领域(如医疗、金融等)中可能难以获取足够的标注数据。此外&…

人脸识别开源算法库和开源数据库

目录 1. 人脸识别开源算法库 1.1 OpenCV人脸识别模块 1.2 Dlib人脸识别模块 1.3 SeetaFace6 1.4 DeepFace 1.5 InsightFace 2. 人脸识别开源数据库 2.1 CelebA 2.2 LFW 2.3 MegaFace 2.4 Glint360K 2.5 WebFace260M 人脸识别 (Face Recognition) 是一种基于人的面部…

无人机反制:雷达探测+信号干扰器技术详解

固定翼无人机、旋翼无人机等,可折叠式无机、DIY无人机等。黑飞,监管困难给航空业带来了诸多隐患;给恐怖袭击及间谍侦察带来新的方式、引发了各国地区政府的忧虑,在中国存在的问题更加严峻。 反无人飞行器防御系统(AUDS)&#xff0…

【C++】手撕list(list的模拟实现)

目录 01.节点 02.迭代器 迭代器运算符重载 03.list类 (1)构造与析构 (2)迭代器相关 (3)容量相关 (4)访问操作 (5)插入删除 我们在学习数据结构的时候…

使用 GitHub Actions 实现项目的持续集成(CI)

目录 什么是 GitHub Actions 基础概念 Workflow 文件 Workflow 语法 实例:编译 OpenWrt 什么是 GitHub Actions GitHub Actions 是 GitHub 推出的持续集成(Continuous Integration,简称 CI)服务它允许你创建自定义工作流&am…

黑马面试篇1(续)

黑马面试篇1-CSDN博客(续集) 六、消息中间件篇 6.1 RabbitMQ 1)使用场景: 异步发送(验证码、短信、邮件…)MYSQL和Redis , ES之间的数据同步分布式事务削峰填谷… 2)RabbitMQ消息的重复消费问…

分享三款可以给pdf做批注的软件

PDF文件不像Word一样可以直接编辑更改,想要在PDF文件上进行编辑批注需要用到一些专业的软件,我自己常用的有三款,全都是官方专业正版的软件,功能丰富强大,使用起来非常方便! 1.edge浏览器 这个浏览器不仅可…

【Spring】Spring中AOP的简介和基本使用,SpringBoot使用AOP

📝个人主页:哈__ 期待您的关注 一、AOP简介 AOP的全称是Aspect-Oriented Programming,即面向切面编程(也称面向方面编程)。它是面向对象编程(OOP)的一种补充,目前已成为一种比较成…

ton-http-api安装部署

1、拉取github代码 mkdir /data git clone https://github.com/toncenter/ton-http-api.git cd ton-http-api2、创建环境变量 ./configure.py cat .env TON_API_CACHE_ENABLED0 TON_API_CACHE_REDIS_ENDPOINTcache_redis TON_API_CACHE_REDIS_PORT6379 TON_API_CACHE_REDIS_T…

Facebook’s Tectonic Filesystem: Efficiency from Exascale——论文阅读

FAST 2021 Paper 分布式元数据论文阅读笔记整理 背景 Blob storage 用来存放大量的文本、图片、视频等非结构化数据 包含 EB 级别的数据 存储内容大小不一,大小几KB到几MB不等 要求低时延 使用 Haystack 和 F4 Data warehouse 存放用于数据分析和机器学习的…

Leetcode—1232. 缀点成线【简单】

2024每日刷题&#xff08;122&#xff09; Leetcode—1232. 缀点成线 算法思想 实现代码 class Solution { public:bool checkStraightLine(vector<vector<int>>& coordinates) {int x0 coordinates[0][0];int y0 coordinates[0][1];int x1 coordinates[1…

Excel 中用于在一个范围中查找特定的值,并返回同一行中指定列的值 顺序不一样 可以处理吗

一、需求 Excel 中&#xff0c;在一列&#xff08;某范围内&#xff09;查找另一列特定的值&#xff0c;并返回同一行中另一指定列的值&#xff0c; 查找列和返回列的顺序不一样 二、 实现 1、下面是一个使用 INDEX 和 MATCH 函数的例子&#xff1a; 假设你有以下数据&…