为什么w 和 b成同比例变化对超平面没有影响

文章目录

  • 解释
  • 可视化证明
  • 数乘角度进行解释
  • 可视化代码领取


解释

在机器学习中,特别是支持向量机(SVM)和线性回归等模型中,参数 w w w b b b分别代表权重向量和偏置项。当说 w w w b b b成规模变化对超平面没有影响时,是指在某些情况下,改变 w w w b b b的尺度不会改变模型的决策边界或超平面。

具体来说,考虑一个线性分类器,其决策函数可以表示为:
f ( x ) = w T x + b f(x)=w^Tx+b f(x)=wTx+b

如果对 w w w b b b进行成比例的缩放,例如乘以一个常数 k k k,那么新的参数变为 k w kw kw k b kb kb。此时,决策函数变为:
f ′ ( x ) = ( k w ) T x + k b = k ( w T x + b ) = k f ( x ) f'(x)=(kw)^Tx+kb=k(w^Tx+b)=kf(x) f(x)=(kw)Tx+kb=k(wTx+b)=kf(x)

可以看到,新的决策函数 f ′ ( x ) f'(x) f(x)只是原决策函数 f ( x ) f(x) f(x)的一个常数倍。在分类问题中,这并不会改变决策边界的位置,因为分类的阈值(通常是0)也会相应地缩放。在回归问题中,这也不会改变模型的预测值,因为预测值只是被乘以一个常数。

因此,尽管 w w w b b b的数值发生了变化,但模型的本质特性(如决策边界或预测值)并没有改变。这就是为什么 w w w b b b成规模变化对超平面没有影响的原因。

w w w b b b的成比例变化不会改变模型的决策边界或预测值,因为这种变化可以通过相应的阈值或输出缩放来抵消。


可视化证明

在这里插入图片描述
在这里插入图片描述

参数

w1, w2, w3 = 1, -1, 2  # 权重
b = 0.5                # 偏置

在这里插入图片描述
在这里插入图片描述

参数:

h1, h2, h3 = 2, -2, 4  # 权重
b0 = 1                 # 偏置

在这里插入图片描述在这里插入图片描述

两者叠加展示


数乘角度进行解释

w和b同比例变化相当于对增广矩阵进行了数乘。

在几何上,数乘矩阵(即矩阵乘以一个标量)相当于对矩阵中的每个元素进行缩放操作。这种缩放操作在几何上可以解释为对矩阵所表示的几何对象进行均匀的缩放变换。

具体来说,如果有一个矩阵 A A A表示一个几何对象(例如,一组点的坐标),那么数乘矩阵 k A kA kA(其中 k k k是一个标量)相当于对每个点的坐标进行 k k k倍的缩放。

以下是一些具体的几何解释:

1.点的缩放:如果矩阵 A A A表示一组点的坐标,那么 k A kA kA表示将每个点的坐标按比例 k k k进行缩放。例如,如果 k > 1 k>1 k>1,则每个点会远离原点;如果 0 < k < 1 0<k<1 0<k<1,则每个点会靠近原点。

2.图形的缩放:如果矩阵 A A A表示一个图形(例如,多边形或曲线),那么 k A kA kA表示将整个图形按比例 k k k进行缩放。例如,如果 k > 1 k>1 k>1,则图形会变大;如果 0 < k < 1 0<k<1 0<k<1,则图形会变小。

3.向量的缩放:如果矩阵 A A A表示一组向量,那么 k A kA kA表示将每个向量的长度按比例 k k k进行缩放,而方向保持不变。例如,如果 k > 1 k>1 k>1,则每个向量的长度会增加;如果 0 < k < 1 0<k<1 0<k<1,则每个向量的长度会减少。

数乘矩阵在几何上相当于对矩阵所表示的几何对象进行均匀的缩放变换,这种变换不会改变对象的形状,只会改变其大小。所以对超平面的划分没有影响


可视化代码领取

关注微信公众号 司南锤 ,后台回复 w 和 b成同比例变化可视化代码,可以获得展示变化效果的可视化代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/876207.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pikachu靶场之目录遍历、敏感信息泄露

一、目录遍历 漏洞概述 在web功能设计中,很多时候我们会要将需要访问的文件定义成变量&#xff0c;从而让前端的功能便的更加灵活。 当用户发起一个前端的请求时&#xff0c;便会将请求的这个文件的值(比如文件名称)传递到后台&#xff0c;后台再执行其对应的文件。 在这个过…

邮件攻击案例系列二:冒充合作伙伴伪造发票商务邮件诈骗

案例描述 2023 年 11 月下旬&#xff0c;某知名外贸公司财务人员收到一封来自境外合作伙伴的邮件&#xff0c;说明有一张发票即将于 11 月 29 日到期的&#xff0c;希望该外贸公司能尽快付款。 该邮件有两个附件&#xff0c;一个附件是即将到期发票的电子版&#xff0c;一个附…

PHP8.3.9安装记录,Phpmyadmin访问提示缺少mysqli

ubuntu 22.0.4 腾讯云主机 下载好依赖 sudo apt update sudo apt install -y build-essential libxml2-dev libssl-dev libcurl4-openssl-dev pkg-config libbz2-dev libreadline-dev libicu-dev libsqlite3-dev libwebp-dev 下载php8.3.9安装包 nullhttps://www.php.net/d…

stable diffusion+LangChain+LLM自动生成图片

最近都在研究和学习stable diffusion和langchain的相关知识&#xff0c;并且看到stable diffusion也是有类似于ChatGLM的api调用方式&#xff0c;那在想有没有可能将stable diffusion也集成到langchain中来呢&#xff1f;看到网上资料比较多的是可以借助chatgpt来辅助stable di…

深度学习的前沿主题:GANs、自监督学习和Transformer模型

&#x1f48e; 欢迎大家互三&#xff1a;2的n次方_ &#x1f48e;1. 介绍 深度学习在人工智能领域中占据了重要地位&#xff0c;特别是生成对抗网络&#xff08;GANs&#xff09;、自监督学习和Transformer模型的出现&#xff0c;推动了图像生成、自然语言处理等多个领域的创…

【计算机网络】DHCP实验

一&#xff1a;实验目的 1&#xff1a;深入理解DHCP&#xff08;动态主机配置协议&#xff09;的工作原理和数据包交换过程。 2&#xff1a;掌握如何通过命令行释放和重新获取IP地址&#xff0c;并通过抓包软件分析DHCP消息的具体内容。 二&#xff1a;实验仪器设备及软件 硬…

什么是死锁,原子性

20240727 一、什么是死锁原子性 一、什么是死锁 原子性

CentOS7下操作iptables防火墙和firewalld防火墙

CentOS7下操作iptables防火墙和firewalld防火墙 &#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、…

小程序的运营方法:从入门到精通

随着科技的快速发展&#xff0c;小程序已成为我们日常生活和工作中不可或缺的一部分。小程序无需下载安装&#xff0c;即用即走的特点深受用户喜爱。那么&#xff0c;如何运营好一个小程序呢&#xff1f;下面就为大家分享一些小程序的运营方法。 一、明确目标用户 在运营小程序…

学习硬件测试01:串口下载+结构体封装说明+程序框架思想+程序框架的搭建+硬件测试程序(P42~P46)

一、串口下载 1.1引入 串口下载就是说用串口来烧录 STM32 的程序。 原因&#xff1a;当调试口&#xff08;SWD&#xff09;因为IO口没有设置好等原因被锁定而使用不了时&#xff0c;就需要用串口来更新程序。 1.2如何通过串口烧录程序&#xff1f; 1、选择串口&#xff1a…

轻松上手的订单管理系统推荐

本文精选了十款订单管理利器&#xff1a;纷享销客、Zoho CRM、简道云ERP、易订货、盘古云ERP、Cin7 Core、畅捷通T、Salesforce Commerce Cloud、NetSuite、浪潮GS。 市场上有各种各样的订单管理系统&#xff0c;每个看起来功能强大&#xff0c;但到底哪个最适合你的业务需求呢…

mysql的MHA以及故障模拟

目录 MHA概念 MHA的组件 MHA的特点 实验&#xff1a;搭建完成MHA的架构 实验&#xff1a;主备切换 实验结果 实验&#xff1a;故障切换 实验&#xff1a;故障恢复 MHA概念 MHA&#xff1a;高可用模式下的故障切换&#xff0c;基于主从复制。它解决的是单点故障和主从复…

C语言笔记36 •双链表•

1.双向链表的结构 Ps&#xff1a;这⾥的“带头”跟前⾯说的“头节点”是两个概念&#xff0c;实际前⾯的在单链表阶段称呼不严谨&#xff0c;但是为了我们更好的理解就直接称为单链表的头节点。带头链表⾥的头节点&#xff0c;实际为“哨兵位”&#xff0c;哨兵位节点不存储任何…

《Redis设计与实现》读书笔记-一条命令执行过程

目录 最近在重读《Redis设计与实现》这本书&#xff0c;通过记录笔记&#xff0c;整理知识体系&#xff0c;希望我的笔记分享&#xff0c;能对致力于不断学习的你有点用。 1. 命令请求的执行过程概述 2.1 发送命令请求 2.2 读取命令请求 2.3命令执行&#xff08;1&#xf…

基于迁移学习的手势分类模型训练

1、基本原理介绍 这里介绍的单指模型迁移。一般我们训练模型时&#xff0c;往往会自定义一个模型类&#xff0c;这个类中定义了神经网络的结构&#xff0c;训练时将数据集输入&#xff0c;从0开始训练&#xff1b;而迁移学习中&#xff08;单指模型迁移策略&#xff09;&#x…

【TypeScript学习打卡第一天】

介绍、常用类型 一、介绍1.概念2.TypeScript 为什么要为 JS 添加类型支持&#xff1f;3.ts的优势 二、ts初体验1.安装编译 TS 的工具包2.编译并运行 TS 代码3.简化运行 TS 的步骤 三、常用类型1.类型注解2.常用基础类型概述(1) 原始类型(2) 数组类型(3) 联合类型(4) 类型别名(5…

【中项第三版】系统集成项目管理工程师 | 第 11 章 规划过程组⑤ | 11.13 - 11.14

前言 第11章对应的内容选择题和案例分析都会进行考查&#xff0c;这一章节属于10大管理的内容&#xff0c;学习要以教材为准。本章上午题分值预计在15分。 目录 11.13 制定预算 11.13.1 主要输入 11.13.2 主要输出 11.14 规划质量管理 11.14.1 主要输入 11.14.2 主要工…

TensorRT推理时间不稳定的解决方案

目录 解决方案 第一步 第二步 效果 解除锁频方法 解决方案 锁定GPU时钟频率&#xff08;实测有效&#xff09; 第一步 使用 nvidia-smi -q -d SUPPORTED_CLOCKS 查询GPU支持的最高频率&#xff0c;如下图所示为 8001 MHz 第二步 cmd&#xff08;管理员权限&#xff09…

【Python机器学习】朴素贝叶斯——使用朴素贝叶斯进行文档分类(理论基础)

机器学习的一个重要应用就是文档的自动分类。在文档分类中&#xff0c;整个文档&#xff08;比如电子邮件&#xff09;是实例&#xff0c;而电子邮件中的某些元素则构成特征。虽然电子邮件是一种会不断增加的文本&#xff0c;但我们同样也可以对新闻报道、用户流言、公文等其他…

recursion depth exceeded” error

有些时候不可以用jax.jit装饰器 参考资料&#xff1a;使用 JAX 后端在 Keras 3 中训练 GAN |由 Khawaja Abaid |中等 (medium.com)