【Deep-ML系列】Pegasos Kernel SVM Implementation(手写支持向量机)

引言

支持向量机(SVM)是机器学习领域中一种非常强大的分类算法,广泛应用于各种分类任务。今天,我们将深入探讨SVM中的Pegasos算法及其与核函数的结合。通过代码示例和详细解释,我们将理解Pegasos算法如何逐步调整模型参数,从而优化分类器的性能。

Pegasos算法概述

Pegasos算法(Primal Estimated sub-GrAdient SOlver for SVM)是一种用于训练SVM的在线学习算法。与标准的SVM优化方法不同,Pegasos通过随机梯度下降(SGD)逐步更新模型参数,使得算法在处理大规模数据时更加高效。

在每次迭代中,Pegasos只对一个或一小部分样本进行参数更新,这与传统的批量梯度下降不同。这个特点使得Pegasos在处理大规模数据集时有明显的速度优势。

核函数的作用

核函数的引入是SVM的一个重要特性,使得它能够处理线性不可分的数据。核函数通过将原始数据映射到一个更高维度的空间,在这个空间中,数据可能变得线性可分。

我们讨论了两种常用的核函数:

  • 线性核函数:直接计算两个样本的点积,适用于线性可分的数据。
  • RBF(径向基函数)核:计算两个样本的高斯距离,适用于非线性可分的数据。
代码解析
import numpy as npdef linear_kernel(x, y):return np.dot(x, y)def rbf_kernel(x, y, sigma=1.0):return np.exp(-np.linalg.norm(x - y) ** 2 / (2 * (sigma ** 2)))def pegasos_kernel_svm(data, labels, kernel='linear', lambda_val=0.01, iterations=100, sigma=1.0):n_samples = len(data)alphas = np.zeros(n_samples)b = 0for t in range(1, iterations + 1):for i in range(n_samples):eta = 1.0 / (lambda_val * t)if kernel == 'linear':kernel_func = linear_kernelelif kernel == 'rbf':kernel_func = lambda x, y: rbf_kernel(x, y, sigma)decision = sum(alphas[j] * labels[j] * kernel_func(data[j], data[i]) for j in range(n_samples)) + bif labels[i] * decision < 1:alphas[i] += eta * (labels[i] - lambda_val * alphas[i])b += eta * labels[i]return np.round(alphas, 4).tolist(), np.round(b, 4)if __name__ == '__main__':data = np.array([[1, 2], [2, 3], [3, 1], [4, 1]])labels = np.array([1, 1, -1, -1])kernel = 'rbf'lambda_val = 0.01iterations = 100print(pegasos_kernel_svm(data, labels, kernel, lambda_val, iterations))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/52118.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

eNSP 华为ACL配置

华为ACL配置 需求&#xff1a; 公司保证财务部数据安全&#xff0c;禁止研发部门和互联网访问财务服务器&#xff0c;但总裁办不受影响 R1&#xff1a; <Huawei>sys [Huawei]sys Router1 [Router1]undo info-center enable [Router1]int g1/0/0 [Router1-GigabitEth…

开放式耳机为什么性价比高?四款开放式蓝牙耳机排行榜前十名推荐

如果说需要高性价比的蓝牙耳机推荐的话&#xff0c;我会比较推荐开放式耳机&#xff0c;因为这类的耳机产品价格普遍都不会太高&#xff0c;但配置却都很好。那除了性价比高&#xff0c;开放式耳机还有其他好的地方吗&#xff1f;那当然是有的&#xff0c;对于蓝牙耳机来说&…

线程池相关面试题

一、JDK自带的线程池有那些&#xff1f; 1.Executors.newCachedThreadPool() 创建一个可缓存线程的线程池&#xff0c;若线程池长度超出需要&#xff0c;可回收线程&#xff0c;若没有可回收&#xff0c;则新建线程 2.Executors.newFixedThreadPool() 创建定长线程池&#…

HTML+JS谁是卧底游戏

先说一句&#xff1a;一段时间没发文章&#xff0c;好多僵尸粉关注我&#xff0c;这CSDN&#x1f620; 主要功能 玩家设置&#xff1a;在游戏开始前&#xff0c;输入总人数、卧底人数和白板人数。系统会自动计算出剩下的平民人数&#xff0c;并随机分配身份。 身份查看&#…

DHCP协议-CSP认证

文章目录 DHCP协议 DHCP协议 stringstream的用法 应用实践 #include<bits/stdc.h>using namespace std;signed main() {string s"wo shi wwl, also wlw";stringstream ss;ss<<s;while(ss>>s){if(s[s.size()-1],) s[s.size()-1] ;cout<<s<…

授权cleanmymac访问全部磁盘 Mac授权访问权限 cleanmymac缺少权限

CleanMyMac是Mac系统下的一款专业的苹果电脑清理软件&#xff0c;同时也是一款优秀的电脑系统管理软件。它能有效清理系统垃圾&#xff0c;快速释放磁盘内存&#xff0c;缓解卡顿现象&#xff0c;保障系统顺畅地运行。 全磁盘访问权限&#xff0c;就好比机场内进行的安全检查。…

【AD9361 数字基带】多片基带内FPGA补偿 I/Q Rotation

I/Q 旋转 Rotation 在许多多通道射频系统中&#xff0c;如 AD-FMCOMMS5&#xff0c;甚至在 AD-FMCOMMS2、AD-FMCOMMS3 上&#xff0c;都需要测量或校正两个复数 &#xff08;I/Q&#xff09; RF 信号之间的相位差。 从纯粹的数学描述来看&#xff0c;单个正弦波没有相位&…

Godot《躲避小兵》实战之游戏开始界面制作

我们的游戏还需要用户可操作的界面&#xff0c;比如开始游戏&#xff0c;退出以及显示分数等UI界面。 创建新场景&#xff0c;点击“其他节点”按钮&#xff0c;然后添加一个 CanvasLayer 节点并命名为 HUD。“HUD”是“heads-up display”&#xff08;游戏信息显示&#xff0…

websocket拦截插件

系列文章目录 《websocket逆向》《Http拦截》《websocket拦截》《Base64编码与解码》《python实现protobuf序列化与反序列化》《前端js实现protobuf序列化与反序列化》《protobufjs实现protobuf序列化与反序列化》《视频号直播弹幕采集》《小红书直播弹幕采集》《tiktok直播web…

计算机网络——运输层(进程之间的通信、运输层端口,UDP与TCP、TCP详解)

运输层协议概述 进程之间的通信 运输层向它上面的应用层提供通信服务。 当网络边缘部分的两台主机使用网络核心部分的功能进行端到端的通信时&#xff0c;都要使用协议栈中的运输层&#xff1b;而网络核心部分中的路由器在转发分组时只用到下三层的功能。 Q1&#xff1a;我们…

最全Java集合分片处理!!! Java 中 List 分片的 7种方法

文章目录 Java 中 List 分片的 7种方法业务需求背景实现方法方法一&#xff1a;最基本的 for 循环实现方法二&#xff1a;利用 List 的 subList() 方法方法三&#xff1a;stream 流操作 filter 方法过滤方法四&#xff1a;使用 Google Guava 的 Lists.partition 方法方法五&…

【计算机三级-数据库技术】操作题大题(第六套)

第六套操作题 第46题 假定要建立一个学校科研项目管理的信息系统&#xff0c;需要管理如下信息&#xff1a; 教师&#xff1a;教师编号、教师姓名&#xff1b; 项目&#xff1a;项目编号、项目名称、资助额&#xff1a; 学生&#xff1a;学生编号、学生姓名、学位&#xff0c…

理解与推导贝叶斯滤波算法

很多时候一些算法看起来极其复杂,极其难懂,不是因为我们愚不可及,而是因为我们看到的是别人省略过很多步骤和脑海中思考过的思路最后呈现出来的公式和文字,而好的博客就应该尽量还原这些思考过程及省略掉的步骤。 像卡尔曼滤波(Kalman filters)、粒子滤波(Particle filt…

跟李沐学AI:转置卷积

定义 卷积不会增大输入的高宽&#xff0c;通常卷积层后高宽不变或减半。转置卷积则可以用来增大输入的宽高。 转置卷积是一种卷积&#xff0c;它将输入和核进行了重新排列&#xff0c;通常用作上采用。 如果卷积将输入从变为&#xff0c;同样超参数的情况下&#xff0c;转置…

Java使用不同方式解析SVG文件

使用不同方式解析SVG文件 使用三种方式解析SVG文件一、Apache Batik导入坐标代码示例 二、Jsoup导入坐标代码示例 三、XML 解析器导入坐标代码示例 *查看SVG文件工具*Inkscape 使用三种方式解析SVG文件 找了好久的SVG文件解析&#xff01; 一、Apache Batik 这是一个广泛使用…

集团数字化转型方案(十二)

集团数字化转型方案致力于通过构建一个集成化的数字平台&#xff0c;全面应用大数据分析、人工智能、云计算和物联网等前沿技术&#xff0c;推动业务流程、管理模式和决策机制的全面升级。该方案将从业务流程的数字化改造开始&#xff0c;优化资源配置&#xff0c;提升运营效率…

yolov8 出现loss 为nan

原因&#xff1a; 混合精度训练是一种通过同时使用 FP16 和 FP32 精度来加速深度学习训练的技术。它可以在不损失模型性能的情况下,显著减少训练时间和内存使用。下面是关于混合精度训练的一些解释: 1. 原理 混合精度训练利用了 FP16 (16位浮点)和 FP32 (32位浮点)的不同特性。…

每日一题——贪心算法

860. 柠檬水找零 - 力扣&#xff08;LeetCode&#xff09; 这道题目乍一看可能没有什么头绪&#xff0c;但是当你仔细想想就会明白一个道理&#xff0c;那就是&#xff0c;《论电子支付的重要性》哈哈哈哈&#xff0c;言归正传&#xff0c;其实很简单无非就是找钱&#xff0c;…

Alembic:python中数据库迁移的瑞士军刀

Alembic 简介 Alembic 是由 SQLAlchemy 的创始人 Mike Bayer 设计的一个数据库迁移工具。它不仅支持自动迁移脚本生成&#xff0c;还允许开发者手动编辑迁移脚本来满足特定的需求。Alembic 通过提供一个环境来跟踪数据库模式的变更历史&#xff0c;确保数据库的版本与应用代码…

linux内核 时间同步机理分析笔记

1 内核时间管理的相关组件 1.1 clocksource 和 clock_event_device 1.1.1 简介 外部时钟设备的主要作用是提供精确的计时功能和定期产生中断的功能&#xff0c;内部把提供精确计时的功能抽象为clocksource对象&#xff0c;把定期产生中断的功能抽象为clock_event_device对象…