机器学习理论基础—神经网络算法公式学习

机器学习理论基础—神经网络公式学习

M-P神经元

M-P神经元(一个用来模拟生物行为的数学模型):接收n个输入(通常是来自其他神经
元),并给各个输入赋予权重计算加权和,然后和自身特有的阈值进行比较 (作减法),最后经过激活函数(模拟“抑制"和“激活")处理得到输出(通常是给下一个神经元)
在这里插入图片描述

通过对公式形式的观察可以发现M-p神经元与线性回归模型之间有密切的联系。

单个M-P神经元:感知机(sgn[符号函数]作激活函数)、对数几率回归(sigmoid作激活函数)
多个M-P神经元:神经网络
在这里插入图片描述

感知机模型

感知机模型:激活函数为sgn(阶跃函数)的神经元(是一个用来分类的模型)
在这里插入图片描述
在这里插入图片描述
从几何的角度来说,感知机解决的是线性可分的数据集T,感知机的学习目标是求得能对数据集T完全正确划分的超平面。
n维空间的超平面(WtX+b=0)

  • 超平面方程不唯一
  • 法向量w垂直超平面
  • w和b唯一确定一个超平面
  • 法向量指向的一半空间为正空间,另一半为负空间

感知机的学习策略

感知机学习策略:随机初始化w,b,将全体训练样本代入模型找出误分类样本,假设此时误分类样本集合为M包含于T,对任意一个误分类样本(x,y)∈M来说,当wtx-θ≥0时,模型输出值为y=1,样本真实标记为y=0;反之,当wtx-θ< 0时,模型输出值为 = 0,样本真实标记为y = 1。综合两种情形可知,以下公式恒成立。
在这里插入图片描述

损失函数

所以若给定数据集T其损失函数可以定义为:
在这里插入图片描述

显然,此损失函数是非负的。如果没有误分类点,损失函数值是0。而且,误分类点越少,误分类点离超平面越近,损失函数值就越小。

之后极小化损失函数并对其进行优化。首先给定一个数据集
在这里插入图片描述
x的值属于实数空间,y的值属于0或1,在求参数w和θ的过程中要极小化损失函数的解
在这里插入图片描述
若将阈值θ看做是一个固定输入为-1的哑节点,即
在这里插入图片描述
可以将求解的问题简化为:
在这里插入图片描述

感知机学习算法

使用随机梯度下降的方法来进行实现

感知机学习算法:当误分类样本集合M固定时,那么可以求得损失函数L(w)的梯度为:
在这里插入图片描述

感知机的学习算法具体采用的是随机梯度下降法,也就是极小化过程中不是一次使M中所有误分类点的梯度下降,而是一次随机选取一个误分类点使其梯度下降。所以权重w的更新公式为:
在这里插入图片描述
其中n代表的是学习率

神经网络

由于像感知机这种单个神经元分类能力有限,只能分类线性可分的数据集,对于线性不可分的数据集则无能为力,但是多个神经元构成的神经网络能够分类线性不可分的数据集(西瓜书上异或问题的那个例子),且有理论证明(通用近似定理):只需一个包含足够多神经元的隐层,多层前馈网络(最经典的神经网络之一)就能以任意精度逼近任意复杂度的连续函数。因此,神经网络既能做回归,也能做分类,而且不需要复杂的特征工程。

多层前馈网络

多层前馈网络:每层神经元与下一层神经元全互连,神经元之间不存在同层连接,也不存在跨层连接。(隐层阈值rh,输出层國值θ)
在这里插入图片描述
将神经网络(记为NN)看作一个特征加工函数
在这里插入图片描述
(单输出)回归:后面接一个R’→R的神经元,例如:没有激活函数的神经元
分类:后面接一个R’→[0,1]的神经元,例如:激活函数为sigmoid函数的神经元。
在这里插入图片描述

因此神经网络可以用在分类与回归任务上,做分类时套用对数几率回归而做回归时需要套用的是,线性回归的模型。

在模型训练过程中,神经网络(NN)自动学习提取有用的特征,因此,机器学习向“全自动数据分析”又前进了一步。

假设多层前馈网络中的激活函数全为sigmoid函数,且当前要完成的任务为一个(多输出)回归任务,因此损失函数可以采用均方误差(分类任务则用交叉熵)该单个样本的均方误差(损失)为
在这里插入图片描述

BP误差逆传播算法

误差逆传播算法(BP算法):基于随机梯度下降的参数更新算法
在这里插入图片描述
其中只需推导出这个损失函数E关于参数w的一阶偏导数(梯度)即可(链式求导)。值得一提的是,由于NN(εc)通常是极其其复杂的非凸函数,不具备像凸函数这种良好的数学性质,因此随机梯度下降不能保证一定能走到全局最小值点,更多情况下走到的都是局部极小值点。
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/2639.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

​「Python绘图」绘制小猪佩奇

python 绘制小猪佩奇 一、预期结果 二、核心代码 import turtle print("开始绘制小猪佩奇") pen turtle.Turtle() pen.pensize(4) #pen.hideturtle()pen.speed(1000)pen.color("#ff9bc0","pink") pen.setheading(-30) pen.pu() pen.goto(-100,…

LLM学习笔记-2

在未标记数据上进行预训练 本章概要 在上节的笔记中&#xff0c;因为训练出的效果&#xff0c;并不是特别理想&#xff0c;在本节中&#xff0c;会用数据进行训练&#xff0c;使得模型更加的好&#xff1b; 计算文本生成损失 inputs torch.tensor([[16833, 3626, 6100],…

ARP 攻击神器:ARP Spoof 保姆级教程

一、介绍 arpspoof是一种网络工具&#xff0c;用于进行ARP欺骗攻击。它允许攻击者伪造网络设备的MAC地址&#xff0c;以欺骗其他设备&#xff0c;并截获其通信。arpspoof工具通常用于网络渗透测试和安全评估&#xff0c;以测试网络的安全性和漏洞。 以下是arpspoof工具的一些…

TensorRT plugins and ONNX parser编译

https://github.com/NVIDIA/TensorRT是TensorRT plugins and ONNX parser&#xff0c;并不包含TensorRT的nvinfer库&#xff08;libinfer.so、nvinfer.dll&#xff09;&#xff0c;此部分并未开源&#xff0c;只能使用官方支持的平台、环境https://developer.nvidia.com/tensor…

科技改变视听4K 120HZ高刷新率的投影、电视、电影终有用武之地

早在1888年&#xff0c;法国生理学家埃蒂安朱尔马莱就发明了一套盒式摄像机&#xff0c;能以120帧/s的速度在一条纸膜上曝光照片&#xff0c;但是当时没有相匹配的放映设备。而马莱的另一套拍摄设备是60帧/s的规格&#xff0c;并且图像质量非常好。 受此启发&#xff0c;雷诺的…

【软件测试基础】黑盒测试(知识点 + 习题 + 答案)

《 软件测试基础持续更新中》 对于黑盒测试这一章&#xff0c;等价类划分、边界值测试、决策表、场景法&#xff0c;这四种是最容易出大题的&#xff0c;其他几种考察频率很低。下述的一些例题只是经典例题&#xff0c;掌握方法后&#xff0c;还要多加练习&#xff01; 目录 3…

极快!宝藏EI,2-4周录用,接受范围广!

本周投稿推荐 SSCI • 2/4区经管类&#xff0c;2.5-3.0&#xff08;录用率99%&#xff09; SCIE&#xff08;CCF推荐&#xff09; • 计算机类&#xff0c;2.0-3.0&#xff08;最快18天录用&#xff09; SCIE&#xff08;CCF-C类&#xff09; • IEEE旗下&#xff0c;1/2…

短信视频提取批量工具,免COOKIE,博主视频下载抓取,爬虫

痛点&#xff1a;关于看了好多市面的软件&#xff0c;必须要先登录自己的Dy号才能 然后找到自己的COOKIE 放入软件才可以继续搜索&#xff0c;并且无法避免长时间使用 会导致无法正常显示页面的问题。 有没有一种方法 直接可以使用软件&#xff0c;不用设置的COOKIE的方法呢 …

文献速递:肺癌早期诊断---利用低剂量CT扫描的三维概率深度学习系统用于肺癌的检测与诊

Title 题目 A 3D Probabilistic Deep Learning System forDetection and Diagnosis of Lung Cancer Using Low-Dose CT Scans 利用低剂量CT扫描的三维概率深度学习系统用于肺癌的检测与诊 01文献速递介绍 肺癌既是最常见的癌症之一&#xff0c;也是导致癌症死亡的主要原因之…

【GNS3 GraduProj】交换机Ansible配置脚本(文件备份)

为交换机S1、S2、S3分别创建VLAN、并进行Access接口的配置&#xff0c;同时对所有交换机进行Trunk接口的全局自动配置。 所有Switches的脚本合并&#xff1a;SwitchesConfig.yml --- - name: Switches Global Configurationhosts: Switchesgather_facts: falseconnection: ne…

关于yolov8-class Pose(Detect)

下面看一下代码&#xff1a; class Pose(Detect):"""YOLOv8 Pose head for keypoints models."""def __init__(self, nc80, kpt_shape(17, 3), ch()):"""Initialize YOLO network with default parameters and Convolutional La…

【笔记】应对Chrome更新导致Chromedriver失效的解决方案:Chrome For Test

随着网络应用和网站的不断发展&#xff0c;自动化测试变得越来越重要&#xff0c;而Selenium成为了许多开发者和测试人员的首选工具之一。然而&#xff0c;对于使用Selenium来进行网站测试的人来说&#xff0c;Chrome浏览器的频繁更新可能会成为一个头疼的问题。每当Chrome更新…

Docker容器:镜像与容器管理命令

目录 一、镜像管理命令 1、搜索镜像 2、获取镜像 3、镜像加速下载 4、查看下载的镜像文件信息 5、查看下载到本地的所有镜像 6、获取指定镜像的详细信息 7、为本地的镜像添加新的标签 8、删除镜像 8.1 删除指定的镜像 8.2 批量删除多个镜像 9、导出镜像与导入镜像 …

Day 32 122.买卖股票的最佳时机II 55. 跳跃游戏 45.跳跃游戏II

买卖股票的最佳时期Ⅱ 给定一个数组&#xff0c;它的第 i 个元素是一支给定股票第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易&#xff08;多次买卖一支股票&#xff09;。 注意&#xff1a;你不能同时参与多笔交易&#xff08;你…

[Android]使用CompositionLocal隐式传值

1.相关概念 CompositionLocal 是定义数据的方式&#xff0c;而 CompositionLocalProvider 是在 Compose UI 树中传递这些数据的工具。二者合作&#xff0c;为 Compose 应用提供了一个强大的状态和数据流管理机制&#xff0c;使得数据可以在组件间按需传递&#xff0c;而无需通…

使用Python实现批量删除MYSQL数据库的全部外键

我先说下场景&#xff0c;昨天因为我们使用了Java工作流框架flowable&#xff0c;它自动生成了许多工作流相关的表&#xff0c;但是这些表都有外键关联&#xff0c;如果单纯的使用sql语句去一个一个的删除外键&#xff0c;那会非常麻烦&#xff0c;所以我写了一个Python脚本来进…

云上如何实现 Autoscaling: AutoMQ 的实战经验与教训

01 背景 弹性是云原生、Serverless 的基础。AutoMQ 从软件设计之初即考虑将弹性作为产品的核心特质。对于 Apache Kafka 而言&#xff0c;由于其存储架构诞生于 IDC 时代&#xff0c;针对物理硬件设计&#xff0c;存储层强依赖本地存储&#xff0c;已不能很好地适应现在云的时…

Python自动化系列---Python基础2

1、 变量&#xff1a;存储数据的 保险柜&#xff1a;钱&#xff0c;金条&#xff0c;户口本&#xff0c;珠宝&#xff0c;古董 — 存储东西 数据类型&#xff1a; int float bool str 变量名&#xff08;见名知意&#xff09;&#xff1a;标识符&#xff08;不能用关键字&…

Linux:Centos7.x系统,无效的密码问题处理

一、情景说明 我新创建了Centos7系统&#xff0c;在使用的过程中&#xff0c;我需要创建一个test账号 那么&#xff0c;同时我就要给这个账号设置一个密码 为了方便&#xff0c;我设置成123456 就报错了 二、解决办法 其实这个问题很容易处理&#xff0c;不需要像其他帖子说…

项目报错com.mall.common.domain.request那么就说明你的项目里面是找不到导入类的包名或者路径

当你的项目里面一直报错是找不到导入类的包名或者路径的时候&#xff1a;com.mall.common.domain.request 这个问题我们阔以分为几个角度来想 1、包路径错误&#xff1a;确保com.mall.common.domain.request这个包路径在项目中是正确的。可能的情况是包名写错了&#xff0c;或…