【笔记ing】AI大模型-04逻辑回归模型

一个神经网络结构,其中的一个神经网络层,本质就是一个逻辑回归模型

深度神经网络的本质就是多层逻辑回归模型互相连接或采用一定的特殊连接的方式连接在一起构成的。其中每一个层本质就是一个逻辑回归模型。

逻辑回归模型基本原理

逻辑回归(Logic)是一种广义线性回归模型(generalized linear model),其与多重线性回归有诸多的相同之处,但其实则是一个分类模型,属于有监督算法,主要用常见的二分类问题求解,是一种采用回归方法的分类模型。

逻辑回归的基本决策函数形态为:

其中的g(*)是可微函数,这类模型也被称为广义线性模型,函数映射关系f(x)被称作为联系函数link function,现今广泛熟知的逻辑回归就是诸多广义回归模型的其中一种。

在逻辑回归中,使用对数几率函数Logistic function作为g^-1(*).对数几率函数的表达式为:

对数几率函数叫做Sigmoid函数

Sigmoid函数是一个在生物学中常见的S型函数,也称作S行生长曲线。由于其单增以及反函数单增等特性,Sigmoid函数常被用作神经网络的激活函数,将变量映射到0-1之间。

利用这个对数几率函数,可以将z转化为一个(0,1)区间内的值。

对数几率函数重要的导数性质

如果将标签y表示分类结果,结合二分类赶驴模型可知,标签结果为正例反例的概率和为1

可以将y表示为出现正例的概率,将1-y表示为出现返利的概率

所以ln y/(1-y)中的y/(1-y)表示正反例出现概率的壁纸,这个比值称作几率,用来表示样本x出现正例的相对可能性。对几率继续取得对数,即ln y/(1-y)即称作对数几率。

上式实则是在利用线性回归模型的预测结果取得逼近真实标记的对数几率。

逻辑回归模型也称作对数几率模型。通过逻辑回归的决策函数给出证明,证明回归确实是一种专用于二分类问题求解的分类模型。

可以依据上述二分类场景进一步给出逻辑回归的损失函数。假设下述两个条件概率成立。

则逻辑回归的损失函数可以表达为关于待评估参数列向量w的似然函数:

当第i个样本的真实标签yi为1时,1-yi的结果就等于0,(1-yi的反^0=1,整体似然函数的极大值就与yi的反^yi有关,表示“预测的标签结果yi的反=1”的概率,如果这个概率能够为1(真实为1,预测为1),则其为必然事件,模型的效果就越好,损失函数就能达到极小化。

当第i个样本的真实标签yi为0时,1-yi的结果就等于1,(yi的反)^1=1,整体似然函数的极大值就与(1-yi的反)^(1-yi)有关,表示“预测的标签结果yi的反=1”的概率,如果这个概率能够为1(真实为0,预测为0),则其为必然事件,模型的效果越好,损失函数就能达到极小化。

对于每一条训练样本,如果总能保证yi的反^yi (1-yi的反)^(1-yi)总是达到最大值1,则构建的二分类模型必然是最想要的模型。

于是可以对每一条样本都来追求最大值1,于是将其连乘,求得的关于待估参数w的似然函数自然希望求得最大值,此时的模型就是一个最优模型。

对上述对数似然函数取负值,即得逻辑回归损失函数,

似然函数取得最大值时的待估参数即可取得最优解

对其取负值就表示:当似然函数取得最大值时,逻辑回归的损失函数将达到极小化

损失函数表达式即为神经网络模型中求解二分类问题时常采用的损失函数:二分类交叉熵损失函数

逻辑回归模型优点

逻辑回归模型可以直接对分类可能性进行建模,该模型不仅可以预测出标签所属的类别,还可以得到近似概率的预测,标签所属某类别的可能性,对于需要利用概率来辅助决策的场景很重要。

对数几率函数是任意阶均可导(知道n阶均可导,具有n阶可导行,因为:(e^x)'=e^x的凸函数,有很多数学相关性质,现有的很多数值优化算法都可直接用于其最优解的求解。

采用梯度下降法对其进行求解。

梯度下降法:数学:一元函数、多元函数微分、积分学章节中关于偏导数、方向导数、全微分及梯度的相关概念。数据挖掘算法:梯度下降法章节中关于梯度下降和梯度上升的相关概念。

逻辑回归模型的实现

借助Pytorch结合逻辑回归的决策函数及损失函数自行构建一个简单的逻辑回归模型。

导包

准备训练数据,暂不考虑数据集划分,构造一个假样本

实现逻辑回归模型对象

执行模型训练,观测模型训练过程,查看损失函数梯度下降过程

损失函数的值伴随迭代梯度下降过程在不断的趋近于极小化,表示模型的建模效果是正确的

逻辑回归模型与神经网络关系密切

逻辑回归的决策函数

决策函数可以看为一个矩阵的线性运算与一个非负函数的复合关系,最终输出y的反(开始更改名次称谓y的反之前称作标签,也即估计量,在此之后的神经网络中称为output layer)

yhat

单层感知机,是一种最简单的神经网络,其中的X即特征,在神经网络中一般称为输入层Input layer,w^T即参数(后续称作权重),Sigmod(w^T X+b)就是输出层output layer,Sigmod函数在神经网络中不再称作非线性函数,称为激活函数activate function

单层感知机引申:可以构建一种人工的类似神经元信息传递的过程,将输入层的数据逐层“传递”最终得到输出结果。使用多个人工神经元构建的多层感知机,就是一种最普遍的人工神经网络,在输入层与输出层之间加入隐藏层,隐藏层的层数可以任意。

深度学习是一种表征学习,要学习的是样本的特征,希望特征的学习更全面。

加入隐藏层的目的是:将特征通过隐藏层映射到更高维的空间,进行更高维的特征表达,能够将样本的特征表达的更清晰,模型学习的特征的效果也越好,最终所得输出层的结果也越符合模型建模方向。

单程感知机、多层感知机

————————————

仅用于本人学习

来源:网络

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/901553.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android学习总结之算法篇七(图和矩阵)

有向图的深度优先搜索(DFS)和广度优先搜索(BFS)的示例,以此来模拟遍历 GC Root 引用链这种有向图结构: 一、深度优先搜索(DFS) import java.util.*;public class GraphDFS {privat…

熟悉Linux下的编程

可能 目录 熟悉Linux下Python编程的含义及与非Linux环境编程的区别 一、核心含义解析 二、与非Linux环境的关键区别 三、典型应用场景对比 四、能力培养建议 openfoem的下载之路: 方法一:使用cd命令 方法二:使用快捷方式 方法三&am…

c++引入nacos,详细步骤

以下是将Nacos引入C项目的详细步骤,包括安装、配置和代码实现: 1. 安装Nacos服务器 下载Nacos服务器安装包,可以从Nacos官网获取最新版本。 解压安装包并启动Nacos服务器: cd nacos/bin sh startup.sh -m standalone 这将启动…

性能优化实践

4.1 大规模量子态处理的性能优化 背景与问题分析 量子计算中的大规模量子态处理(如量子模拟、量子态可视化)需要高效计算和实时渲染能力。传统图形API(如WebGL)在处理高维度量子态时可能面临性能瓶颈,甚至崩溃(如表格中14量子比特时WebGL的崩溃)。而现代API(如WebGPU…

课堂总结。

第三章第六节 Spark-SQL核心编程(五)自定义函数:UDF:val sparkConf new SparkConf().setMaster("local[*]").setAppName("SQLDemo")//创建SparkSession对象val spark :SparkSession SparkSession.builder()…

分库分表-除了hash分片还有别的吗?

在分库分表的设计中,除了常见的 Hash 分片,还有多种策略根据业务场景灵活选择。以下是几种主流的分库分表策略及其应用场景、技术实现和优缺点分析,结合项目经验(如标易行投标服务平台的高并发场景)进行说明: 一、常见分库分表策略 1. 范围分片(Range Sharding) 原理:…

AUTOSAR图解==>AUTOSAR_SWS_GPTDriver

AUTOSAR GPT驱动 (通用定时器驱动) 分析 AUTOSAR标准软件规范解析 目录 1. GPT驱动概述 1.1 GPT驱动在AUTOSAR架构中的位置1.2 GPT驱动主要功能 2. GPT驱动模块结构3. GPT驱动初始化流程4. GPT驱动状态机5. GPT驱动错误处理6. GPT预定义定时器7. 总结 1. GPT驱动概述 GPT驱动…

MyBatis持久层框架

MyBatis持久层框架 目录 一、Mybatis简介 1. 简介 2. 持久层框架对比 3. 快速入门(基于Mybatis3方式) 二、日志框架扩展 1. 用日志打印替代sout 2. Java日志体系演变 3. 最佳拍档用法 4. Lombok插件的使用 4.1 Lombok简介 4.2 Lombok安装 4.3 …

域控制器升级的先决条件验证失败,证书服务器已安装

出现“证书服务器已安装”导致域控制器升级失败时,核心解决方法是卸载已安装的证书服务‌。具体操作如下:‌ ‌卸载证书服务‌ 以管理员身份打开PowerShell,执行命令: Remove-WindowsFeature -Name AD-Certificate该命令会移除A…

VMware虚拟机常用Linux命令进阶指南(一)

摘要:本文涵盖多方面 Linux 命令的使用。包括用户与用户组管理,创建用户和组并设置权限;目录结构操作,涉及创建和更改目录结构;Vim 编辑器及文件归档,有文件创建、编译、合并、打包等任务。 更多优质文章 …

【AI News | 20250415】每日AI进展

AI News 1、字节跳动发布Seaweed-7B视频模型:70亿参数实现音视频同步生成与多镜头叙事 字节跳动推出新一代视频生成模型Seaweed-7B,该模型仅70亿参数却实现多项突破:支持音视频同步生成、多镜头叙事(保持角色连贯性)、…

如何实现动态请求地址(baseURL)

需求: 在项目中遇到了需要实时更换请求地址,后续使用修改后的请求地址(IP) 例如:原ip请求为http://192.168.1.1:80/xxx,现在需要你点击或其他操作将其修改为http://192.168.1.2:80/xxx,该如何操作 tips: 修改后需要跳转( 修改了IP之前的不可使用,需要访问修改后的地址来操作 …

Open AI 使用篇

一.function Calling 大模型中的 function calling 指的是在人工智能模型(如 GPT-4)中调用外部函数或API,以便模型能够执行更复杂的任务或获取外部数据。这种方式允许模型在生成回答时不仅仅依赖于内部的训练数据,还能够与外部系…

6.DJI-PSDK:psdk订阅无人机高度/速度/GPS/RTK/时间/经纬度等消息及问题解决

DJI-PSDK:psdk订阅无人机高度/速度/GPS/RTK/时间/经纬度等消息 消息订阅可以获取绝大多数无人机的动态信息,包括无人机的姿态、速度、加速度、角速度、高度、GPS 位置、云 台的角度和状态、飞行模式和飞行状态、电机和电池等各类关键信息。 这些信息并不会“一股脑儿地”全部…

100 个网络安全基础知识

1. 什么是网络安全? 网络安全是指采取必要措施,防范对网络的攻击、侵入、干扰、破坏和非法使用以及意外事故,使网络处于稳定可靠运行的状态,保障网络数据的完整性、保密性、可用性。(参考《中华人民共和国网络安全法》…

第七届IEEE通信、信息系统与计算机工程国际会议(CISCE 2025)

重要信息 官网:www.iccisce.com 时间:2025年5月9-11日 地点:中国-广州 征稿主题 通信技术 信息系统 •5G/6G通信系统与网络 •无线通信与移动网络 •光纤通信与光网络 •卫星与空间通信 •通信信号处理与编码 •无线传感器网络 •物联网…

OpenCV 图像拼接

一、图像拼接的介绍 图像拼接是一种将多幅具有部分重叠内容的图像合并成一幅完整、无缝且具有更广阔视野或更高分辨率图像的技术。其目的是通过整合多个局部图像来获取更全面、更具信息价值的图像内容。 二、图像拼接的原理 图像拼接的核心目标是将多幅有重叠区域的图像进行准…

第十一章 网络编程

在TCP/IP协议中,“IP地址TCP或UDP端口号”唯一标识网络通讯中的一个进程。 因此可以用Socket来描述网络连接的一对一关系。 常用的Socket类型有两种:流式Socket(SOCK_STREAM)和数据报式Socket(SOCK_DGRAM&#xff09…

ffmpeg实现视频流抽帧

ffmpeg 实现视频流抽帧 抽取实时视频帧 如果你的实时视频是通过 RTSP、UDP 或其他协议获取的,可以直接调用 FFmpeg 命令来抽取帧。 ffmpeg 命令 示例 1 ffmpeg -i rtsp://your_rtsp_stream_url -vf fps1 -update 1 output.jpg说明: -i rtsp://your…

【GIT】放弃”本地更改,恢复到远程仓库的状态git fetch origin git reset --hard origin/分支名

如果你想完全放弃本地更改,恢复到远程仓库的状态,可以按照以下步骤操作: 获取远程最新版本 首先执行: git fetch origin这条命令会把远程仓库的最新提交拉取到你的本地,但不会自动合并到你的当前分支。 硬重置你的当前…