【Python深度学习】——交叉熵|KL散度|交叉熵损失函数

【Python深度学习】——交叉熵|KL散度|交叉熵损失函数

  • 1. 交叉熵Cross Entropy
    • 1.1 交叉熵的含义
    • 1.2 交叉熵的公式
    • 1.3 交叉熵的特点
  • 2. KL散度
    • 2.1 KL散度的含义
    • 2.2 KL散度的公式
    • 2.3 KL散度的性质
    • 2.4 KL散度的常用场景
  • 3. 交叉熵损失函数
    • 3.1 交叉熵损失函数的定义与公式

1. 交叉熵Cross Entropy

1.1 交叉熵的含义

交叉熵是两个概率分布之间差异的一种度量.
在机器学习中被广泛应用,尤其是分类问题中。

1.2 交叉熵的公式

H ( P , Q ) = − ∑ i P ( x i ) log ⁡ Q ( x i ) H(P, Q) = -\sum_{i} P(x_i) \log Q(x_i) H(P,Q)=iP(xi)logQ(xi)
其中, P ( x i ) P(x_i) P(xi)是真实分布中第 ( i ) 个事件的概率;
Q ( x i ) Q(x_i) Q(xi)是模型预测分布中第 ( i ) 个事件的概率。

1.3 交叉熵的特点

  1. 当模型的预测分布 𝑄 越接近真实分布 𝑃 时,交叉熵值越小。
  2. 交叉熵的值总是大于系统真实熵的值。

2. KL散度

2.1 KL散度的含义

KL散度也称为相对熵, 它也是度量两个概率分布之间差异的一种方式. 它是以Kullback和Leibler两个人命名的.

2.2 KL散度的公式

假设有两个概率分布 𝑃 和 𝑄,其中 𝑃 是真实分布,𝑄 是模型的预测分布。KL散度表示二者的交叉熵的差:
D K L ( P ∥ Q ) = H ( P , Q ) − H ( P ) D_{KL}(P \parallel Q) = H(P, Q) - H(P) DKL(PQ)=H(P,Q)H(P)
代入之前交叉熵和熵的公式, 可以得出:
D K L ( P ∥ Q ) = − ∑ i P ( x i ) log ⁡ Q ( x i ) − ( − ∑ i P ( x i ) log ⁡ P ( x i ) ) D_{KL}(P \parallel Q) = -\sum_{i} P(x_i) \log Q(x_i) - \left( -\sum_{i} P(x_i) \log P(x_i) \right) DKL(PQ)=iP(xi)logQ(xi)(iP(xi)logP(xi))
合并化简得到:
D K L ( P ∥ Q ) = ∑ i P ( x i ) log ⁡ P ( x i ) Q ( x i ) D_{KL}(P \parallel Q) = \sum_{i} P(x_i) \log \frac{P(x_i)}{Q(x_i)} DKL(PQ)=iP(xi)logQ(xi)P(xi)

2.3 KL散度的性质

  1. 非负性
    D K L ( P ∥ Q ) ≥ 0 D_{KL}(P \parallel Q) \geq 0 DKL(PQ)0
    当且仅当 𝑃 = 𝑄 时,
    D K L ( P ∥ Q ) = 0 ⟺ P = Q D_{KL}(P \parallel Q) = 0 \iff P = Q DKL(PQ)=0P=Q
  2. 非对称性:
    D K L ( P ∥ Q ) ≠ D K L ( Q ∥ P ) D_{KL}(P \parallel Q) \neq D_{KL}(Q \parallel P) DKL(PQ)=DKL(QP)

KL散度遵循Jensen不等式,其推导基于凸函数的性质。对数函数是凹函数,因此:
D K L ( P ∥ Q ) ≥ 0 D_{KL}(P \parallel Q) \geq 0 DKL(PQ)0

2.4 KL散度的常用场景

KL散度广泛应用于很多机器学习算法中,如变分自编码器生成对抗网络等。它可以作为目标函数来优化模型参数,从而提高模型性能。

3. 交叉熵损失函数

交叉熵损失函数(Cross-Entropy Loss Function)是机器学习中常用的一种损失函数,特别适用于训练神经网络的二分类、多分类问题。它通过比较实际的标签分布与模型预测的概率分布,衡量模型预测的准确性。

3.1 交叉熵损失函数的定义与公式

交叉熵损失函数的目标是最小化预测概率分布与真实分布之间的差异。对于真实分布P 和预测分布 𝑄,交叉熵
𝐻(𝑃,𝑄) 的定义为
L ( y , y ^ ) = − ∑ i = 1 K y i log ⁡ y ^ i L(y, \hat{y}) = -\sum_{i=1}^{K} y_i \log \hat{y}_i L(y,y^)=i=1Kyilogy^i

y i y_{i} yi是实际标签的独热编码(one-hot encoding)如果真实类别是 𝑖,则 y i = 1 y_{i}=1 yi=1, 其余为 0;
y ^ i \hat y_{i} y^i 是模型预测的类别 𝑖 的概率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/851453.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【python】flask 框架

python flask 框架 flask是一个轻量级的python后端框架 (Django, tornado, flask) 官网:欢迎来到 Flask 的世界 — Flask中文文档(3.0.x) 安装:pip install Flask -i https://pypi.douban.com 常识: http,默认端口号为80; https,默认端口号…

国资e学快速学习实战教程

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

1.xshell传不了文件输出0000如何解决.....2.k8s中metalLB文件内容

xshell传不了文件输出0000如何解决 centos版本 1,因为没有工具下载即可 yum -y install lrzszk8s中metalLB文件内容 2.metalLB文件内容 cat metallb-native.yaml apiVersion: v1 kind: Namespace metadata:labels:pod-security.kubernetes.io/audit: privilegedpod-securit…

OSPF LSA头部详解

LSA概述 LSA是OSPF的本质 , 对于网工来说能否完成OSPF的排错就是基于OSPF的LSDB掌握程度 . 其中1/2类LAS是负责区域内部的 类似于设备的直连路由 . 加上对端的设备信息 3 类LSA是区域间的 指的是Area0和其他Area的区域间关系 , 设计多区域的初衷就是避免大型OSPF环境LSA太多…

Go模板页面浏览器显示HTML源码问题

<!--* Title: This is a file for ……* Author: JackieZheng* Date: 2024-06-09 17:00:01* LastEditTime: 2024-06-09 17:01:12* LastEditors: Please set LastEditors* Description:* FilePath: \\GoCode\\templates\\index.html --> <!DOCTYPE html> <html …

【RAG】浅尝基于多头注意力机制思想设计的Multi-Head RAG(多头RAG)

一、动机 现有RAG设计和评估方法&#xff0c;没有方案或评估方法明确针对具有多方面性的问题。下面解释一下多方面性的问题&#xff1a; "多方面性的问题"是指那些需要理解和整合多个不同领域或主题的知识和信息才能得到完整和准确回答的问题。这类问题的特点在于它…

Characters 2 01(卡通可爱人物动画模型)

● 包裹● - 26名男子; - 29个女孩。 ● 使用地点 ● - 游戏。针对游戏引擎优化的模型; -乘法; 广告和营销; - 虚拟现实/增强现实。 ● 特点 ● - 你可以很容易地改变物体的颜色 - 使用UV贴图; - 对象逻辑位置的枢轴; - 模型具有逻辑名称。 ● 几何学● 62个独特的资产(…

Objective-C 学习笔记 | Block 对象

Objective-C 学习笔记 | Block 对象 Objective-C 学习笔记 | Block 对象编写并使用 Block 对象Block 对象的返回值匿名 Block 对象外部变量在 Block 对象中使用 self在 Block 对象中无意使用 self修改外部变量 Objective-C 学习笔记 | Block 对象 Block 对象类似于匿名函数&am…

【代码随想录训练营】【Day 49】【动态规划-8】| Leetcode 139

【代码随想录训练营】【Day 49】【动态规划-8】| Leetcode 139 需强化知识点 多重背包&#xff1a;将其展开为01背包 题目 139. 单词拆分 注意 要保证 单词构成的有序性&#xff0c;先遍历背包&#xff0c;再遍历物品回溯法 class Solution:def wordBreak(self, s: str, …

面对层出不穷的大模型产品,该怎么选呢

层出不穷的大模型产品&#xff0c;你怎么选&#xff1f; 随着近日腾讯元宝APP的正式上线&#xff0c;国内大模型产品又添一员。关于接连出现的“全能“大模型AIGC产品&#xff0c;你都用过哪些呢&#xff1f;不妨来分享一下你的使用体验吧&#xff01;在这些大模型产品中&…

xLua(一) 环境安装笔记

为了方便查阅记录一下xLua的安装地址及方法 1.登录地址下载: https://github.com/Tencent/xLua 2.解压文件 将文件中的这些内容拷贝到项目中的Asset文件夹中 注意 : 工程项目路径不得含有中文 3.将Tools复制到Asset同级目录下 4.导入后会发现有Bug,需要导入工程 5.还有另…

Java:九九乘法表,打印三角形

文章目录 九九乘法表打印三角形改进:控制行数的三角形有空格的三角形 九九乘法表 package com.zhang; /* 打印九九乘法表*/ public class Test8 {public static void main(String[] args) {//i是竖着的 j是横着的for (int i 1; i < 9; i) {for(int j 1; j < 9; j) {i…

IP协议(二)

TOC 一: 网段划分 同一个局域网的主机,要按一定的规则分配IP地址 把一个IP地址分为两部分: 前半部分 ,网络号 >用来表示局域网后半部分,主机号 > 用来区分同一个局域网中的不同主机 同一个局域网内部&#xff0c;主机之间的IP &#xff0c; 网络号相同&#xff0c;主…

JS笔记(自用)

1、js输出&#xff1a;console.log("hellowworld"); 2、变量定义&#xff1a;var&#xff0c;变量名区分大小写 3、数据类型&#xff1a; 基本数据类型&#xff1a;number&#xff08;整数浮点数&#xff0c;NaN非数&#xff0c;正负无穷大&#xff09;。boolean。…

Python 虚拟环境 + 嵌入式 + 编译pyd 部署方案

Python 虚拟环境 嵌入式 编译pyd 部署方案 开发阶段 - 直接发源码版本1. 在虚拟环境下开发 Python 项目 部署阶段1. 创建项目文件夹2. 准备嵌入器 Python 解释器3. 处理第三方库4. 修改 ._pth 文件添加 Python 运行环境5. 添加启动 bat 脚本 目录结构开发阶段 - 编译 pyd 再发…

vue-router的导入和使用

关于如何在 Vue.js 中导入和使用 vue-router 的基本例子。 首先&#xff0c;确保你已经安装了 vue-router。你可以通过 npm 或 yarn 来安装&#xff1a; npm install vue-router # 或者 yarn add vue-router 然后&#xff0c;在你的 Vue 项目中&#xff0c;你可以按照以下…

FuTalk设计周刊-Vol.039

&#x1f525;AI漫谈 热点捕手 1、AI视频生成工具大PK | Runway Gen-2、Pika、Moonvalley和W.A.L.T的文字生视频对比评测 AI届的学术大牛李飞飞最近推出了用于生成逼真视频的扩散模型W.A.L.T。效果很不错&#xff0c;不过目前还未开放公网的访问。于是我萌生了一个想法&#…

气体流量的换算

测量气体流量时&#xff0c;往往需要进行温压补偿。我们可以选择Nm:/h和m3/h作为测量单位&#xff0c;二者之间如何换算呢?在标准状态下&#xff0c;即温度为0℃℃(273.15K)和压力为1个标准大气压(101.325kPa)时&#xff0c;气体的体积被称为Nm3(标方)&#xff0c;N代表标准条…

音视频主要概念

文章目录 常用的一些概念主要概念1主要概念2I帧P帧B帧 常用视频压缩算法 小结 常用的一些概念 主要概念1 视频码率&#xff1a;kb/s&#xff0c;是指视频文件在单位时间内使用的数据流量&#xff0c;也叫码流率。码率越大&#xff0c;说明单位时间内取样率越大&#xff0c;数…

rust asyn和await pin unpin加精!!!

15-探讨为什么Pin在Rust异步编程中如此重要 | Databend_哔哩哔哩_bilibili 能不能Pin住&#xff0c;取决于T是否实现了Unpin&#xff0c;如果实现了Unpin&#xff0c;那么Pin不住 Pin不能pin住u32等基础变量 编译器为async和await生成结构体实现了!Unpin 结构体中使用引用要…