randn函数加噪声_语义分割中常用的损失函数1(基础篇)

一、L1、L2 loss (分割中不常用,主要用于回归问题)

  1. L1 Loss

L1 Loss 主要用来计算 input x 和 target y 的逐元素间差值的平均绝对值.

95a508ae67eeaaa17101955480f76341.png

pytorch表示为:

  • torch.nn.functional.l1_loss(input, target, size_average=True)

size_average主要是考虑到minibatch的情况下,需要求平均。

2522dde6bedd25d7129319b5b6213d3a.png
loss = nn.L1Loss()
input = torch.randn(3, 5, requires_grad=True)
target = torch.randn(3, 5)
output = loss(input, target)  #是一个标量
output.backward()
# 求这个标量loss对每个input元素的梯度 可以用input.grad显示出来L2 损失(MSE loss)L2 Loss

L2 loss

L2 Loss 主要用来计算 input x 和 target y 的逐元素间差值平方的平均值.

1779dd05fd4f863affacd681bfade518.png

pytorch中表示为:

  • torch.nn.functional.mse_loss(input, target, size_average=True)

具体应用不再介绍。

二、交叉熵损失

首先介绍一下交叉熵损失函数的由来,其中将介绍为什么交叉熵可以用于分类或分割,以及在one-hot多类别分类以及0-1编码二分类之间的区别;

1、从KL散度到交叉熵损失

如果我们对于同一个随机变量 x 有两个单独的概率分布 P(x) 和 Q(x),我们可以使用 KL 散度(Kullback-Leibler (KL) divergence)来衡量这两个分布的差异:

214e5b3950111e79b6e4f2860d336c26.png

变形可以得到:

3b71d7559866181900e51821f6d54f13.png

等式的前一部分恰巧就是p的熵,等式的后一部分,就是交叉熵:

a431bf6a78741bce3078635b993797b6.png

在一般的机器学习任务中,我们需要评估label和predicts之间的差距;上式中:P(x)代表label、q(x)代表predicts;由于label本身的熵是不变的,因此我们只需要关注后面的交叉熵就可以了。所以一般机器学习任务中直接使用交叉熵作为loss,用于评估模型。

2. 多分类任务中的one-hot编码下的交叉熵(当然one-hot也可以用于二分类)

首先介绍softmax操作,如图:

a1c4b5cc039869aff3404f00f58fa4f6.png

softmax的输出是一种归一化的分类概率,它将输出z首先经过指数级别进行差别放大,之后归一化到0到1之间。可以让大的数变得更大,小的数变得更小,最终所有的值归一化到0、1之间。

在数学上:

6f754846e585f60d0cfafdb64bf6c85c.png

直观上看:

9a24670d71d80245a8c756a19b28dc3c.png

如何知道softmax的输出和真实label之间的差距呢?(计算交叉熵损失)

42ee45d11200e7d254a755b13a8d5f84.png

计算出来的y和y hat都是两个vector,和都是1,并且都相同的维度,可以理解为两个离散的概率分布。这样就可以衡量softmax输出的概率分布和label的one-hot分布之间的差距。使用交叉熵。

one-hot下的交叉熵表示为(上面z符号用x表示了哈):

b021f2024b5f5ca3d4d3a868bf61904d.png

因为除了label位置对应的y hat为1,其余均是0;最终只剩一项

,而y label的值就是

fb246ba5a08f9c1c94925886710f5254.png

换个角度:对于这个loss,我们希望的是x label越来越大,其他x项越来越小;loss得到之后,更新都是原有的值减去lr*梯度;需要类别x label对应的梯度是负值,其他对应的梯度为正值。从loss可以很容易看出来哈!!!

pytorch中与Cross Entropy相关的loss Function(one-hot形式):

  • CrossEntropyLoss: combines LogSoftMax and NLLLoss in one single class,也就是说我们的网络不需要在最后一层加任何输出层,该loss Function为我们打包好了;
  • NLLLoss: 也就是negative log likelihood loss,如果需要得到log分布,则需要在网络的最后一层加上LogSoftmax
  • NLLLoss2d: 二维的negative log likelihood loss,多用于分割问题(目前已经整合到NLLLoss)

fc5013fc69cd4605fd42835d5d027738.png

3. 二分类0-1编码:output的编码不是one-hot,只是0代表1类,1代表一类;

真实的分布就是0和1;

预测的分布就是:如果是1的话就是f(x),0的话自然就是1-f(x);

我们希望这个loss损失达到最大值;

57f93eda1c08b91778d9050bac30d207.png

将上式进行归纳:

fe2a317b18a98cfbea781b2ca1341a94.png

本质上就是交叉熵在伯努利分布上的表现形式,即:

2805cc8ad94ad49fc901340ee7aea2c2.png

二分类用的交叉熵,用的时候需要在该层前面加上 Sigmoid 函数。将输出值变到0到1之间;

07a8152013d7c10eb5dbffd7c5a8b3a0.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/471821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode MySQL 1607. 没有卖出的卖家

文章目录1. 题目2. 解题1. 题目 表: Customer ------------------------ | Column Name | Type | ------------------------ | customer_id | int | | customer_name | varchar | ------------------------customer_id 是该表主键. 该表的每行包含网上商城的每一位…

LeetCode MySQL 1623. 三人国家代表队

文章目录1. 题目2. 解题1. 题目 表: SchoolA ------------------------ | Column Name | Type | ------------------------ | student_id | int | | student_name | varchar | ------------------------student_id 是表的主键 表中的每一行包含了学校A中每一个学…

LeetCode MySQL 1633. 各赛事的用户注册率

文章目录1. 题目2. 解题1. 题目 用户表: Users ---------------------- | Column Name | Type | ---------------------- | user_id | int | | user_name | varchar | ----------------------user_id 是该表的主键。 该表中的每行包括用户 ID 和用户…

LeetCode MySQL 1747. 应该被禁止的Leetflex账户

文章目录1. 题目2. 解题1. 题目 表: LogInfo ----------------------- | Column Name | Type | ----------------------- | account_id | int | | ip_address | int | | login | datetime | | logout | datetime | -----------------------该表是…

linux vim配置c,Linux入门学习教程:GNU C及将Vim打造成C/C++的半自动化IDE

C语言在Linux系统中的重要性自然是无与伦比、不可替代,所以我写Linux江湖系列不可能不提C语言。C语言是我的启蒙语言,感谢C语言带领我进入了程序世界。虽然现在不靠它吃饭,但是仍免不了经常和它打交道,特别是在Linux系统下。Linux…

LeetCode MySQL 1661. 每台机器的进程平均运行时间

文章目录1. 题目2. 解题1. 题目 表: Activity ------------------------- | Column Name | Type | ------------------------- | machine_id | int | | process_id | int | | activity_type | enum | | timestamp | float | --------------…

LeetCode MySQL 1741. 查找每个员工花费的总时间

文章目录1. 题目2. 解题1. 题目 表: Employees ------------------- | Column Name | Type | ------------------- | emp_id | int | | event_day | date | | in_time | int | | out_time | int | -------------------(emp_id, event_day, in_time) 是这个表…

LeetCode MySQL 1777. 每家商店的产品价格(行列转换)

文章目录1. 题目2. 解题1. 题目 表:Products ---------------------- | Column Name | Type | ---------------------- | product_id | int | | store | enum | | price | int | ----------------------(product_id,store) 是这个表的…

记事本linux命令换行符,Windows 10版记事本应用终于支持Linux/Mac换行符 排版不再辣眼睛...

记事本(Notepad)是微软 Windows 操作系统中相当经典的一款工具,其在最新的 Windows 10 操作系统中也得到了保留,命运比被 Photos 和 Paint 3D 取代的画图(MsPaint)程序要好得多。不过最近,Windows10 版记事本应用迎来了一项技能更新&#xff…

LeetCode 1885. Count Pairs in Two Arrays(二分查找)

文章目录1. 题目2. 解题1. 题目 Given two integer arrays nums1 and nums2 of length n, count the pairs of indices (i, j) such that i < j and nums1[i] nums1[j] > nums2[i] nums2[j]. Return the number of pairs satisfying the condition. Example 1: Inpu…

How to Avoid Producing Legacy Code at the Speed of Typing

英语不好翻译很烂。英语好的去看原文。 About the Author I am a software architect/developer/programmer.I have a rather pragmatic approach towards programming, but I have realized that it takes a lot of discipline to be agile. I try to practice good craftsman…

c语言程序做成可执行文件,windows环境下C程序生成可执行文件

windows环境下&#xff0c;编写C程序&#xff0c;生成.exe&#xff0c;用于操作某个文件。包含三部分&#xff1a;搭建环境、程序实现、程序分析。1、搭建程序编写和编译环境在windows下安装Git Bash(下载页面)。安装完成后&#xff0c;可以在windows的任意文件夹下&#xff0c…

LeetCode MySQL 1890. 2020年最后一次登录(year)

文章目录1. 题目2. 解题1. 题目 表: Logins -------------------------- | 列名 | 类型 | -------------------------- | user_id | int | | time_stamp | datetime | --------------------------(user_id, time_stamp) 是这个表的主键。 每一…

LeetCode MySQL 1873. 计算特殊奖金(case when then else end)

文章目录1. 题目2. 解题1. 题目 表: Employees ---------------------- | 列名 | 类型 | ---------------------- | employee_id | int | | name | varchar | | salary | int | ----------------------employee_id 是这个表的主键。 此表的每…

LeetCode 1868. 两个行程编码数组的积(双指针)

文章目录1. 题目2. 解题2.1 模拟超时2.2 优化1. 题目 行程编码&#xff08;Run-length encoding&#xff09;是一种压缩算法&#xff0c;能让一个含有许多段连续重复数字的整数类型数组 nums 以一个&#xff08;通常更小的&#xff09;二维数组 encoded 表示。 每个 encoded[…

LeetCode MySQL 1587. 银行账户概要 II

文章目录1. 题目2. 解题1. 题目 表: Users ----------------------- | Column Name | Type | ----------------------- | account | int | | name | varchar | -----------------------account 是该表的主键. 表中的每一行包含银行里中每一个用户的账号…

LeetCode MySQL 1667. 修复表中的名字

文章目录1. 题目2. 解题1. 题目 表&#xff1a; Users ------------------------- | Column Name | Type | ------------------------- | user_id | int | | name | varchar | -------------------------user_id 是该表的主键。 该表包含用户的 I…

c语言汇编混合编程写一个乘法,求通过C语言实现矩阵的加、减及乘法。要自己写的,不要复制过来...

满意答案eevfikx22013.11.28采纳率&#xff1a;53% 等级&#xff1a;13已帮助&#xff1a;8891人#include using namespace std;int main(){int am3,bm3,an3,bn3;int a[am][an];int b[bm][bn];for(int i0;i{for(int j0;j{a[i][j]i*amj;}}for(int i0;i{for(int j0;j{b[i][j]i…

LeetCode MySQL 1821. 寻找今年具有正收入的客户

文章目录1. 题目2. 解题1. 题目 表&#xff1a;Customers -------------------- | Column Name | Type | -------------------- | customer_id | int | | year | int | | revenue | int | --------------------(customer_id, year) 是这个表的主键。 这个表…

【Head First Java 读书笔记】(一)基本概念

Java的工作方式 你要做的事情就是会编写源代码 Java的程序结构 类存于源文件里面 方法存在类中 语句存于方法中 剖析类 当Java虚拟机启动执行时&#xff0c;它会寻找你在命令列中所指定的类&#xff0c;然后它会锁定像下面这样一个特定的方法: public static void main(String[…