randn函数加噪声_语义分割中常用的损失函数1(基础篇)

一、L1、L2 loss (分割中不常用,主要用于回归问题)

  1. L1 Loss

L1 Loss 主要用来计算 input x 和 target y 的逐元素间差值的平均绝对值.

95a508ae67eeaaa17101955480f76341.png

pytorch表示为:

  • torch.nn.functional.l1_loss(input, target, size_average=True)

size_average主要是考虑到minibatch的情况下,需要求平均。

2522dde6bedd25d7129319b5b6213d3a.png
loss = nn.L1Loss()
input = torch.randn(3, 5, requires_grad=True)
target = torch.randn(3, 5)
output = loss(input, target)  #是一个标量
output.backward()
# 求这个标量loss对每个input元素的梯度 可以用input.grad显示出来L2 损失(MSE loss)L2 Loss

L2 loss

L2 Loss 主要用来计算 input x 和 target y 的逐元素间差值平方的平均值.

1779dd05fd4f863affacd681bfade518.png

pytorch中表示为:

  • torch.nn.functional.mse_loss(input, target, size_average=True)

具体应用不再介绍。

二、交叉熵损失

首先介绍一下交叉熵损失函数的由来,其中将介绍为什么交叉熵可以用于分类或分割,以及在one-hot多类别分类以及0-1编码二分类之间的区别;

1、从KL散度到交叉熵损失

如果我们对于同一个随机变量 x 有两个单独的概率分布 P(x) 和 Q(x),我们可以使用 KL 散度(Kullback-Leibler (KL) divergence)来衡量这两个分布的差异:

214e5b3950111e79b6e4f2860d336c26.png

变形可以得到:

3b71d7559866181900e51821f6d54f13.png

等式的前一部分恰巧就是p的熵,等式的后一部分,就是交叉熵:

a431bf6a78741bce3078635b993797b6.png

在一般的机器学习任务中,我们需要评估label和predicts之间的差距;上式中:P(x)代表label、q(x)代表predicts;由于label本身的熵是不变的,因此我们只需要关注后面的交叉熵就可以了。所以一般机器学习任务中直接使用交叉熵作为loss,用于评估模型。

2. 多分类任务中的one-hot编码下的交叉熵(当然one-hot也可以用于二分类)

首先介绍softmax操作,如图:

a1c4b5cc039869aff3404f00f58fa4f6.png

softmax的输出是一种归一化的分类概率,它将输出z首先经过指数级别进行差别放大,之后归一化到0到1之间。可以让大的数变得更大,小的数变得更小,最终所有的值归一化到0、1之间。

在数学上:

6f754846e585f60d0cfafdb64bf6c85c.png

直观上看:

9a24670d71d80245a8c756a19b28dc3c.png

如何知道softmax的输出和真实label之间的差距呢?(计算交叉熵损失)

42ee45d11200e7d254a755b13a8d5f84.png

计算出来的y和y hat都是两个vector,和都是1,并且都相同的维度,可以理解为两个离散的概率分布。这样就可以衡量softmax输出的概率分布和label的one-hot分布之间的差距。使用交叉熵。

one-hot下的交叉熵表示为(上面z符号用x表示了哈):

b021f2024b5f5ca3d4d3a868bf61904d.png

因为除了label位置对应的y hat为1,其余均是0;最终只剩一项

,而y label的值就是

fb246ba5a08f9c1c94925886710f5254.png

换个角度:对于这个loss,我们希望的是x label越来越大,其他x项越来越小;loss得到之后,更新都是原有的值减去lr*梯度;需要类别x label对应的梯度是负值,其他对应的梯度为正值。从loss可以很容易看出来哈!!!

pytorch中与Cross Entropy相关的loss Function(one-hot形式):

  • CrossEntropyLoss: combines LogSoftMax and NLLLoss in one single class,也就是说我们的网络不需要在最后一层加任何输出层,该loss Function为我们打包好了;
  • NLLLoss: 也就是negative log likelihood loss,如果需要得到log分布,则需要在网络的最后一层加上LogSoftmax
  • NLLLoss2d: 二维的negative log likelihood loss,多用于分割问题(目前已经整合到NLLLoss)

fc5013fc69cd4605fd42835d5d027738.png

3. 二分类0-1编码:output的编码不是one-hot,只是0代表1类,1代表一类;

真实的分布就是0和1;

预测的分布就是:如果是1的话就是f(x),0的话自然就是1-f(x);

我们希望这个loss损失达到最大值;

57f93eda1c08b91778d9050bac30d207.png

将上式进行归纳:

fe2a317b18a98cfbea781b2ca1341a94.png

本质上就是交叉熵在伯努利分布上的表现形式,即:

2805cc8ad94ad49fc901340ee7aea2c2.png

二分类用的交叉熵,用的时候需要在该层前面加上 Sigmoid 函数。将输出值变到0到1之间;

07a8152013d7c10eb5dbffd7c5a8b3a0.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/471821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode MySQL 1607. 没有卖出的卖家

文章目录1. 题目2. 解题1. 题目 表: Customer ------------------------ | Column Name | Type | ------------------------ | customer_id | int | | customer_name | varchar | ------------------------customer_id 是该表主键. 该表的每行包含网上商城的每一位…

linux串口数据异常,linux串口知识深入--收到数据异常问题处理

对于串口并不陌生,使用了N遍,总以为理解很深刻,实际上还有很多细节未知。近期在处理新的板子发现串口收发很不正常,经常少一些数据、莫名其妙数据被串改了,导致校验通不过,现象很诡异例如存在以下几种现象&…

iOS经典面试题

前言 写这篇文章的目的是因为前两天同学想应聘iOS开发,从网上找了iOS面试题和答案让我帮忙看看。我扫了一眼,倒吸了一口冷气,仔细一看,气的发抖。整篇题目30多个没有一个答案是对的,总结这篇面试题的作者对iOS机制根本…

linux常用命令 打开文件,【Linux】常用命令 lsof查看打开的文件

Linux系统把软硬件都抽象成文件,所以通过文件可以追踪到很多重要信息,如读取的配置文件、打开的端口等。下面是常见的用法:默认测试文件名为text.txt1,显示打开text.txt的进程:lsof text.txt2,显示占用某个…

testflight怎么做版本更新_如何使用TestFlight进行App构建版本测试

在日常的开发当中,当一个项目在开发过程中或者完成准备上线,都需要我们进行真机测试,否则不可能开发完了就直接扔到了App,等上线了再下载看看,这都是不可能的。那么说到真机测试,大家肯定会想到弄一个99美刀…

LeetCode MySQL 1623. 三人国家代表队

文章目录1. 题目2. 解题1. 题目 表: SchoolA ------------------------ | Column Name | Type | ------------------------ | student_id | int | | student_name | varchar | ------------------------student_id 是表的主键 表中的每一行包含了学校A中每一个学…

LeetCode MySQL 1633. 各赛事的用户注册率

文章目录1. 题目2. 解题1. 题目 用户表: Users ---------------------- | Column Name | Type | ---------------------- | user_id | int | | user_name | varchar | ----------------------user_id 是该表的主键。 该表中的每行包括用户 ID 和用户…

linux如何批量导出文件格式,Linux下批量将md文件转换为html文件

要将markdown文件转换成html文件,可以用discount或python-markdown软件包提供的markdown工具。$ sudo apt-get install discount或$ sudo apt-get install python-markdown用discount提供的markdown工具转换:$ markdown -o Release-Notes.html Release-N…

python最好用的助手_推荐5款好用的Python工具

这篇文章的内容是给大家推荐了5款好用的Python工具,有需要的朋友可以看一看摘要:推荐5个酷毙的Python工具工欲善其事必先利其器,一个好的工具能让起到事半功倍的效果,Python社区提供了足够多的优秀工具来帮助开发者更方便的实现某…

tar linux 举例,linux 的tar 命令详解举例

编写shell脚本的时候经常需要解压缩到指定的文件夹,tar命令是最常用的参考一下说明,其中注意-C的用法。tar命令解压文件到指定目录:tar -zxvf /home/zjx/aa.tar.gz -C /home/zjx/pftar [-cxtzjvfpPN] 文件与目录....参数:-c &…

worth,worthy,worthwhile的区别(一)

worth,worthy,worthwhile的区别(一) 1:worth,作形容词,意思是,值多少钱,相当于...的价值,后面常接表示钱数的名词或相当于"代价"的比喻性名词,比如a:The watch is worth five hundred yuan at most。这块表最…

LeetCode MySQL 1747. 应该被禁止的Leetflex账户

文章目录1. 题目2. 解题1. 题目 表: LogInfo ----------------------- | Column Name | Type | ----------------------- | account_id | int | | ip_address | int | | login | datetime | | logout | datetime | -----------------------该表是…

就业技术书文件表格_就业申请书

1申请书尊敬的位领导:您们好!首先衷心感谢各位领导百忙之中查阅我进入xxxxxx公司的申请书,谢谢!我叫xxx,男,生于xx年xx月,籍贯:xxxx,汉族,于xx年xx月~xx年xx月…

js添加收藏夹

function addfavorite() { var ctrl (navigator.userAgent.toLowerCase()).indexOf(mac) ! -1 ? Command/Cmd: CTRL;try{if (document.all) { //IE类浏览器try {window.external.toString(); //360浏览器不支持window.external,无法收藏window.alert("国内开…

linux vim配置c,Linux入门学习教程:GNU C及将Vim打造成C/C++的半自动化IDE

C语言在Linux系统中的重要性自然是无与伦比、不可替代,所以我写Linux江湖系列不可能不提C语言。C语言是我的启蒙语言,感谢C语言带领我进入了程序世界。虽然现在不靠它吃饭,但是仍免不了经常和它打交道,特别是在Linux系统下。Linux…

LeetCode MySQL 1661. 每台机器的进程平均运行时间

文章目录1. 题目2. 解题1. 题目 表: Activity ------------------------- | Column Name | Type | ------------------------- | machine_id | int | | process_id | int | | activity_type | enum | | timestamp | float | --------------…

场地测量的方法和程序_场地测量方案

第1页共21页天河学院A区场地土方平整测量施工方案一、工程概况广东技术师范天河学院校内实训基地,学生会办公室前面场地,土方整平面积约为100平方米,地形复杂。二、人员分组本小组为第3小组一共有6人,陈德杰、何浚鸿、徐中仪、冼伟…

LeetCode MySQL 1741. 查找每个员工花费的总时间

文章目录1. 题目2. 解题1. 题目 表: Employees ------------------- | Column Name | Type | ------------------- | emp_id | int | | event_day | date | | in_time | int | | out_time | int | -------------------(emp_id, event_day, in_time) 是这个表…

过滤器--起步阶段

过滤器 1)使用AngularJS过滤器可以实现对字符串的大小写转换、货币格式的转换、数组的过滤等等。 用法&#xff1a;管道字符(|)过滤器名。 1.过滤器uppercase、lowercase对字符串转换大、小写&#xff0c;如下所示&#xff1a; <div ng-app"">请输入: <inpu…

linux ls-l getswd,liunx

title: liunxdate: 2020-03-01 21:42:48tags:- liunx- systemcategory:systemliunx 常用命令$ pwd //输出当前文件绝对路劲$ cd //进入某个文件夹,改变目录$ ls //查看当前目录下的文件或者文件夹名$ ls -l //查看当前目录下所有的文件夹详情$ ls -a //查看当前目录下的所有文件…