边框回归的损失函数_分类损失函数,边框回归损失函数

(1)交叉熵损失函数

蔡杰:简单的交叉熵,你真的懂了吗?​zhuanlan.zhihu.com
b3724ad1f71155fc2dbc128278304b62.png

1.1信息量

一条信息的信息量大小和他的不确定性有很大的关系,需要很多外部信息才能确定的信息,我们称之为这计划的信息量很大。

我们将事件x0的信息量定义如下,(其中p(x0)表示事件x0发生的概率:则信息量定义为:

6139a2320c6e85a643d9b84e4db94f4d.png
由图像可以看出,事件发生的概率越大,包含的信息量越少

1.2熵的概念

信息量是针对单个事件来说的,但是一件事有多种发生的可能,掷色子可能就有六种情况发生。因此熵表示的的是随机变量不确定的度量,是对所有可能事件产生的信息量的期望。

93768f606e5b2683f7eef0caa4ac3938.png
表示所有事件可能发生的情况

二分类的时候,只有两种情况:

9b9a488a0d60057533f3776d78a9e5a6.png

1.3相对熵

相对熵又被称为KL散度,用于衡量同一随机变量x的p(x)和q(x)两个分布差异,其中p(x) 描述样本的真实分布,q(x)描述的是预测的分布,在网络的学习的过程中q(x)需要不断的去学习来拟合准确的p(x)的分布

a05d910c4e094a50c995e46a21e5ca37.png

其中KL的值越小表示两个分布越接近

1.4交叉熵

3d0bc8921b12e8ba5d90d12b4a8398a9.png
第一部分是一个常数部分

56127bb7a7a10f0fcc69b8d4bb514111.png
可以推导交叉熵损失函数

1.5使用交叉熵而不用平方差

当使用sigmoid做为激活函数的时候,平方差损失函数有时不能满足误差越大,权值调整越快,,但是交叉熵损失函数却可以很好的满足这一点

(2)smooth_L1损失函数

作者:尹相楠
链接:https://www.zhihu.com/question/58200555/answer/621174180
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
为了从两个方面限制梯度:

  1. 当预测框与 ground truth 差别过大时,梯度值不至于过大;
  2. 当预测框与 ground truth 差别很小时,梯度值足够小。

考察如下几种损失函数,其中

为预测框与 groud truth 之间 elementwise 的差异:

损失函数对
的导数分别为:

观察 (4),当
增大时
损失对
的导数也增大。这就导致训练初期,预测值与 groud truth 差异过于大时,损失函数对预测值的梯度十分大,训练不稳定。

根据方程 (5),
的导数为常数。这就导致训练后期,预测值与 ground truth 差异很小时,
损失对预测值的导数的绝对值仍然为 1,而 learning rate 如果不变,损失函数将在稳定值附近波动,难以继续收敛以达到更高精度。

最后观察 (6),
较小时,对
的梯度也会变小,而在
很大时,对
的梯度的绝对值达到上限 1,也不会太大以至于破坏网络参数。
完美地避开了
损失的缺陷。其函数图像如下:

3cb0cf5dc3c87a0342618d8f26052f95.png

由图中可以看出,它在远离坐标原点处,图像和

loss 很接近,而在坐标原点附近,转折十分平滑,不像
loss 有个尖角,因此叫做 smooth
loss。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244223.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开榨油店的失败教训_想开水果店没有经验?线下开水果店经营心得分享,或许你用得上...

水果店随地都有,但能把水果店开好的人,似乎并不多见,那作为新人想开水果店,可以吸收哪些经验教训?想开店如何运作更好?且听小编细细道来。 很多开水果店的人都没有开好,那么有什么开水果店失败后…

js中的json ajax,js结合json实现ajax简单实例

这篇文章主要为大家详细介绍了js结合json实现ajax简单实例的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下前期准备1、安装wampserver或者其他相似软件来搭建本地集成安装环境,我安装的是phpstudy2、html、js、css等文件需要放置…

ue4 无限地图_UE4大地图(流关卡、无缝地图)

对于UE4来说我只是个菜鸟,研究一下网上的教程稍微尝试的做一下demo,所以可能下面会有描述不准确或者说没解释清的地方请多谅解哈。也非常欢迎指出我说的不对的地方一起学习。接下来开始教程。UE4的原生功能LevelStreaming就非常适合用来做大地图&#xf…

服务器系统wlanapi,没有找到wlanapi.dll怎么办?

没有找到wlanapi.dll怎么办呢?电脑提示没有找到wlanapi.dll将会导致电脑无法正常使用,因为wlanapi.dll文件中包含了系统正常运行所不可或缺的大量代码,下文小编就为大家带来无法找到wlanapi.dll的解决方法,一起去了解下吧。wlanapi.dll出错原…

用python输入任意三条边长_如何用python求第三条边边长

用Python实现“已知三角形两个直角边,求斜边”要求:用户输入两个直角边(数值为浮点类型),若非浮点类型,则提示用户,继续输入。思路:伪代码描述下步骤1、-input a value for the base as a float(输入某浮点…

最小错误率贝叶斯决策的基本思想_太赞了!机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)...

Datawhale 作者:尹晓丹,Datawhale优秀学习者寄语:首先,简单介绍了生成模型和判别模型,对条件概率、先验概率和后验概率进行了总结;其次,对朴素贝叶斯的原理及公式推导做了详细解读;再…

qprocess回调_QT进程间通信详细介绍及QProcess机制分析

1、QT通信机制为了更好的实现QT的信息交互,在QT系统中创建了较为完善的通信机制。QT的通信可分为QT内部通信和外部通信两大类。对于这两类通信机制及应用场合做如以下分析:(1)QT内部对象间通信在图形用户界面编程中,经常需要将一个窗口部件的…

1 数列分块入门_线性代数入门——利用分块矩阵简化矩阵乘法运算

系列简介:这个系列文章讲解线性代数的基础内容,注重学习方法的培养。线性代数课程的一个重要特点(也是难点)是概念众多,而且各概念间有着千丝万缕的联系,对于初学者不易理解的问题我们会不惜笔墨加以解释。在内容上,以…

junit可执行但控制层无法执行_Junit测试时ContextLoader.getCurrentWebApplicationContext()返回空值...

Junit测试时,test类调用manage类,manage类调用dao类dao类的代码中有如下语句:ContextLoader.getCurrentWebApplicationContext()执行这条语句时返回空值,程序代码如下:下面给出junit测试时的错误语句下面给出Junit运行时控制台输出的语句:九月 26, 2014 …

h5首页加载慢_H5网站制作注意了

H5自适应网站越来越受到企业的追捧,不同于原来的建站模式,H5网站可以很好是调整来达到PC端和移动端的良好展示效果,获得更友好用户体验。H5网站作为网站优化人员,小编第一个想到的并不是H5带来的炫酷效果,认识它解决了…

阿联酋esma认证_阿联酋无人驾驶汽车预计2021年上路

本报讯 迪拜消息-----据《海湾时报》11月26日报道,阿联酋标准化与计量局(ESMA;EmiratesAuthorityfor StandardisationandMetrology)局长AbdullaAlMaeeni表示,阿联酋准备成为全球第一个对无人驾驶汽车制订相关法规的国家,无人驾驶…

PyQt5 电报实时聊天软件 BB-Telegram Pt.0

使用PyQt5实现实时聊天软件 BB-Telegram 是在我BB实时聊天软件上修改的实时显示电报 源代码见下https://github.com/JiayouQin/Python-projects/tree/master/11%20PyQt5%20BB%20Telegram/CN 鉴于PyQt5实现功能篇幅较长,Pt.0不介绍实现过程。 程序主要功能&#…

base cap 分布式_高并发架构系列:详解分布式一致性ACID、CAP、BASE,以及区别

在面试环节,经常会问CAP、BASE等相关的分布式理论,其实这些名词主要还是来自于分布式的一致性,今天主要介绍分布式一致性:强一致性、最终一致性、ACID、CAP等理论。分布式一致性的背景随着分布式事务的出现,传统的单机…

读取剪贴板英语转换为国际莫斯码

Python全代码如下 执行代码之后会自动检测按键,按下CtrlZ之后程序读取剪贴板然后转换为莫斯码再次写入剪贴板 使用第三方模块: pynput win32clipboard 文章尾部附带国际莫斯码表 示例: Caesar openly defied the Senates authority by cros…

asp python 定时任务_Python定时任务轻量解决方案——Schedule

写后端的同学们可能都知道,工作中可能需要周期性执行一些任务,俗称定时任务。Linux环境下,可以借助于系统自带的crontab完成定时任务。但是很多时候,开发的同学们可能并没有权限去操作crontab,所以就催生了一些不太好的…

Pygame简单深度优先算法生成迷宫

学习路径计算之前需要一个场景,网上查了下迷宫生成方法花了点时间写了个简单的迷宫生成器 基本原理十分简单: 使用2维矩阵表示迷宫,每一个节点有四面墙,使用深度搜索,随机顺序向四个方向移动,,如果遇到已到…

wait放弃对象锁_终于搞懂了sleep/wait/notify/notifyAll,真的是不容易

sleep/wait/notify/notifyAll分别有什么作用?它们的区别是什么?wait时为什么要放在循环里而不能直接用if?简介首先对几个相关的方法做个简单解释,Object中有几个用于线程同步的方法:wait、notify、notifyAll。public c…

Pygame 使用Djkstra广度搜索寻找迷宫(相对)最短路径

基于之前写的迷宫生成器实现了Djkstra算法搜索路径。 https://blog.csdn.net/ChillingKangaroo/article/details/122800431 Djkstra基于广度优先算法,与简单搜索不同的是Djkstra在访问每一个节点的时候会计算到该节点的最短路径以及上一个节点,如果有新…

python打乱list_超实用!每 30 秒学会一个 Python 小技巧,GitHub 标星 5300!

公众号关注 “GitHubDaily”设为 “星标”,每天带你逛 GitHub!很多学习 Python 的朋友在项目实战中会遇到不少功能实现上的问题,有些问题并不是很难的问题,或者已经有了很好的方法来解决。当然,孰能生巧,当…

(开源)Flask+Vue+Bootstrap3 人力资源用Web数据库

闲着没事写了一个轻量级web数据库,在网页端访问并操作SQL,可以进行Excel(xlsx)数据导入\导出,包含用户注册\登录\授权功能,密码有hash,授权目前比较简陋:后端使用了一个列表储存授权用户 已授权用户&#…