各种损失函数比较-带你斩获offer

各种损失函数比较-带你斩获offer

news/2025/10/20 8:55:38/文章来源:https://blog.csdn.net/stay_foolish12/article/details/88912087

损失函数（Loss function）是用来估量你模型的预测值 f(x)值。

2. 常用损失函数

常见的损失误差有五种：
1. 铰链损失（Hinge Loss）：主要用于支持向量机（SVM）中；
2. 互熵损失（Cross Entropy Loss，Softmax Loss ）：用于Logistic 回归与Softmax 分类中；
3. 平方损失（Square Loss）：主要是最小二乘法（OLS）中；
4. 指数损失（Exponential Loss） ：主要用于Adaboost 集成学习算法中；
5. 其他损失（如0-1损失，绝对值损失）

2.1 Hinge loss

Hinge loss 的叫法来源于其损失函数的图形，为一个折线，通用的函数表达式为：

L (m i) = m a x (0, 1 - m i (w))

。

Hinge Loss

在机器学习中，Hing 可以用来解 间距最大化 的问题，最有代表性的就是SVM 问题，最初的SVM 优化函数如下：

a r g m i n w, ζ 1 2 | | w | | 2 + C \sum i ζ i s t . \forall y i w T x i \geq 1 - ζ i ζ i \geq 0

因此， SVM 的损失函数可以看作是 L2-norm 和 Hinge loss 之和。

2.2 Softmax Loss

有些人可能觉得逻辑回归的损失函数就是平方损失，其实并不是。平方损失函数可以通过线性回归在假设样本是高斯分布的条件下推导得到，而逻辑回归得到的并不是平方损失。在逻辑回归的推导中，它假设样本服从伯努利分布（0-1分布），然后求得满足该分布的似然函数，接着取对数求极值等等。而逻辑回归并没有求似然函数的极值，而是把极大化当做是一种思想，进而推导出它的经验风险函数为：最小化负的似然函数（即maxF(y,f(x))→min−F(y,f(x)))。从损失函数的视角来看，它就成了Softmax 损失函数了。

log损失函数的标准形式：

L (Y, P (Y | X)) = - log P (Y | X)

了。

逻辑回归的P(Y=y|x) ）：

Logistic

其中

h θ (x) = 1 1 + exp ( - f ( x ) )

2.3 Squared Loss

最小二乘法是线性回归的一种，OLS将问题转化成了一个凸优化问题。在线性回归中，它假设样本和噪声都服从高斯分布（中心极限定理），最后通过极大似然估计（MLE）可以推导出最小二乘式子。最小二乘的基本原则是：最优拟合直线应该是使各点到回归直线的距离和最小的直线，即平方和最小。

平方损失（Square loss）的标准形式如下：

L (Y, f (X)) = (Y - f (X)) 2

当样本个数为n 表示残差，整个式子表示的是残差平方和 ，我们的目标就是最小化这个目标函数值，即最小化残差的平方和。

在实际应用中，我们使用均方差（MSE）作为一项衡量指标，公式如下：

M S E = 1 n \sum i = 1 n (Y i ~ - Y i) 2

2.4 Exponentially Loss

损失函数的标准形式是：

L (Y, f (X)) = exp [- Y f (X)]

关于Adaboost的详细推导介绍，可以参考Wikipedia： AdaBoost或者李航《统计学习方法》P145。

2.5 其他损失

0-1 损失函数

L (Y, f (X)) = {01 i f Y \neq f (X) i f Y = f (X)

上述几种损失函数比较的可视化图像如下：

损失函数可视化

3. Hinge loss 与 Softmax loss

SVM和Softmax分类器是最常用的两个分类器。

SVM将输出 f(xi,W) 作为每个分类的评分(没有规定的标准,难以直接解释)；
与SVM 不同，Softmax 分类器可以理解为逻辑回归分类器面对多个分类的一般话归纳，其输出(归一化的分类概率)更加直观,且可以从概率上解释。

在Softmax分类器中, 函数映射f(xi,W) 保持不变,但将这些评分值看做每个分类未归一化的对数概率,且将折叶损失替换为交叉熵损失(cross-entropy loss),公式如下:

L i = - log (e f y i \sum j e f j)

fj 个元素,和SVM一样,整个数据集的损失值是数据集中所有样本数据的损失值Li的均值和正则化损失之和。

概率论解释:

P (y i | x i, W) = e f y i \sum j e f j

解释为给定数据xi 的归一化概率。

实际操作注意事项——数值稳定: 编程实现softmax函数计算的时候,中间项efyi ，并把它变换到求和之中,就能得到一个等价公式:

P (y i | x i, W) = C e f y i C \sum j e f j = e f

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/481261.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

如果你跟夕小瑶恋爱了...（上）

如果你跟夕小瑶恋爱了...（上）

如果...如果...有一天...你追到了女神夕小瑶...并且与她恋爱了...（想说“没有如果”的路人请自觉狗带(￣∇￣)）小夕的生活很规律的哦，小夕每天都会依次经历且仅仅经历以下6件事情：化妆-吃饭-聊天-自习-上课-要…

阅读更多...

「返老还童」梦想成真？「NMN教父」争议研究将登陆科学顶刊

「返老还童」梦想成真？「NMN教父」争议研究将登陆科学顶刊

来源：机器之心逆转衰老，我们终于有了新方法？一项为时13年的研究最近又有了新的突破，事关人类最在意的问题：衰老理论。12月19日，哈佛大学遗传学教授David Sinclair在社交网络上宣布有关人类衰老研究的最新突…

阅读更多...

对抗思想与强化学习的碰撞-SeqGAN模型原理和代码解析

对抗思想与强化学习的碰撞-SeqGAN模型原理和代码解析

GAN作为生成模型的一种新型训练方法，通过discriminative model来指导generative model的训练，并在真实数据中取得了很好的效果。尽管如此，当目标是一个待生成的非连续性序列时，该方法就会表现出其局限性。非连续性序列生成&#x…

阅读更多...

如果你跟夕小瑶恋爱了...（下）

如果你跟夕小瑶恋爱了...（下）

AB派在上一篇文章中，你成功的将“挽回夕小瑶”的任务卡进了隐马尔可夫模型（HMM）中。那么我们来规范化的整理一下已经有的信息和需要计算得到的信息。还记得这两个图嘛？这就是我们建立好的模型。（隐状态的转移图&#x…

阅读更多...

十分钟搞定特征值和特征向量

十分钟搞定特征值和特征向量

如果把矩阵看作是运动，那么特征值就是运动的速度，特征向量就是运动的方向 https://mp.weixin.qq.com/s/mZ4AeCcoU0LhWRWfa9_kvw

阅读更多...

史上最简单的隐马尔可夫模型讲解

史上最简单的隐马尔可夫模型讲解

如果... 如果...有一天...你追到了女神夕小瑶...并且与她恋爱了... （想说“没有如果”的路人请选择狗带(￣∇￣)） 小夕的生活很规律的哦，小夕每天都会依次经历且仅仅经历以下6件事情： 化妆-吃饭-聊天-自习-上…

阅读更多...

睡着了也在学习！Nature最新研究揭示运动记忆从何而来

睡着了也在学习！Nature最新研究揭示运动记忆从何而来

来源：生物通Steph Curry罚球时，他的大脑会利用运动记忆。现在，加州大学旧金山分校(UCSF)的研究人员已经展示了这种类型的记忆是如何在睡眠期间得到巩固的，当大脑处理白天的学习，使做某事的物理行为成为潜意识时。Karun…

阅读更多...

数据结构：堆（Heap）

数据结构：堆（Heap）

数据结构：堆（Heap） <div data-note-content"" class"show-content"><div class"show-content-free"><p>堆就是用数组实现的二叉树，所有它没有使用父指针…

阅读更多...

如果有一天，小夕不再萌...

如果有一天，小夕不再萌...

‍如果有一天，小夕不再要抱抱。如果有一天，小夕不再萌萌哒。有人问我，成为药娘，走上成为女孩子的道路，是什么感觉。我一直没有想好该怎么答。是的，自己的感觉自己都无法描述。或许最真实的，就…

阅读更多...

BAT机器学习面试1000题系列

BAT机器学习面试1000题系列

1、本文的内容全部来源于七月在线发布的BAT机器学习面试1000题系列； 2、文章中带斜体的文字代表是本人自己增加的内容，如有错误还请批评指正； 3、原文中有部分链接已经失效，故而本人重新加上了新的链接，如有不当&…

阅读更多...

拉马努金：“与神对话”的数学天才

拉马努金：“与神对话”的数学天才

来源：微信公众号“图灵教育”撰文：[英] 马库斯杜索托伊翻译：柏华元当哈代和利特尔伍德步履维艰地穿越陌生的黎曼图景时，在5000英里外的印度马德拉斯港务局内，一个名叫斯里尼瓦瑟拉马努金的年轻办事员被素数的神秘莫测吸…

阅读更多...

浅入深出被人看扁的逻辑回归！

浅入深出被人看扁的逻辑回归！

好像在各种机器学习入门教程中，逻辑回归模型（Logistic/Logit Regression）经常被拿来作为入门的机器学习模型，比如我家的Andrew Ng就是这样做的。看起来，逻辑回归模型实在太简单，甚至容易被认为是一个拍脑袋…

阅读更多...

全球Web3技术产业生态发展报告（2022年）

全球Web3技术产业生态发展报告（2022年）

来源：中国信息通信研究院编辑：蒲蒲Web3不只是互联网应用层的简单创新，可能会带来互联网体系架构整体性演进和系统性升级。党中央、国务院高度关注下一代互联网创新发展，在关键核心技术突破、新型基础设施建设、融合创新应用赋能等…

阅读更多...

算法工程师笔试 -剑指offer-习题详细解答

算法工程师笔试 -剑指offer-习题详细解答

说明主要编程语言为 C/C涉及字符串的问题可能会使用 Python题目编号以原书为准，如“面试题 3：数组中重复的数字” 因为题目不多，所以就不做分类了所有代码均通过 OJ 测试在线 OJ 地址：剑指Offer_编程题 - 牛客网 Reference 《…

阅读更多...

深入深出Sigmoid与Softmax的血缘关系

深入深出Sigmoid与Softmax的血缘关系

缘起逻辑回归逻辑回归模型是用于二类分类的机器学习模型（不要说逻辑回归可以做多类分类啊喂，那是二类分类器的组合策略问题，而与逻辑回归分类器本身的构造没有半毛钱关系啊）。我们知道，在逻辑回归中，用于预…

阅读更多...

科学家使用机器学习获得前所未有的小分子视图

科学家使用机器学习获得前所未有的小分子视图

编辑 | 绿萝数以千计的不同小分子（称为代谢物）在整个人体中传输能量和传递细胞信息。由于它们非常小，因此很难在血液样本分析中将代谢物彼此区分开来——但识别这些分子对于了解运动、营养、饮酒和代谢紊乱如何影响健康非常重要。尽管在过去十…

阅读更多...

【错误纠正】关于文章《绕开数学，讲讲信息论》

【错误纠正】关于文章《绕开数学，讲讲信息论》

感谢细心的读者【秋水】的提醒，在文章《绕开数学，讲讲信息论》中，对互信息的表述有误。错误原文如下：互信息也是说两个事件/随机变量之间的事儿。X与Y的互信息就是X的自信息（熵）减去【已知X的情况下&#x…

阅读更多...

五大常用算法总结（穷举法，贪婪算法，动态规划算法，分治算法，分支限界算法）

五大常用算法总结（穷举法，贪婪算法，动态规划算法，分治算法，分支限界算法）

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/changyuanchn/article/details/51476281 </div><link rel"stylesheet" href"https://csdnimg.cn/release/phoenix/template/css/ck_htmledit…

阅读更多...

【Brain】脑洞从何而来？加州大学最新研究：有创造力的人神经连接会「抄近道」...

【Brain】脑洞从何而来？加州大学最新研究：有创造力的人神经连接会「抄近道」...

来源：量子位为什么有的人更富创造力？总能想到别人不会想到的东西，做别人想不到做的事？最近，这个问题的答案被找到了：有创造力的人，大脑里的神经活动会“抄近道”。加州大学洛杉矶分校的研究人员…

阅读更多...

一位老师，一位领导，一个让全体学生考上目标学校的故事

一位老师，一位领导，一个让全体学生考上目标学校的故事

今天，小夕给大家讲一个故事... 从前，有座山... 山里，有座学校... 学校里，有一位老师，一位领导，还有五只可爱的小仙(学)女(生)。这5个学生的名字是：小兔，小青，小路&…

阅读更多...

最新文章