一.平方损失(MSE)
Loss函数:
梯度:
由于x,y是已知的,故可以忽略掉
梯度更新:
sigmoid函数:
可以看出 导数在z取大部分值,都是很小的,这样会使梯度更新慢.
y为1或0是,当a=1,w的梯度为0,a=0,w的梯度为0,故就能看出梯度更新慢.
二.交叉熵损失(Cross-entropy)
梯度更新比较图
可看出逻辑回归比MSE慢.
Loss函数:
简写形式:
梯度更新:
由于没有导数那一项,导致梯度更新不再慢.
参考:
交叉熵损失
Loss函数:
梯度:
由于x,y是已知的,故可以忽略掉
梯度更新:
sigmoid函数:
可以看出 导数在z取大部分值,都是很小的,这样会使梯度更新慢.
y为1或0是,当a=1,w的梯度为0,a=0,w的梯度为0,故就能看出梯度更新慢.
梯度更新比较图
可看出逻辑回归比MSE慢.
Loss函数:
简写形式:
梯度更新:
由于没有导数那一项,导致梯度更新不再慢.
参考:
交叉熵损失
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493053.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!