机器学习入门教学——损失函数（极大似然估计法）

机器学习入门教学——损失函数（极大似然估计法）

news/2025/7/5 0:30:58/文章来源:https://blog.csdn.net/weixin_45100742/article/details/132963013

1、前言

我们在训练神经网络时，最常用到的方法就是梯度下降法。在了解梯度下降法前，我们需要了解什么是损失(代价)函数。所谓求的梯度，就是损失函数的梯度。
如果不知道什么是梯度下降的，可以看一下这篇文章：机器学习入门教学——梯度下降、梯度上升_恣睢s的博客-CSDN博客
损失函数其实就是神经网络里的标准和期望的标准相差多少的定量表达。（现有模型与期望模型的质量差距）
损失函数越小，现有模型就越逼近期望模型，现有模型的精度也就越高。
【注】损失函数和代价函数可以看作是两个概念不同的名字，但代表的函数和作用完全一样，通常可以互相替换使用，没有实质区别。
损失函数该如何设计呢？这里有三种方法：最小二乘法、极大似然估计法、交叉熵法。
- 机器学习入门教学——损失函数（最小二乘法）
- 机器学习入门教学——损失函数（极大似然估计法）

2、极大似然估计法

2.1、似然

在了解极大似然估计时，我们先要弄清楚什么是似然。
似然和概率都是统计学中非常重要的概念，了解似然之前，我们先了解什么是概率。
概率是指某个特定环境下某件事情发生的可能性。
- 例如，在抛硬币前，根据硬币的性质，我们可以推测任何一面朝上的可能性是50%。
似然和概率恰好相反。它是基于已经确定的结果，来推测产生这个结果的可能环境。
- 例如，我们随机抛1w次硬币，得到8000次人像，2000次数字。从而推断出人像朝上的概率是0.8，数字朝上的概率是0.2。
假设，θ是环境对应的参数（上述案例中，θ为0.8），x是事件发生的结果。
- 概率：，即在环境参数θ的条件下，x发生的概率。P是关于x的函数。
- 似然：，即在已知观察结果是x的情况下，去推断环境参数θ。L是关于θ的函数。

2.2、极大似然估计

2.2.1、简介

我们先用简单的抛硬币实验说明一下什么是极大似然估计。
假设，抛了10次硬币，7次人像朝上，3次数字朝上，这是实验的情况；设人像朝上的概率为θ，数字朝上的概率为1-θ，这是真实的情况。
我们要做的就是计算出θ的值。
我们根据假设出的θ，可以得出硬币抛出这种情况的概率为：，函数L(θ)被称为θ的似然函数，L(θ)的值被称为似然值。
我们可以枚举θ的值，然后画出L(θ)的图像。
，可以看出θ=0.7时，L(θ)的值最大，即硬币最有可能抛出上述情况。
最大似然估计就是要求环境参数θ等于多少时，观测的结果最可能发生。
【注】理念情况下，θ应该为0.5，与计算的θ不符合。我们可以增加实验次数，例如抛1w次，重新进行计算。

2.2.2、作为损失函数

我们已经了解了极大似然估计，那接下来看看它是如何作为损失函数的呢。
我们还是用之前的这个案例。其中W和b是环境对应的参数，它确定了神经网络中概率模型的样子。这些输入的图片就像抛出的一个个硬币。
在这极大似然估计就是要求W，b等于多少时，观测的结果（输入图片的真实值）最可能发生。
已知似然：是在已知观察结果是x的情况下，去推断环境参数θ。对应到这里，得到似然函数为：
- （W，b的情况下，发生的概率）
将似然函数写成连乘的形式：
由于W，b在神经网络中是确定值，而是由W，b得到的，所以可以使用代替W，b，即：
- （W，b隐藏在中）
的概率是真实情况，的概率是理念情况（需要不断逼近的情况）。的概率就是我们需要不断调整的θ。
我们再进行一次替换。由于，设为1的概率为p，为0的概率为1-p，则的概率分布为：
将的概率改成的概率，似然函数就可以替换成下面的形式：
- ，其中p为为1的概率。
两边同时取对数，把连乘变成连加，进行化简。取对数不影响函数的单调性。
在这个公式基础上添加一个负号，将最大化该公式改为最小化，这就符合损失函数的定义了。即：

3、总结

训练神经网络其实就是要找到适合的W和b。而是现在W和b的产物，我们可以根据的概率得到现有模型和理想模型的差距。当我们在最大化似然函数的时候，就是要求W，b等于多少时，观测的结果（输入图片的真实值）最可能发生，而这里的W，b只是改成了的概率。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/83818.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

性能测试 —— Tomcat监控与调优：status页监控

性能测试 —— Tomcat监控与调优：status页监控

Tomcat服务器是一个免费的开放源代码的Web 应用服务器，Tomcat是Apache 软件基金会(Apache Software Foundation)Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。 Tomcat是一个轻量级应用服务器，在中小型系统…

阅读更多...

DevExpress WinForms图表组件 - 直观的数据信息呈现新方式！（一）

DevExpress WinForms图表组件 - 直观的数据信息呈现新方式！（一）

凭借界面控件DevExpress WinForms全面的2D和3D图表类型的集合，DevExpress WinForms的图表控件设计大大简化了开发者直观地向最终用户呈现信息的方式。 DevExpress WinForms有180组件和UI库，能为Windows Forms平台创建具有影响力的业务解决方案。同时能完…

阅读更多...

IDEA——工程项目的两种窗口开发模式

IDEA——工程项目的两种窗口开发模式

文章目录引言一、多项目窗口模式的便利1.1 源码 debug 二、多项目窗口模式的弊端三、多项目窗口的版本管理四、单项目、多项目窗口模式转换引言 idea编辑器有两种窗口模式，一种是单项目窗口，另一种是多项目窗口。我个人使用较多的是单项目窗口&#…

阅读更多...

Android7.1 ROOT权限的获取

Android7.1 ROOT权限的获取

修改文件： system/extras/su/su.c system/core/include/private/android_filesystem_config.h system/core/libcutils/fs_config.c frameworks/base/core/jni/com_android_internal_os_Zygote.cpp frameworks/base/cmds/app_process/app_main.cpp device/qcom…

阅读更多...

JSON字符串之JS中JSON.parse()

JSON字符串之JS中JSON.parse()

JSON.parse() 方法用来解析JSON字符串，构造由字符串描述的JavaScript值或对象。提供可选的 reviver 函数用以在返回之前对所得到的对象执行变换(操作)。 const json {"result":true, "count":42}; const obj JSON.parse(json);console.log(ob…

阅读更多...

Linux 多线程 | 线程安全、死锁、线程同步

Linux 多线程 | 线程安全、死锁、线程同步

在前面的文章中我们讲述了锁的理解、原理、用户级线程库的内容，以及对Linux中的锁和线程进行了封装，本文中将继续对多线程的内容进行讲解。可重入与线程安全概念线程安全：多个线程并发同一段代码时，不会出现不同的结果。常见…

阅读更多...

网络安全第一次作业

网络安全第一次作业

1、什么是防火墙防火墙是一种网络安全系统，它根据预先确定的安全规则监视和控制传入和传出的网络流量。其主要目的是阻止对计算机或网络的未经授权的访问，同时允许合法通信通过。防火墙可以在硬件、软件或两者的组合中实现，并且可以配置为根…

阅读更多...

七绝 . 秋寒

七绝 . 秋寒

题记拜读署名“淡定人生D”近日发表在“ 今日头条 ”上的古体诗《七绝 . 凉》，本老朽在由衷赞叹该女子才貌双全之时，也对自己寄居养老的成都崇州街子古镇今日下午的秋寒突至天气，情怀涌动，思绪万千，亦作《七绝 . 秋寒…

阅读更多...

课程29：.Net Core API限流

课程29：.Net Core API限流

🚀前言本文是《.Net Core从零学习搭建权限管理系统》教程专栏的课程（点击链接，跳转到专栏主页，欢迎订阅，持续更新…）专栏介绍：以实战为线索，基于.Net 7 + REST + Vue、前后端分离，不依赖任何第三方框架，从零一步一步讲解权限管理系统搭建。专栏适用于人群：We…

阅读更多...

JavaScript小案例-树形菜单(菜单数据为数组)

JavaScript小案例-树形菜单(菜单数据为数组)

菜单层级理论上可以无限多，因为是递归渲染。 gif演示图： 代码： 树形菜单.html <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content&quo…

阅读更多...

超越创意，从用户创造内容到AI生成内容的新时代

超越创意，从用户创造内容到AI生成内容的新时代

在这个信息爆炸的时代，内容创作正经历前所未有的变革，其频率和多样性令人瞠目结舌。曾经，我们主要依赖传统媒体，需要专业团队为人们打造内容，这被称为专业生成内容（PGC，Professional-generated …

阅读更多...

vue3 reactive使用(四)

vue3 reactive使用(四)

1：reactive全家桶 rective直接赋值无效，会破坏proxy响应式代理 const newList reactive<string[]>([]) const newCreate () > {setTimeout(() > {const res [生活, 升华, 生生不息]newList res console.log(newList:, newList) // d…

阅读更多...

MD5加密算法

MD5加密算法

1、简介 MD5在90年代初由MIT的计算机科学实验室和RSA Data Security Inc发明，经MD2、MD3和MD4发展而来。 MD5将任意长度的“字节串”变换成一个128bit的大整数，并且它是一个不可逆的字符串变换算法，换句话说就是，即使你看到源程序…

阅读更多...

IO口电路种类

IO口电路种类

文章目录参考1.高速振荡电路（时钟IO引脚）2.与 GPIO 功能共享的低速振荡电路（子时钟IO）3.CMOS 滞后输入引脚4.电源输入保护电路5.A/D 转换器 ref (AVRH)带保护电路的电源输入端6.CMOS 电平输出7.CMOS 电平输出，带有模…

阅读更多...

sublime text3 设置代码错误提示之php

sublime text3 设置代码错误提示之php

第一步： ctrlshiftp 输入 install package 并选中第二步： 输入 sublimelinter-php 第三步： Prefernces> package Settings >Sublimelinter > settings 这里不同按照版本可能不一样有些可能是 settings User 第四步完成

阅读更多...

Python 变量

Python 变量

视频版教程 Python3零基础7天入门实战视频教程变量无论使用什么语言编程，总要处理数据，处理数据就需要使用变量来保存数据。变量就像一个个小容器，用于“盛装”程序中的数据。再说说，Python的数据类型，有以下六种…

阅读更多...

mysql 主从复制 mysql版本5.7.35

mysql 主从复制 mysql版本5.7.35

文章目录 1.注意要点2.环境3.MySQL 主从配置的步骤：主从库新增DB主服务配置my.cnf从服务配置my.cnf主服务器创建复制用户从服务器执行复制外传 MySQL 主从复制（Master-Slave Replication）是一个常用的高可用性和可扩展性解决方案。通过主从复…

阅读更多...

分享一个基于uniapp+springboot技术开发的校园失物招领小程序（源码、lw、调试）

分享一个基于uniapp+springboot技术开发的校园失物招领小程序（源码、lw、调试）

💕💕作者：计算机源码社 💕💕个人简介：本人七年开发经验，擅长Java、Python、PHP、.NET、微信小程序、爬虫、大数据等，大家有这一块的问题可以一起交流！ 💕&…

阅读更多...

TPU-MLIR——实现Chatglm2-6B大模型移植部署

TPU-MLIR——实现Chatglm2-6B大模型移植部署

TPU-MLIR——实现Chatglm2-6B大模型移植部署本项目实现BM1684X部署语言大模型ChatGLM2-6B。通过TPU-MLIR编译器将模型转换成bmodel，并采用c代码将其部署到BM1684X的PCIE环境，或者SoC环境。编译chatglm2-6B模型 1. 下载‘Chat-GLM2-6B’ 2. 对该模型…

阅读更多...

Python 合并/拆分Excel

Python 合并/拆分Excel

python对于合并excel本篇文章给出合并xlsx文件的方法，xls的方法不在本文介绍拆分数据可以适用于xlsx或xls 合并excel 先读取所有的excel，得到df列表，在将这个df列表按行进行合并 import pandas as pd# 读取所有xlsx def read_xlsx(xlsx_l…

阅读更多...

最新文章