机器学习数学基础(2)--最大似然函数

声明:本文章是根据网上资料,加上自己整理和理解而成,仅为记录自己学习的点点滴滴。可能有错误,欢迎大家指正。


在机器学习和统计学领域中,似然函数(Likelihood Function)是一个至关重要的概念。它不仅是参数估计的基础,而且在模型选择、模型评估以及众多先进的算法和技术中都有着广泛的应用。

1. 似然VS概率

概率和似然是统计学中两个不同的概念,它们在概念上和应用上都有所区别。以下是通过一个具体例子来展示这两者之间的区别:

1.1  概率(Probability)

定义:概率是在给定的参数下,某个事件发生的可能性。它是未来事件发生的度量,通常用介于0和1之间的数值表示。

例子:假设我们有一个标准的六面骰子,每个面上有1到6的数字。当我们掷骰子时,得到数字6的概率是:𝑃(数字=6)=1/6

在这个例子中,参数是骰子的面数(6面),事件是掷出数字6,概率是已知的,并且是在掷骰子之前就确定的。这里的关键是,概率是在给定参数(骰子的公平性,即所有面出现概率相同)的情况下,事件发生的可能性。

1.2  似然(Likelihood)

定义:似然是在已知观测数据的情况下,这些数据对于不同参数值的支持程度。它不是数据发生的概率,而是在给定数据时参数值的相对合理性。

现在,假设我们不确定骰子是否公平,我们通过掷骰子20次,观察到数字6出现了5次。我们想要估计掷出数字6的真实概率 𝜃:

  • 似然函数 表示为 𝐿(𝜃∣5次6),是 𝜃 的函数,表示在参数 𝜃下观测数据(5次6)的相对可能性。似然函数是: 𝐿(𝜃∣5次6)=\theta ^{5}(1-\theta) ^{20-5}
  • 对𝜃的求解,可用最大似然方法,具体可看后面,这时求出的𝜃的值不一定是1/6。

对比上面的例子:

  • 概率函数 给出了在给定参数下事件发生的可能性。在我们的例子中,它告诉我们在假设骰子公平的情况下,掷出6的概率是 1/6​。

  • 似然函数 用于在已知观测数据的情况下,评估不同参数值的合理性。在我们的例子中,它帮助我们根据观测到的5次6来估计 𝜃 的值。

1.3 两者区别:

  • 概率是已知参数下事件的度量:在概率中,参数是已知的,我们计算的是某个事件发生的可能性。
  • 似然是已知数据下参数的度量:在似然中,数据是已知的,我们评估的是不同参数值对数据的支持程度。
  • 概率是绝对的:概率给出了在给定参数下事件发生的确切概率。
  • 似然是相对的:似然比较了在已知数据下,不同参数值的相对合理性。

总结来说,概率关注的是在给定参数下事件发生的可能性,而似然关注的是在给定数据下参数值的合理性。这两者在统计分析中扮演着不同的角色。

2. 概率函数VS似然函数

2.1 概率函数(Probability Function, PF)

  • 定义:概率函数是描述随机变量取各种可能值的概率。对于离散随机变量,它是一个定义在所有可能结果上的函数;对于连续随机变量,它是一个概率密度函数。

  • 用途:概率函数用于计算在给定参数下,随机变量取特定值或处于某个区间的概率。

(1)概率函数
  • 对于离散型随机变量,概率函数通常指的是概率质量函数(Probability Mass Function, PMF),它给出了随机变量取每个可能值的概率.
  • 对于离散随机变量 X,概率函数可以表示为 P(X=x),满足以下性质:。

    • 非负性:对于所有的 𝑥x,有 𝑃(𝑋=𝑥)≥0。
    • 归一性:所有可能的 𝑥x 上的概率之和为1,即: \sum_{x}^{} P(X=x)=1
    • 对于连续随机变量 X
(2) 概率密度函数(Probability Density Function, PDF)
  • 概率密度函数是用于描述连续型随机变量在某个值或某个区间内取值的概率的函数。
  • 对于连续型随机变量 X,其概率密度函数f(x)表示为 f(x)=\frac{d}{dx}F(x),其中 F(x) 是累积分布函数满足以下性质:
    • 非负性:对于所有的 𝑥,有 𝑓(𝑥)≥0。
    • 归一性:𝑋的整个取值范围内,概率密度函数的积分总和为1,即:\int_{-\infty }^{+\infty}f(x)dx=1

2.2  似然函数(Likelihood Function, LF)

  1. 定义:似然函数是在已知观测数据的情况下,这些数据对于不同参数值的相对可能性。它是参数的函数,用于估计参数。

  2. 用途:似然函数用于参数估计,特别是在最大似然估计中,通过找到使似然函数最大化的参数值。

  3. 数学表示:对于简单随机样本,似然函数可以表示为观测数据的概率函数的乘积: L(\theta )=\prod_{i=1}^{n}f(x_{i}|\theta )其中,𝜃 是参数,x_{i}是观测值,f(x_{i}|\theta ) 是给定参数 𝜃下第 𝑖个观测值的概率密度函数或概率质量函数。

2.3 两者区别:

  • 参数与数据的角色:在概率函数中,参数是已知的,数据是随机的;而在似然函数中,数据是已知的,参数是未知的。
  • 目的:概率函数用于计算特定事件发生的概率,似然函数用于估计模型参数。
  • 形式:概率函数通常与特定的概率分布相关联(如正态分布、二项分布等),而似然函数是观测数据对参数的函数。

例子:假设我们有一个骰子,并且想知道掷出6点的概率 𝜃。

  • 概率函数:如果我们假设骰子是公平的,那么掷出6点的概率函数是 𝑃(6点)=𝜃=1/6。
  • 似然函数:若我们掷了20次,观察到5次6点,似然函数将是 L(\theta )=\theta ^{5}(1-\theta) ^{20-5}。我们通过最大化这个似然函数来估计 𝜃 的值。

3.最大似然估计

极大似然估计(Maximum Likelihood Estimation, MLE)是一种在已知观测数据的情况下估计概率模型参数的方法。它基于以下原则:

  1. 似然函数:首先定义似然函数,它是在给定参数值 \theta 下观测数据 X的概率。对于独立同分布的观测数据 X=\left \{ x_{1},x_{2},...,x_{n}\right \},似然函数可以表示为所有观测数据X的概率密度函数(对于连续型随机变量)或概率质量函数(对于离散型随机变量)的乘积: L(\theta|X )=\prod_{i=1}^{n}f(x_{i}|\theta )

  2. 最大化似然:然后,选择使似然函数达到最大值的参数 \theta。这些参数值被称为极大似然估计值。

  3. 对数转换:为了简化计算,通常对似然函数取对数,因为对数是单调函数,可以将乘积转换为求和:ln L(\theta|X )=\sum_{i=1}^{n}lnf(x_{i}|\theta )

  4. 求解参数:对对数似然函数求导,并找到导数为零的点,这通常涉及到数值优化技术。

  5. 统计性质:在大样本情况下,极大似然估计具有一些良好的统计性质,如一致性(估计值随着样本量的增加而趋近于真实值)和渐近正态性(估计量的分布趋近于正态分布)。

仍然是上面的例子:现在,假设我们不确定骰子是否公平,我们通过掷骰子20次,观察到数字6出现了5次。我们想要估计掷出数字6的真实概率 𝜃:

  • 写出似然函数:根据观测结果(例如,掷20次得到5次6),写出似然函数: L(\theta )=\theta ^{5}(1-\theta )^{15}

  • 取对数:为了简化计算,通常对似然函数取对数,得到对数似然函数: lnL(\theta )=5ln\theta +15ln(1-\theta )

  • 求导数:对 𝜃 求导,并找到导数为零的点,这通常通过设置导数等于零并解方程来完成: \frac{d}{d\theta }[5ln\theta +15ln(1-\theta )]=\frac{5 }{\theta }-\frac{15 }{1-\theta } =0

  • 解方程:解上述导数等于零的方程,得到 𝜃 的值:\frac{5 }{\theta }=\frac{15 }{1-\theta },可得\theta =1/4

  • 得到最大似然估计:解得 \theta =1/4 或 0.25,这就是掷出数字6的最大似然估计概率。

如果骰子是完全公平的,我们期望 θ 接近 1/6,但由于我们的样本数据,我们得到的估计值是 1/4。这可能表明骰子存在偏差,或者仅仅是由于随机变异。

4. 似然比

似然比(Likelihood Ratio)是统计学中用于比较两个统计模型对同一数据集的拟合优度的量。它是两个似然函数值的比率,通常用于模型选择、假设检验和参数估计中。

定义:

似然比 𝜆λ 可以定义为两个模型的似然函数值的比值:​ $\lambda (\theta_{1}, \theta_{2} )=\frac{L(\theta_{1}|X)}{L(\theta_{2}|X)}$其中,L(\theta_{1}|X)L(\theta_{1}|X)分别是参数 𝜃1和 𝜃2​ 下观测数据 𝑋 的似然函数值。

应用:

  1. 模型选择:在比较两个模型时,似然比可以用来评估哪个模型对数据的拟合更好。
  2. 似然比检验:一种统计假设检验方法,用于比较零假设(𝐻0H​)和备择假设(𝐻1​)下的似然函数值。

例子:假设我们有一个简单的数据集,由10个观测值组成,我们想要比较以下两个模型:

  • 模型1(零假设 𝐻0​): 假设观测值来自均值为\mu _{0}​,标准差为 \sigma _{0}的正态分布。
  • 模型2(备择假设 𝐻1​): 假设观测值来自均值为\mu _{1}​,标准差为\sigma _{1}的正态分布。

假设我们观测到的数据是 X={2,3,4,5,6,7,8,9,10,11}。

  • 计算似然函数:首先,我们为每个模型计算似然函数。假设\sigma _{0}​ 和\sigma _{1}是已知的,我们只估计均值 𝜇。

  • 模型1的似然函数(假设 \mu= \mu _{0}​):$L(\mu _{0}|X )=\prod_{i=1}^{10}\frac{1}{\sqrt{2\pi \sigma _{0}^{2}}}exp(-\frac{(x_{i}-\mu _{0})^{^{2}}}{2\sigma _{0}^{2}})$ 

  • 模型2的似然函数(假设\mu= \mu _{1}​): $L(\mu _{1}|X )=\prod_{i=1}^{10}\frac{1}{\sqrt{2\pi \sigma _{1}^{2}}}exp(-\frac{(x_{i}-\mu _{1})^{^{2}}}{2\sigma _{1}^{2}})$

  • 计算似然比$\lambda (\mu _{0}, \mu_{1} )=\frac{L(\mu_{0}|X)}{L(\mu_{1}|X)}$

  • 评估似然比:如果似然比 𝜆 接近1,说明两个模型对数据的拟合程度相似;如果 𝜆 显著大于1,模型1可能更合适;如果 𝜆显著小于1,模型2可能更合适。

  • 似然比检验:在实际应用中,我们通常对数化似然比,并将其与特定的统计量进行比较,以决定是否拒绝零假设。

通过这个例子,我们可以看到似然比如何用于比较不同模型对同一数据集的拟合优度,并在模型选择和假设检验中发挥作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/875178.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AIGC的神秘面纱——利用人工智能生成内容改变我们的生活

近年来,人工智能生成内容(AIGC)正在迅速改变我们与数字世界互动的方式。从自动写作到图像生成,AIGC正逐渐走进我们的日常生活。它不仅提高了效率,还为创意和商业活动带来了新的可能性。让我们一起来探索AIGC的世界&…

解读 IP 地址定位

你是否好奇众多平台推出的 IP 归属地功能是如何确定的位置?其实这些说起来并不难。接下来让我来给你们说一下其中的“奥秘”吧~ 一、IP 定位背后的原理 首先,从“IP 地址”开始。因为每个联网设备在接入网络时都会被分配一个独一无二的 IP 地址。根据这…

通信原理思科实验三:无线局域网实验

实验三 无线局域网实验 一:无线局域网基础服务集 实验步骤: 进入物理工作区,导航选择 城市家园; 选择设备 AP0,并分别选择Laptop0、Laptop1放在APO范围外区域 修改笔记本的网卡,从以太网卡切换到无线网卡WPC300N 切…

3.多租户调研1

https://gitee.com/xiaoqiangBUG/hello-ruoyi-cloud.git 1.mybatis plus 的插件 TenantLineInnerInterceptor 是 MyBatis Plus 框架中的一个拦截器,它用于实现多租户系统的数据隔离。在多租户应用中,不同的租户应该只能访问到自己的数据,而…

TCP网络socket编程(面向连接)

Tcp面向链接、面向字节流和文件的读写非常类似():客户端创建套接字主动建立连接,服务器监听套接字一直等待连接的到来,监听到一个,就创建一个新的套接字用于IO 服务器: 创建套接字&#xff1a…

【数据结构】单链表面试题(Java + 力扣 + 详解)

🎇🎉🎉🎉点进来你就是我的人了 博主主页:🙈🙈🙈戳一戳,欢迎大佬指点! 人生格言: 当你的才华撑不起你的野心的时候,你就应该静下心来学习! 欢迎志同道合的朋友…

动态代理更改Java方法的返回参数(可用于优化feign调用后R对象的统一处理)

动态代理更改Java方法的返回参数(可用于优化feign调用后R对象的统一处理) 需求原始解决方案优化后方案1.首先创建AfterInterface.java2.创建InvocationHandler处理代理方法3. 调用 实际运行场景拓展 需求 某些场景,调用别人的方法&#xff0…

Chapter 15 Python函数进阶

欢迎大家订阅【Python从入门到精通】专栏,一起探索Python的无限可能! 文章目录 前言一、函数多返回值二、函数的多种传参方式三、匿名函数 前言 在Python中,函数是组织代码、提高重用性与可读性的基本构建块。随着程序逻辑的复杂性增加&…

在 Windows 上安装 PostgreSQL

官网下载地址: https://www.enterprisedb.com/downloads/postgres-postgresql-downloadsWindows平台 官网直接提供exe安装包,没有手动安装的压缩包 postgresql-14.4-1-windows-x64.exe几个重要的安装选项 安装界面会指定服务程序和库两个路径&#xf…

压测实操--kafka-consumer压测方案

作者:九月 环境信息: 操作系统centos7.9,kafka版本为hdp集群中的2.0版本。 Consumer相关参数 使用Kafka自带的kafka-consumer-perf-test.sh脚本进行压测,该脚本参数为: thread:测试时的单机线程数&…

刷机维修进阶教程-----何谓“tee损坏” 指纹丢失 掉帧 传感器失效?详细修复步骤教程

TEE损坏指的是安卓机型中Key Attestation密钥认证所依赖的可信应用中的证书库被破坏了。然后拒绝为指纹密匙认证提供服务。加密的密匙由TEE负责管理。tee损坏只影响当前机型的密匙认证。不影响加密。通俗的理解。如果你机型维修或者刷机或者解锁或者格机 全檫除分区等等后有异常…

Elasticsearch集群配置-节点职责划分 Hot Warm 架构实践

前言 本文主要讲了ES在节点部署时可以考虑的节点职责划分,如果不考虑节点部署,那么所有节点都会身兼数职(master-eligible ,data,coordinate等),这对后期的维护拓展并不利,所以本文…

软件测试10 渗透性测试及验收测试

渗透性测试及验收测试 知识回顾 Web UI自动化测试 引入自动化测试需要满足的条件自动化测试流程简述自动化测试的关键技术Selenium页面元素定位方式 目标 了解安全测试的概念了解常见的安全漏洞了解安全测试流程及测试工具的使用理解验收测试的概念掌握Alpha测试和Beta测试…

【React 】开发环境搭建详细指南

文章目录 一、准备工作1. 安装 Node.js 和 npm2. 选择代码编辑器 二、创建 React 项目1. 使用 Create React App2. 手动配置 React 项目 三、集成开发工具1. ESLint 和 Prettier2. 使用 Git 进行版本控制 在现代前端开发中,React 是一个非常流行的框架,用…

【计算机毕业设计】866校企合作管理系统

🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板&#xff…

Git处理Failed to connect to www.google.com port 80: Timed out

Git处理Failed to connect to www.google.com port 80: Timed out 输入提交代码命令:git push -u origin master 报错:fatal: unable to access https://gitee.com/solitudeYu/gerenzhuye.git/: Failed to connect to www.google.com port 80: Timed ou…

AI数字人+城市交通大数据可视化平台,让交通管理与服务更简便、更智能

如今,AI数字人作为科技革命和产业革命的重要驱动力,AI数字人接入城市交通大数据可视化平台,可以有效地将各硬件与业务系统进行深度融合,完成业务闭环。依托AI数字人的应用,使城市交通大数据可视化平台的使用复杂度大幅…

我在Vscode学Java泛型(泛型设计、擦除、通配符)

Java泛型 一、泛型 Generics的意义1.1 在没有泛型的时候,集合如何存储数据1.2 引入泛型的好处1.3 注意事项1.3.1 泛型不支持基本数据类型1.3.2 当泛型指定类型,传递数据时可传入该类及其子类类型1.3.3 如果不写泛型,类型默认是Object 二、泛型…

Elastic 数据分层策略:为弹性及高效的实施而优化

作者:来自 Elastic Michael Calizo, Tim Lee 在 Elastic,我们大多数成功的客户实施都是从单一用例开始的,旨在满足特定的业务需求。Elastic 最初被采用通常是因为开发人员欣赏它提供的功能。然而,由于其灵活性和可定制性&#xff…

Ubuntu安装QQ教程

Ubuntu安装QQ教程 腾讯更新Linux版的QQ,这里安装一下; 首先,进入官网找到合适对应的安装包; QQLinux版本官网:https://im.qq.com/linuxqq/index.shtml 我们是ubuntu系统选择X86下的deb版本,如果是arm开…