似然 与 概率

  • 概率
  • 似然
  • 概率函数与似然函数的关系
  • 似然与机器学习的关系
  • 最大似然估计

似然与概率分别是针对不同内容的估计和近似

概率

概率:概率表达给定参数 θ \theta θ下样本随机向量 X = x \textbf{X} = {x} X=x的可能性。

概率密度函数的定义形式是 f ( x ∣ θ ) f(x|\theta) f(xθ),即概率密度函数是在"已知" θ 的情况下,去估计样本随机变量 x 出现的可能性.

似然

似然:给定样本 X = x \textbf{X} = {x} X=x下,参数 θ = θ 1 \theta=\theta_1 θ=θ1相对于另外的参数取值)为真实值的可能性
单独的似然值没有意义,似然值L是用来对比在各种θi下,哪种θi更接近与引发事件x的真实的“θ”

似然函数的形式是 L ( θ ∣ x ) L(θ∣x) L(θx),其中"|"代表的是条件概率或者条件分布。似然函数是在已知 样本随机变量 X = x \textbf{X} = {x} X=x的情况下,估计 参数θ 的值,是参数 θ 的函数。即改变θ,选择到 X=x 的可能性在改变。

在这里插入图片描述

L ( θ 1 ∣ x ) > L ( θ 2 ∣ x ) L(θ1∣x)>L(θ2∣x) L(θ1x)>L(θ2x):在参数θ1下取到 X=x 的可能性大于 在参数θ2下取到 X=x 的可能性,即参数θ1为真实参数的可能性大于参数θ2为真实参数的可能性。

注意一些概念的理解:

  1. 样本随机变量的出现是基于某个分布的.例如 f ( x ∣ θ ) f(x|\theta) f(xθ)代表x服从f 分布,而f 的分布是由参数 θ 决定的。参数θ刻画了随机变量 X 在概率空间中服从什么分布。
  2. 在概率统计学中 X \textbf{X} X代表的是随机变量,而小写形式x通常代表其具体取值.

概率函数与似然函数的关系

在函数的结构上,概率函数与似然函数长的是一样的,只是固定的值与自变量不同

f ( x ∣ θ ) = L ( θ ∣ x ) f(x|θ) = L(θ|x) f(xθ)=L(θx)=由 x与θ 所构成的式子。

若X为离散的随机样本,可以将函数改写为:
f ( x ∣ θ ) = L ( θ ∣ x ) = P θ ( X = x ) f(x|θ) = L(θ|x)=P_θ(X=x) f(xθ)=L(θx)=Pθ(X=x)

似然与机器学习的关系

在机器学习中,之所以需要似然函数函数的概念,是因为我们往往是想要机器根据已有的数据学到相应的分布。即在训练阶段, 是根据已有的数据 X 来估计其真实的数据分布服从什么样的分布θ
而在测试阶段, 就是已知参数θ, 来估计该分布下, X应该是什么.

最大似然估计

在模型训练时,我希望找到参数θ,在这个参数下得到样本X的可能性达到最大,即参数θ为真实值的可能性达到最大,把这个参数作为估计的真实值。

而这个参数是通过似然函数得到的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/33036.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于RAG的知识库AI代理机器人,问题思考

基于RAG的知识库AI代理机器人,问题思考 知识库内容分类 对于普通非qa问答格式的知识内容 在分段存储时,需要手动调整,保证每个分段的内容意思完整,不被分割,当然段落也不宜过长,保证内容表达的意思到不可分割为止就行 对于qa问答格式的知识内容 通常需要对问题增加格…

Mac 安装依赖后依旧报错 ModuleNotFoundError: No module named ‘Crypto‘

ModuleNotFoundError: No module named ‘Crypto’ 解决办法 pip uninstall pycryptodome pip uninstall pycrypto pip uninstall crypto pip install pycrypto

头条系统-05-延迟队列精准发布文章-概述添加任务(db和redis实现延迟任务)、取消拉取任务定时刷新(redis管道、分布式锁setNx)

文章目录 延迟任务精准发布文章1)文章定时发布2)延迟任务概述2.1)什么是延迟任务2.2)技术对比2.2.1)DelayQueue2.2.2)RabbitMQ实现延迟任务2.2.3)redis实现 3)redis实现延迟任务4)延迟任务服务实现4.1)搭建heima-leadnews-schedule模块4.2)数据库准备4.3)安装redis4.4)项目集成…

智能BI项目技术点总结

上传文件的安全性设计 文件大小:小于20MB 文件后缀:是否满足.xlsx 文件内容:(成本要高一些) 文件的合规性:比如敏感内容,建议用第三方的审核功能。 扩展点:接入腾讯云的图片万象数据…

SVM算法-人脸识别背后技术详解

引言 支持向量机(SVM)是一种强大的监督学习算法,广泛应用于分类和回归任务中。本文将详细介绍SVM算法在人脸识别任务中的应用,并通过代码示例来展示其背后的技术精髓。我们将分三大部分来展开,本部分将重点介绍SVM算法…

3个阶段和9个问题,择业和创业的核心!

从2023年下半年,接触了不少的创业者,他们对创业都是充满了热情。在很多创业者身上,看到的都是执行力,效率,对事业的专注。只要是说今天立即能搞定的事情,一定不会拖到明天。 去年佛山的张兄弟来找我的交流…

Graalvm尝鲜使用

面试时遇到大佬提点了下在性能不足的机器上传统优化JVM调优已经作用不大的背景下,采用graalvm进行打包成二进制文件,脱离java虚拟机,性能提升20%到100%,因此实操记录下来,方便后续使用 1、前置预装 graalvm-ce-java17…

mongoDB基本命令操作

文章目录 1. 安装(1). 启动mongodb(2). 数据库连接 2. 基本命令(1) 数据库操作(2) 集合操作(3) 文档操作1) 简单查询2) 条件查询3) 投影查询4) 文档更新5) 列值增长修改6) 删除文档7) 分页查询8) 排序查询9) 正则查询(模糊查询)10) 比较查询11) 包含查询 3. 索引(1) 执行计划 1…

Java基础的重点知识-06-String、Arrays、Math、static关键字

文章目录 String类(java.lang)static关键字Arrays类(java.uitl)Math类(java.lang) String类(java.lang) java.lang.String 类代表字符串。 特征: 字符串不变:字符串的值在创建后不能被更改。因为String对象是不可变的&#xff…

PIL实现图片是否可读

对图像数据进行清洗过程中,为了判断图像文件是否可读,可以调用PIL(Pillow)包的 Image 类。可以使用 Image 类的 open 方法,该方法会尝试打开图像文件并返回一个 Image 对象。如果文件不可读,该方法将抛出一…

RHEL 8下Oracle Database 23ai 安装与配置

前言 随着AI的加入,Oracle正式将Oracle23c改名为Oracle23ai,并且将次版本数据库作为一个长期支持的版本,也意味着Oracle数据库正式从Cloud进入AI时代,本文主要介绍Oracle Database 23ai Free的安装与配置。 安装方式 Oracle Da…

linux下进行epoll的简单使用

先做一个简单实例&#xff1a; #include <arpa/inet.h> #include <assert.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <sys/epoll.h> #include <sys/socket.h> #include <unistd.h>#includ…

C语言 | Leetcode C语言题解之第187题重复的DNA序列

题目&#xff1a; 题解&#xff1a; #define MAXSIZE 769/* 选取一个质数即可 */ typedef struct Node {char string[101];int index;struct Node *next; //保存链表表头 } List;typedef struct {List *hashHead[MAXSIZE];//定义哈希数组的大小 } MyHashMap;List * …

代码随想录算法训练营day30|跳跃游戏、

55.跳跃游戏 这道题目的重点在于&#xff1a; 1.不管每次能跳多远&#xff0c;只管跳跃范围的覆盖范围&#xff0c;如果最后能覆盖到最后一个元素&#xff0c;则可以到达最后一个下标 2.覆盖的范围是随着i的遍历而不停增加的&#xff0c;相当于“骑驴找马”&#xff0c;每个数…

StackOverFlowError常见原因及解决方法总结

StackOverFlowError常见原因及解决方法总结 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;今天我们来探讨一下 Java 中一个常见的错误&#xff1a;StackOverFl…

使用自定义的shiro密码匹配器CredentialsMatcher完成密码验证

今天突然想研究一下shiro怎么匹配用户的密码。 我们使用shiro的API登录时&#xff0c;会先创建一个令牌对象&#xff0c;而经常用的令牌对象是UsernamePasswordToken&#xff0c;把用户输入的用户名和密码作为参数构建一个UsernamePasswordToken&#xff0c;然后通过Subject.l…

MM-LLM:CogVLM解读

在图文多模态模型中&#xff0c;范式是图像的编码器、文本编码器、模态融合器。也就是不同模态特征抽取加模态对齐。 这部分可以看李沐的精讲 在大模型里的范式在也是如此&#xff0c;目前的工作大部分都专注于怎么拉齐不同模态。 该论文的动机&#xff08;背景&#xff09;&…

nlp基础-文本预处理及循环神经网络

1 认识文本预处理 1 文本预处理及其作用 定义&#xff1a;文本送给模型之前&#xff0c;提前要做的工作 作用&#xff1a;指导模型超参数的选择 、提升模型的评估指标 举个例子&#xff1a; 思路常识&#xff0c;打造成 X Y关于Y&#xff1a;10分类标签是否均衡关于X&#xf…

代码随想录训练营Day44

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、零钱兑换二、完全平方数三、单词拆分 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 今天是跟着代码随想录刷题的第44天&#xff…

LeetCode:经典题之1491、896 题解与延伸

系列目录 88.合并两个有序数组 52.螺旋数组 567.字符串的排列 643.子数组最大平均数 150.逆波兰表达式 61.旋转链表 160.相交链表 83.删除排序链表中的重复元素 389.找不同 1491.去掉最低工资和最高工资后的工资平均值 896.单调序列 206.反转链表 92.反转链表II 141.环形链表 …