【预备理论知识——1】深度学习:概率论概述

简单地说,机器学习就是做出预测。

概率论

掷骰子

  1. 假设我们掷骰子,想知道看到1的几率有多大,而不是看到另一个数字。 如果骰子是公平的,那么所有六个结果{1,…, 6}都有相同的可能发生, 因此我们可以说 1 发生的概率为1/6。

  2. 然而现实生活中,对于我们从工厂收到的真实骰子,我们需要检查它是否有瑕疵。 检查骰子的唯一方法是多次投掷并记录结果。 对于每个骰子,我们将观察到中{1,…, 6}的一个值。 对于每个值,一种自然的方法是将它出现的次数除以投掷的总次数, 即此事件(event)概率的估计值。

  3. 大数定律(law of large numbers)告诉我们: 随着投掷次数的增加,这个估计值会越来越接近真实的潜在概率。经过500次实验,每个数出现概率接近真实概率1/6 。
    在这里插入图片描述

概率论公理

  1. 概率论的公理是由安德烈·柯尔莫哥洛夫(Andrey Kolmogorov)在20世纪30年代提出的,为概率论提供了一个坚实的数学基础。这些公理定义了概率空间和概率的基本概念。以下是概率论的三个基本公理:

    • 非负性:对于任何事件A ,其概率 P(A) 都是非负的,即:P(A)≥ 0

    • 归一性:样本空间(所有可能事件的集合)的概率为1,即: P(Ω) = 1 , 其中,Ω 是样本空间。

    • 可列可加性:如果事件 A~1~, A~2~, ...是两两互斥的(即对于任意的 i 不等于 j , Ai 和 Aj 不能同时发生),那么这些事件的并集的概率是各个事件概率的和,即:
      在这里插入图片描述

  2. 这些公理为概率论提供了一个坚实的基础,使得我们可以定义更复杂的概率概念,如条件概率、独立性、贝叶斯定理等。

随机变量

  1. 随机变量是概率论和统计学中的一个基本概念,它是一种将随机试验的结果映射到实数上的函数。随机变量使我们能够用数学方式描述和分析随机现象。随机变量几乎可以是任何数量,并且它可以在随机实验的一组可能性中取一个值。

  2. 随机变量主要分为两种类型:

    • 离散随机变量:其可能的取值是有限的或可数无限的。例如,掷骰子的结果就是一个离散随机变量,因为它只能取1到6之间的整数值。

    • 连续随机变量:其可能的取值是无限且连续的。例如,测量人的身高就是一个连续随机变量,理论上可以取任何正值。

处理多个随机变量

  1. 处理多个随机变量时,我们通常关心它们之间的相互关系以及如何联合描述这些变量的概率特性。
  2. 举一个更复杂的例子:图像包含数百万像素,因此有数百万个随机变量。 在许多情况下,图像会附带一个标签(label),标识图像中的对象。 我们也可以将标签视为一个随机变量。 我们甚至可以将所有元数据视为随机变量,例如位置、时间、光圈、焦距、ISO、对焦距离和相机类型。 所有这些都是联合发生的随机变量。 当我们处理多个随机变量时,会有若干个变量是我们感兴趣的。

联合概率

  1. 联合概率是描述两个或多个随机变量共同取特定值的概率的量度。它提供了这些变量之间关系的完整视图,包括它们是否独立以及它们之间如何相互依赖。
  2. 定义
    在这里插入图片描述

条件概率

  1. 条件概率是指在某个条件或事件已经发生的前提之下,另一个事件发生的概率。用数学语言来描述,如果事件
    A和事件B是两个随机事件,那么在事件B发生的条件下,事件A发生的概率记作P(A∣B)
  2. 公式
    在这里插入图片描述

贝叶斯定理

  1. 贝叶斯定理(Bayes’ Theorem)是概率论中的一个重要定理,它提供了一种计算条件概率的方法,特别是在已知其他相关事件的概率时。贝叶斯定理在统计学、机器学习、数据科学、医学诊断等领域有广泛的应用。
  2. 假设我们有事件A和事件B贝叶斯定理描述了在事件B发生的条件下,事件A发生的概率,即P(A∣B)与在事件A发生的条件下,事件B发生的概率,即P(B∣A)之间的关系:
    在这里插入图片描述

边际化

  1. 边际化(Marginalization)是概率论和统计学中的一个重要概念,它涉及将多维随机变量的概率分布转化为较低维度的概率分布。具体来说,边缘化是指通过求和或积分的方式,将一个或多个变量从联合概率分布中去除,从而得到剩余变量的边缘概率分布。
  2. 举例:假设我们有三个随机变量 AB C,它们的联合概率分布为 P(A,B,C)。如果我们想要找到变量 AB的边际概率分布,而忽略 C 的影响,我们可以通过对 C 的所有可能值进行求和来实现这一点:
    P(A,B)=∑~c~P(A,B,c);这里的求和是对所有可能的 C 值进行的。

独立性

  1. 在概率论和统计学中,独立性是一个基本概念,用来描述两个或多个事件或随机变量之间是否存在关联。如果两个事件或随机变量之间没有关联,即一个事件的发生不影响另一个事件发生的概率,那么它们就被称为是相互独立的。
  2. 对于两个事件 A 和 B,如果它们满足以下条件,则称事件 A 和 B 是独立的。这意味着事件 A 和 B 同时发生的概率等于它们各自发生概率的乘积。
    在这里插入图片描述

期望与方差

期望

  1. 为了概括概率分布的关键特征,我们需要一些测量方法。 一个随机变量的期望(expectation,或平均值(average))是随机变量的加权平均值,它反映了随机变量的中心趋势。
  2. 定义
    在这里插入图片描述

方差

  1. 在许多情况下,我们希望衡量随机变量与其期望值的偏置。这可以通过方差来量化;方差是衡量随机变量分散程度的度量,它表示随机变量的值与其期望值之间的差异的平方的期望值
  2. 定义:
    在这里插入图片描述
  3. 标准差是方差的平方根,它与原始数据具有相同的单位,因此通常用来描述数据的离散程度:
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/53971.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

全球55%的开发者都在用的分布式云到底怎么样?

各种云计算平台和丰富的云服务发展到现在已经很成熟了,全世界范围内被绝大部分企业所接受。然而今天,Akamai想要跟大家讨论一个不太一样的话题:分布式云计算。 简单来说,分布式云计算是指将云资源和服务分散到离数据源或用户更近…

计算机历史的传奇演进:从巴贝奇到人工智能的未来

计算机的传奇演进:从洞察到未来 计算机的历史不仅仅是冷冰冰的技术发展,它更是一段充满创意、意外与惊喜的旅程。让我们穿越时光,走进那些引领计算机革命的传奇人物和事件,细细品味每一段令人惊叹的故事。 起源的奇思妙想&#…

基于开源WQ装备知识图谱的智能问答优化2

基于笔者之前写的博客基础上:https://blog.csdn.net/zhanghan11366/article/details/142139488【基于开源WQ装备知识图谱的智能问答全流程构建】进行优化。新增处理基于特定格式下的WQ文档,抽取文档的WQ属性和关系,并抽取对应WQt图片存储至mi…

AIGC教程:如何用Stable Diffusion+ControlNet做角色设计?

前言 对于生成型AI的画图能力,尤其是AI画美女的能力,相信同行们已经有了充分的了解。然而,对于游戏开发者而言,仅仅是漂亮的二维图片实际上很难直接用于角色设计,因为,除了设计风格之外,角色设…

大数据开发--1.2 Linux介绍及虚拟机网络配置

目录 一. 计算机入门知识介绍 软件和硬件的概述 硬件 软件 操作系统概述 简单介绍 常见的系统操作 学习Linux系统 二. Linux系统介绍 简单介绍 发行版介绍 常用的发行版 三. Linux系统的安装和体验 Linux系统的安装 介绍 虚拟机原理 常见的虚拟机软件 体验Li…

C语言编写一个五子棋游戏-代码实例讲解与分析

编写一个完整的五子棋游戏(Gomoku 或 Gobang)在C语言中是一个相对复杂的任务,因为它涉及到用户界面的处理、游戏逻辑的维护以及可能的AI对手设计。在这里,我将提供一个简化的版本,这个版本将使用控制台来接收用户输入&…

RocketMQ消息发送之广播模式

前言 在前面的文章中我们回顾了RocketMQ的顺序消息和乱序消息,以及里面包含的乱序消息和全局消息,RocketMQ支持多种消息类型和消费模式 今天这篇文章主要介绍RocketMQ的广播消息。希望文章能为正在学习RocketMQ相关知识的大佬们提供帮助! 广…

万博智云CEO王嘉在华为全联接大会:以创新云应用场景,把握增长机遇

一、大会背景 2024年9月19-21日,第九届华为全联接大会将在上海世博展览馆和上海世博中心举办。作为华为的旗舰盛会,本次大会以“共赢行业智能化”为主题邀请了众多思想领袖、商业精英、技术专家、合作伙伴、开发者等业界同仁,从战略、产业、…

【Y004】基于springboot+vue实现的图书管理系统

主营内容:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app等设计与开发。 收藏点赞不迷路,关注作者有好处 项目描述 (1) 图书信息的管理,包括图书信息的条件查询、录入、修改和删除。 (2) 图书类…

《MATLAB项目实战》,专栏目录和介绍

文章目录 前言专栏介绍🎓一、 项目实战篇和GUI界面篇🎓二、 项目基础篇总结 前言 MATLAB 是一款强大且广泛应用的数值计算和数据可视化软件工具,它提供了一个高效、简洁的编程环境,使用户能够进行从简单的矩阵运算到复杂的多维数…

理解Python闭包概念

闭包并不只是一个python中的概念,在函数式编程语言中应用较为广泛。理解python中的闭包一方面是能够正确的使用闭包,另一方面可以好好体会和思考闭包的设计思想。 1.概念介绍 首先看一下维基上对闭包的解释: 在计算机科学中,闭包…

OJ在线评测系统 后端 判题机模块预开发 架构分析 使用工厂模式搭建

判题机模块预开发(架构师)(工厂模式) 判题机模块 是为了把代码交个代码沙箱去处理 得到结果返回 代码沙箱 梳理判题模块和代码沙箱的关系 判题模块:调用代码沙箱 把代码和输入交给代码沙箱去执行 代码沙箱:只负责接受代码和输入 返回编译的结果 不负…

vue-i18n在使用$t时提示类型错误

1. 问题描述 Vue3项目中,使用vue-i18n,在模版中使用$t时,页面可以正常渲染,但是类型报错。 相关依赖版本如下: "dependencies": {"vue": "^3.4.29","vue-i18n": "^9.1…

浅谈软件安全开发的重要性及安全开发实践

在当今数字化时代,软件已成为企业运营的核心驱动力。然而,随着网络环境的日益复杂和黑客技术的不断演进,软件安全问题日益凸显,成为企业不可忽视的重大挑战。本文将从法律法规要求、企业核心数据资产保护、企业信誉等角度&#xf…

3款免费的GPT类工具

前言 随着科技的飞速发展,人工智能(AI)的崛起与发展已经成为我们生活中不可或缺的一部分。它的出现彻底改变了我们与世界互动的方式,并为各行各业带来了前所未有的便利。 一、Kimi 网址:点我前往 国产AI模型Kimi是一…

Linux文件系统入门详解-总结大章

我们先看一张图: 这张图大体上描述了 Linux 系统上,应用程序对磁盘上的文件进行读写时,从上到下经历了哪些事情。 这篇文章就以这张图为基础,介绍 Linux 在 I/O 上做了哪些事情。 文件系统 什么是文件系统 文件系统&#xff0…

Maya学习笔记:物体的层级关系

文章目录 父子关系设置父子关系同时显示两个大纲视图 组 父子关系 设置父子关系 设置父子物体: 方法1 先选择子物体,按住shift再选中父物体,按P或者G键 方法2 在大纲视图中按住鼠标中间,拖动一个物体到另一个物体上 取消父子关…

RabbitMQ 高级特性——TTL

文章目录 前言TTL设置消息的 TTL设置队列的 TTL 前言 对于前面讲到的重试机制中,当确认策略为 MANUAL 手动确认的时候,如果消费者出现了程序逻辑错误,那么消息就无法被争取处理,那么就会执行 basicNack 方法,如果我们…

ClickHouse | 查询

1 ALL 子句 2 ARRAY JOIN 使用别名 :在使用时可以为数组指定别名,数组元素可以通过此别名访问,但数组本身则通过原始名称访问 3 DISTINCT子句 DISTINCT不支持当包含有数组的列 4 FROM子句 FROM 子句指定从以下数据源中读取数据: 1.表 2.子…

hive如何刷新现有分区

hive刷新现有分区的需求,一般出现在你操组分区数据时采用了其他手段,也有极少的情况是有的发行版会删除历史很久的分区,总之各种原因导致的元数据和实际数据的分区对不上。 此时你就可以运行如下语句,让hive去根据实际数据刷新元…