机器学习数学基础

机器学习基础

    • 1、标量、向量、矩阵、张量
    • 2、概率函数、概率分布、概率密度、分布函数
    • 3、向量的线性相关性
    • 4、最大似然估计
    • 5、正态分布(高斯分布)
    • 6、向量的外积(叉积)
    • 7、向量的内积(点积)
    • 8、超平面(H)



1、标量、向量、矩阵、张量


标量、向量、矩阵和张量是线性代数中不同维度的数学对象,它们之间的区别在于维数和结构:

  • 标量(Scalar):标量是一个数值,只有大小,没有方向。例如物理学中的时间、质量、温度等

  • 向量(Vector):向量也称为欧几里得向量、几何向量、矢量,向量指既有大小又有方向的量。向量可以形象化地表示为带箭头的线段,箭头所指的方向代表向量的方向,线段的长度代表向量的大小。向量有四种表示方式:代数表示(字母加箭头)、几何表示(平行四边形法则)、坐标表示((x,y,z))和矩阵表示([x y z]T

  • 矩阵(Matrix):矩阵是按照方阵排成m行n列的数值集合。简单来说,矩阵是一个二维数组,由行和列组成,每行和每列都是一个向量。矩阵中的每个元素都有自己的行索引和列索引,它可以用来表示线性变换、方程组或数据表

  • 张量(Tensor):张量源于力学,张量是多维数组,目的是把向量、矩阵推向更高的维度。张量是一种泛化的多维数组概念,它可以是任何维度(秩)的,例如向量(矢量)是一阶张量,矩阵是二阶张量,高于二维的称为三阶张量、四阶张量等

总的来说,标量是最简单的数据形式,而向量、矩阵和更高维度的张量则是复杂度逐渐增加的多维数据结构,它们在现代科学和技术的许多领域中都扮演着重要角色

2、概率函数、概率分布、概率密度、分布函数


研究一个随机变量,不只是要看它能取哪些值,更重要的是它取各种值的概率如何!概率函数、概率分布、概率密度、分布函数,都是在描述概率

1)概率函数

概率函数使用函数的形式来表达概率 P i = P ( X = x i ) ( i = 1 , 2 , 3 , . . . ) P_i=P(X=x_i) \quad (i=1,2,3,...) Pi=P(X=xi)(i=1,2,3,...)

例如, P ( X P(X P(X= 1 ) = 1 / 6 1)=1/6 1)=1/6,这个概率函数表示当随机变量取值为1的概率为1/6。概率函数一次只能表示一个随机变量取值的概率

2)概率分布

概率分布是离散型随机变量和每个随机变量对应的概率:

X x 1 x_1 x1 x 2 x_2 x2 x 3 x_3 x3 x n x_n xn
P i P_i Pi P 1 P_1 P1 P 2 P_2 P2 P 3 P_3 P3 P n P_n Pn

这样的列表被叫做离散型随机变量的概率分布。具体就是离散型随机变量的值与这个取值的概率分布列表

对于连续型随机变量,概率分布被叫作概率密度

3)分布函数

对于离散型随机变量,分布函数称为概率分布函数,是指将某一点的概率与该点前面所有概率的累加,又称累积概率函数 F ( X ) = P ( X ≤ x i ) = ∑ 1 i P i F(X)=P(X≤x_i)=\sum_1^iP_i F(X)=P(Xxi)=1iPi

分布函数是一个永不递减的函数,最右边即为最大值1,最左边为最小值0

对于连续型随机变量,分布函数称为概率密度函数,它就是概率密度从负无穷到当前随机变量值的定积分(面积)
F ( X ) = ∫ − ∞ X f ( x ) d x F(X)=\int_{-\infty}^Xf(x)dx F(X)=Xf(x)dx

在这里插入图片描述

如图所示,左图表示 F ( x ) F(x) F(x)是连续型随机变量的概率密度,右图表示 f ( x ) f(x) f(x)是连续型随机变量的概率密度函数,它们之间的关系是:概率密度函数是概率密度的导函数

需要注意的是,概率密度函数在某点取值的几何意义表示概率密度函数在该点的变化率(导数),而不是概率值

3、向量的线性相关性


所有分量为实数的n维向量构成的集合, 称为一个n维向量空间,向量空间又称线性空间

对于n维向量 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am,如果存在不全为0的数使得
k 1 a 1 + k 2 a 2 + . . . + k m a m = 0 k_1a_1+k_2a_2+...+k_ma_m=0 k1a1+k2a2+...+kmam=0

则称向量组 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am是线性相关的,否则,称向量组 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am线性无关

4、最大似然估计


最大似然估计的原理详解及推导见文章:传送门

5、正态分布(高斯分布)


正态分布(高斯分布)的介绍详见文章:传送门

6、向量的外积(叉积)


向量的叉积(叉乘),也叫向量的外积、向量积。对于两个向量 a ⃗ = ( x 1 , y 1 , z 1 ) \vec a=(x_1,y_1,z_1) a

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/659870.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

回溯--39. 组合总和/medium 理解度C

39. 组合总和 1、题目2、题目分析3、复杂度最优解代码示例4、适用场景 1、题目 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target ,找出 candidates 中可以使数字和为目标数 target 的 所有 不同组合 ,并以列表形式返回。你可以按 任意…

探索工业以太网交换机的新纪元:满足多元化市场需求

在当今数字化的时代,工业以太网交换机作为信息网络的核心枢纽,扮演着至关重要的角色。它们连接着各种设备,实现数据的快速传输与稳定交换,为工业自动化、物联网和智能制造提供了可靠的基础设施。随着数字化转型的不断深入&#xf…

媒体查询的使用

媒体查询的使用 media media-type and (media-feature) {/* 在满足特定媒体条件时应用的CSS样式 */ }media-type:可选,媒体类型,例如 all(所有设备)、print(打印预览)、screen(屏幕…

VBoxManage 命令行使用

VBoxManage: 序号命令作用1VBoxManage list vms# 查看当前所有虚拟机2VBoxManage list runningvms # 查看当前正在运行的虚拟机3VBoxManage startvm 虚拟机名 --type gui # 启动虚拟机4VBoxManage startvm 虚拟机名 --type headless# 无前端图形界面方式启动虚拟机…

2024第16届中国西部教育博览会在成渝双城举办

2024第16届中国西部教育博览会在成渝双城举办 邀请函 主办单位:中国西部教体融合博览会组委会 承办单位:重庆港华展览有限公司 时间:2024年3月30--31日 地点:成都世纪城新国际会展中心 时间:2024年6月22--23日 地…

【Linux取经路】进程控制——进程等待

文章目录 一、进程创建1.1 初识 fork 函数1.2 fork 函数返回值1.3 写时拷贝1.4 fork 的常规用法1.5 fork 调用失败的原因1.6 创建一批进程 二、进程终止2.1 进程退出场景2.2 strerror函数2.3 errno全局变量2.4 程序异常2.5 进程常见退出方法2.6 exit 函数2.7 _exit 函数和 exit…

week03day03(文件操作、正则表达式1)

一、文件操作 1.数据持久化(数据本地化) -- 将数据保存在硬盘 程序中的数据默认是保存在运行内存中的,保存在运行内存中的数据在程序运行结束后会自动释放。如果希望在程序结束后,数据仍可以使用&…

新春送福,暖心探访

春节将至,岁寒情暖。为了深入了解辖区困境老人的生活状况和真实需求,让困境老人感受到党和政府的关爱与温暖,营造幸福和谐的节日气氛。2024年1月31日下午,在长沙市湘江新区民政与社会保障局的支持下,学联社区携手长沙市…

dockers- php

在Dockerfile里面安装php7.4的GD库 - 知乎

Https加密超文本传输协议的运用

一、https的相关知识 1.1 https的简介 HTTPS (全称:Hypertext Transfer Protocol Secure ),是以安全为目标的 HTTP 通道,在HTTP的基础上通过传输加密和身份认证保证了传输过程的安全性 。HTTPS 在HTTP 的基础下加…

基于微服务的高考志愿智能辅助决策系统(附源码)

目录 一.引言 1、编写目的 2、系统功能概述 二.功能分析 三.微服务模块 1、微服务用户相关模块 (1)用户注册 (2)用户登录 (3)用户信息管理 (4)用户操作 2、微服务文件云存…

React Router 完美教程(下)

我们书接上回,继续我们的React Router 路由之路: 我们到目前为止都没有用到 state、useEffect、redux等状态管理器。但也达到了我们的设计目的。 注意,action 返回的结果 可以在组件中使用 useActionData() 来获取。就像 useLoaderData() 的使…

Linux上使用OpenCvSharp

前言 OpenCV是一个基于Apache2.0许可(开源)发行的跨平台计算机视觉和机器学习软件库,它具有C++,Python,Java和MATLAB接口,并支持Windows,Linux,Android和Mac OS。OpenCvSharp是一个OpenCV的 .Net wrapper,应用最新的OpenCV库开发,使用习惯比EmguCV更接近原始的OpenC…

STL - string类

1、标准库中的string类 1.1、string类了解 字符串是表示字符序列的类标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性string类是使用char (即作为它的字符类型,使用…

MD5算法:高效安全的数据完整性保障

摘要:在数字世界中,确保数据完整性和安全性至关重要。消息摘要算法就是一种用于实现这一目标的常用技术。其中,Message Digest Algorithm 5(MD5)算法因其高效性和安全性而受到广泛关注。本文将详细介绍MD5算法的优缺点…

web应用课——(第四讲:中期项目——拳皇)

代码AC Git地址:拳皇——AC Git链接

Maven:一些常见问题

1、ReasonPhrase: Forbidden a.注意用户的权限以及角色role的设置,一般是没有权限才会被禁止的。 2、Failed to collect dependencies a.需要把parent工程,也就是package是pom的那个工程先install一下,或者deploy b.需要注意在设置的工厂里面…

87 SpringMVC 上传文件在业务代码中拿不到文件数据

前言 呵呵 最近在整理文件上传部分的东西的时候, 发现了一个问题 文件上传部分 有一些基础的问题, 可以参见 29 SpringMVC 上传文件未生成临时文件, 我们这里上传的文件的大小是 大于 sizeThreshold 的 SpringMVC 上传文件的时候会生成一个临时文件, 我想直接使用这个临时…

【开源】SpringBoot框架开发海南旅游景点推荐系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 用户端2.2 管理员端 三、系统展示四、核心代码4.1 随机景点推荐4.2 景点评价4.3 协同推荐算法4.4 网站登录4.5 查询景点美食 五、免责说明 一、摘要 1.1 项目介绍 基于VueSpringBootMySQL的海南旅游推荐系统&#xff…

【DB2】—— 一次关于db2 sqlcode -420 22018的记录

情况描述 在DB2 10.5数据库中执行以下SQL语句: SELECT * FROM aa WHERE aa.ivc_typ IN (213,123,12334,345)其中aa.ivc_typ列的类型为VARCHAR(10) 关于执行会发生以下情况 类型转换:SQL引擎会尝试把IN列表中的整数常量转换为VARCHAR(10)类型&#xf…