【数学建模】相关是一个距离指标吗?

一、说明

        本文探讨最平凡的数学模型--距离模型。我们知道,任何数学模型如果是个距离模型,那么它是:放心的、自动的、不加任意条件的指标项目。然而另一些度量参数不是距离空间,因此,使用起来必须外加若干条件,本文指的相关性就是这种类型的度量。

二、度量基本概念

        在没有距离的情况下,“近”和“远”是没有意义的。为了在一组抽象的数学对象上定义这些概念,我们需要能够测量每对对象之间的距离。问题是:如果抽象的数学对象是随机变量,那么我们应该如何测量它们之间的距离?

        相关距离是测量具有有限方差的两个随机变量之间距离的常用方法¹。如果两个随机变量之间的相关²为r,则它们的相关距离定义为d=1-r。但是,适当的距离度量需要具有一些属性,即应该是一个度量,并且相关距离是否具有这些属性并非易事。在本说明中,我们询问相关距离是否是一个指标。

三、回顾:什么是度量?

        考虑我们要定义集合Ω元素之间的距离度量。然后,度量(适当的距离度量)是具有以下属性的函数 d:Ω×Ω →R⁺:

  1. 如果两个物体的距离为零,则它们是相同的,反之亦然;即 d(x,y) = 0 iff x = y。
  2. 它是对称的,即d(x,y)=d(y,x)。
  3. 它满足三角不等式,即d(x,y)≤d(x,z)+d(z,y)。

        由于相关性是对称的,因此对于相关距离,第二个性质显然是满足的。因此,我们需要研究另外两个。

四、第一属性:元素身份辨别 

        考虑具有相关性 r₁₂ 的随机变量 X₁ 和 X₂。 则相关距离 d₁₂ = 1 - r₁₂ 为零,当且仅 r₁₂ = 1。 同时,X₁ 和 X₂ 之间的相关性是 0,当且仅当存在 a><> 和 b∈ R 使得 X₁=aX₂+b

        换句话说,d₁₂ 为零当且仅当 X 可以通过仅通过移动和缩放转换为 X₁。相关距离的这一特殊特征使得我们需要平移和尺度不变距离测量的情况非常有趣。但是,此功能使得相关距离不可能成为具有有限方差的所有随机变量集合的度量;相反,它仍然可以是归一化随机变量(即均值和单位方差为零的变量)的集合³上的距离。

        结论:相关距离在归一化随机变量集上具有第一个性质。

        图1.随机变量向量表示之间的相关距离的可视化;详见附录。

五、第三个属性:三角不等式

        三角不等式的陈述非常直观:从床到办公桌的直线是从床到办公桌的最短路径。如果相关距离想要满足这个性质,那么任意三个随机变量 X₁、X₂  X₃ 的相关性必须满足不等式

        因此,如果 r₂₃ 和 r₁₃ 等于 0.5,则 r₁₂ 必须大于或等于 0。 很容易找到不满足此条件的随机变量的示例;请参阅我之前关于“相关性的误解”的说明中的第三种情况。换句话说,在一个距离由相关距离测量的世界里,如果你先去沙发,然后从那里到你的办公桌,你可能会发现从床到办公桌的路径更短!

结论?相关距离满足第三个条件,它是一个正确的度量。

六、如何使其成为指标?

        在归一化随机变量的集合上,很容易证明欧几里得距离可以用相关性表示为

        欧几里得距离是一个度量;欧几里得距离是相关距离的平方根(成正比)。因此,相关距离的平方根是一个度量。

七、对向量表示的评论

考虑一组具有相关矩阵 Σ 的 N 个归一化随机变量。如果我们将 Σ 平方根的第 n 行(即 N-d 单位球上的 N-d 向量)视为第 n个随机变量的向量表示,那么这些向量之间的欧几里得距离(与它们之间余弦距离的平方根相同)与相应随机数之间相关距离的平方根保持相同(通过忽略尺度)变量。

八、结论

        相关距离不满足三角不等式,因此不是度量。但是,它的平方根是规范化随机变量集上的度量。

脚注

¹ 相关距离广泛用于聚类,它在神经科学和生物信息学等领域有应用,在编程语言中也可以作为距离选项使用,例如在 MATLAB pdist 函数中。

² 在本文中,我总是通过相关性来表示皮尔逊相关性。

³ 相关距离也可以被视为随机变量等价类集合上的距离度量,当随机变量 X 和 Y 在 R ∈存在 a>0 和 b 时相互关联,使得 X=aY+b。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/7349.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一款好用的思维导图软件drawio

最近需要画思维导图&#xff0c;结果发现既然被人用来收费了。所以记录一下&#xff0c;免得大家上当。 首先说明&#xff0c;这个东东在github上是免费开源的&#xff0c;收费的是一些不法分子搞得。下面是收费版本得界面。 开源地址&#xff1a; https://github.com/jgraph…

JUC并发编程之CompletableFuture详解

目录 1.Future接口 1.1 Future介绍 1.1.1 FutureTask 1.1.2 代码示例 2. CompletableFuture 2.1 基本概念 2.2 代码示例 2.2.1 创建CompletableFuture 2.2.2 函数式接口&#xff08;补充&#xff09; 2.2.3 异步任务组合 1.Future接口 1.1 Future介绍 JUC并发编程中的…

二叉树题目:从根到叶的二进制数之和

文章目录 题目标题和出处难度题目描述要求示例数据范围 解法一思路和算法代码复杂度分析 解法二思路和算法代码复杂度分析 题目 标题和出处 标题&#xff1a;从根到叶的二进制数之和 出处&#xff1a;1022. 从根到叶的二进制数之和 难度 3 级 题目描述 要求 给你二叉树…

Git标签管理(对版本打标签,起别名)

tag 理解标签创建标签git tag [name]git show [tagname] 操作标签删除标签git tag -d < tagname > 推送某个标签到远程git push origin < tagname > 理解标签 标签 tag &#xff0c;可以简单的理解为是对某次 commit 的⼀个标识&#xff0c;相当于起了⼀个别名。 …

C# winform子窗口向父窗口传值

这里我使用一个简单的方法。只需要在父窗口定义一个静态变量就行。 父窗体为Form1,子窗体为Form2。 public static int get_num0; 子窗体直接给get_num赋值即可。 Form1.get_num2; 这样父窗体就能获得get_num修改后这个值了

游戏引擎UE如何革新影视行业?创意云全面支持UE云渲染

虚幻引擎UE&#xff08;Unreal Engine&#xff09;作为一款“殿堂级”的游戏引擎&#xff0c;占据了全球80%的商用游戏引擎市场&#xff0c;但如果仅仅将其当做游戏开发的工具&#xff0c;显然是低估了它的能力。比如迪士尼出品的电视剧《曼达洛人》、电影《狮子王》等等都使用…

Matlab 点云曲面特征提取

文章目录 一、简介二、实现代码2.1基于k个邻近点2.2基于邻近半径参考资料一、简介 这里基于每个点的邻域协方差来获取点云中具有的曲面几何特征的点,计算方式如下图所示: 二、实现代码 2.1基于k个邻近点 SurfaceVar.m %% *******</

【网络代理】(三)Docker+Haproxy 搭建四层代理

目录 1.1 创建 web 服务器镜像 1.2 启动 web 服务器容器 2.1 编写 haproxy 配置文件 2.2 拉取 haproxy 镜像 2.3 启动 haproxy 容器 3.1 访问 8000 端口 3.2 查看 web 服务器容器日志 附录&#xff1a;haproxy 仪表板 1.1 创建 web 服务器镜像 编写一个 Docke…

uniapp实战

上面是tab栏&#xff0c;下面是swiper&#xff0c;&#xff0c;tab和swiper和 红色滑块 动态变化&#xff0c;&#xff0c; 遇到的问题&#xff1a; 往下滚动 tab栏 吸顶&#xff1a; position:sticky; z-index:99; top:0;swiper切换触发 change 事件&#xff0c; :current …

Golang GORM 模型定义

模型定义 参考文档&#xff1a;https://gorm.io/zh_CN/docs/models.html 模型一般都是普通的 Golang 的结构体&#xff0c;Go的基本数据类型&#xff0c;或者指针。 模型是标准的struct,由Go的基本数据类型、实现了Scanner和Valuer接口的自定义类型及其指针或别名组成&#x…

Android TelephonyManager双卡获取数据开启状态异常的可能原因

背景 应用内不指定subId获取数据状态可能会错误&#xff0c;因为可能拿到voice的能力&#xff0c;而非data。 代码逻辑 1、通过TelephonyManager的isDataEnabled()没有指定subId时&#xff0c;调用内部方法isDataEnabledForReason&#xff0c;传入getId()参数以指定subid&am…

FUNBOX_SCRIPTKIDDIE靶机详解

FUNBOX_SCRIPTKIDDIE靶机复盘 这个靶场给了太多的干扰因素&#xff0c;当你打完后反过来再看是非常简单的一个靶场&#xff0c;但是你打的过程中却会觉得非常难&#xff0c;干扰因素实在天多了。 题目中给了说加一条hosts&#xff0c;实际没用上。 对IP进行一个单独扫描后发现…

机器学习深度学习——torch.nn模块

机器学习&&深度学习——torch.nn模块 卷积层池化层激活函数循环层全连接层 torch.nn模块包含着torch已经准备好的层&#xff0c;方便使用者调用构建网络。 卷积层 卷积就是输入和卷积核之间的内积运算&#xff0c;如下图&#xff1a; 容易发现&#xff0c;卷积神经网…

uniapp 微信小程序 placeholder字体、颜色自定义

效果图&#xff1a; 1、template <input type"text" placeholder"搜索标题" placeholder-class"placeholder-style"></input>2、style .placeholder-style{color: #2D94FF; }

微服务探索之路06篇k8s配置文件Yaml部署Redis使用Helm部署MongoDB和kafka

1 安装Redis 1.1创建配置文件redis.conf 切换到自己的目录下如本文是放在/home/ubuntu下 cd /home/ubuntuvim redis.conf bind 0.0.0.0 protected-mode yes port 6379 requirepass qwe123456 tcp-backlog 511 timeout 0 tcp-keepalive 300 daemonize no pidfile /var/run/r…

生产者消费者模型

生产者消费者模型 文章目录 生产者消费者模型概念原则优点 基于BlockingQueue的生产者消费者模型BlockingQueue模拟实现单生产者消费者模型基于计算任务和存储任务的生产者消费者模型 概念 生产者消费者模式就是通过一个容器来解决生产者和消费者的强耦合问题生产者和消费者彼…

代码随想录| 图论02●695岛屿最大面积 ●1020飞地的数量 ●130被围绕的区域 ●417太平洋大西洋水流问题

#695岛屿最大面积 模板题&#xff0c;很快.以下两种dfs&#xff0c;区别是看第一个点放不放到dfs函数中处理&#xff0c;那么初始化的area一个是1一个是0 int dir[4][2]{0,1,0,-1,1,0,-1,0};void dfs(int x, int y,int n, int m, int &area,vector<vector<bool>…

2023最新谷粒商城笔记之Sentinel概述篇(全文总共13万字,超详细)

Sentinel概述 服务流控、熔断和降级 什么是熔断 当扇出链路的某个微服务不可用或者响应时间太长时&#xff0c;会进行服务的降级&#xff0c;**进而熔断该节点微服务的调用&#xff0c;快速返回错误的响应信息。**检测到该节点微服务调用响应正常后恢复调用链路。A服务调用B服…

构建高效供应商管理体系,提升企业采购能力

随着企业采购规模的不断扩大和全球化竞争的加剧&#xff0c;供应商管理变得越来越重要。构建一个高效的供应商管理体系是企业提升采购能力、降低采购成本的关键一环。本文将重点探讨供应商管理体系的意义和作用&#xff0c;并介绍如何构建一个高效的供应商管理体系。 一、供应商…

SpringBoot复习:(1)常用的SpringApplication.run返回的容器的具体类型是哪个?

run方法中调用了createApplicationContext方法 createApplicationContext方法代码如下&#xff1a; 其中create代码如下&#xff1a; 可见返回的是AnnotationConfigServletWebServerApplicationContext()