Multidimensional Scaling(MDS多维缩放)算法及其应用

在这篇博客中,我将与大家分享在流形分析领域的一个非常重要的方法,即多维缩放MDS。整体来说,该方法提供了一种将内蕴距离映射到显性欧氏空间的计算,为非刚性形状分析提供了一种解决方案。当初就是因为读了Bronstein的相关工作【1】,才下定决心在人脸数据分析中使用内蕴度量来建立特征分析方法,可以说MDS对我的学术之路起到了很大的影响作用。


1. 前言

在非刚性形状匹配中,我们希望找到两个曲面的对应关系。由于受到非刚性形变影响,使得我们不能直接建立基于类似ICP一样的方法来实现对准。提到非刚性分析,很自然的就会让人联想到使用基于曲面第一基本形式的内蕴几何特征来建立分析方法。对于人脸人体这种非刚性形变分析对象,由于受到骨架的约束,使得其非刚性形变满足近似等距的特性,这里的等距指测地线。曲面第一基本形式对应曲面曲线,刚好可以使用测地线作为表示。那么,我们只要基于测地线来建立几何特征表达,就能够实现近似等距条件下的形状分析,进而满足非刚性形状分析要求。

关于测地线的计算,我在之前的博客已经有所介绍,有兴趣的同学可以翻看:

Fast Marching算法及其在点云测地线计算中的应用-CSDN博客

Geodesic in Heat: 一种测地线计算方法-CSDN博客

在有了测地线作为内蕴几何特征的显性表示后,我们希望对原始曲面建立一种形状度量,这种度量由测地线定义,能够反映形状之间的相似程度,进而推出点的对应关系。一个最直接的想法是利用参数化的方法。通过参数化,我们能够对原始的曲面进行“摊平”,进而在摊平后的参数域建立对应。然而,参数化需要指定边界和控制点,其本身的计算也相对复杂。如果对于拓扑相对复杂的形状建立参数化,其对原始测地线距离将会产生严重扭曲,即不再是可控的近似等距变换。我们希望使用类似ICP那样的直接距离对应方法,对基于测地线表示的曲面进行匹配。一个理想的方案是将点对间的测地距离,变换到一个m维的欧氏空间。在该欧氏空间中,点与点的欧氏距离与未变换前的点对测地距离存在一种对应关系。这样,我们只需要在变换后的形状进行刚性配准,点对的结果就对应了原始数据的非刚性对应结果。这就是使用MDS方法实现非刚性形状分析的初始想法。


2. MDS介绍

如前所述,MDS的目的就是将点间的测地距离嵌入到一个新的欧氏空间中,使得内蕴距离获得显性化的表达。在相关工作【2】中,这种嵌入后的曲面表达被称为bending-invariant canonical forms。具体过程如下:

首先我们给出一个测地线的表示δij,表示两点pi和pj的测地距离。我们把所有点的行列组成矩阵形式,使用δij填满,ij相等为0。然后,我们对δij求平方,重写矩阵里的项:

Δ所表达的矩阵在等距变换下是不变的,但是其形式会因为点序号的变化而变化。我们希望获得一个测地距离不变的表示,且具有唯一性。这时,就可以利用MDS将其嵌入到一个低维的欧氏空间中,该过程等价于:

嵌入误差可以写为:

MDS方法也包含很多类别,Bronstein在论文【3】中提到一种称为classical scaling【4】的方法来实现MDS:

首先对Δ进行中心化操作,即double-centering。J=I-1/2U,I是单位矩阵,U是一个完全由1组成的矩阵。之后对B进行主成分分析,获得对应的m个特征值和特征向量:

i对应点的序号,j对应m的维度,一般m取3,即将原始形状基于测地距离映射会三维欧氏空间。这样经过特征向量e表达的新坐标x在欧氏空间组成一个新的形状,在工作【1】中被称为Canonical form,以我的观点来看,即内蕴型。


3. 应用

Bronstein在最开始设计算法的时候,目标就是解决三维人脸识别中的表情鲁棒问题。他在论文中已经提到了一般性非刚性形状分析可以转换为对内蕴距离向欧氏空间的嵌入,如下图:

上面的例子充分说明将测地线嵌入回欧氏空间,对应的形状所具备的近似等距特性。原来手指的欧氏距离,一定会因为非刚性形变发生变化,但是对应的测地距离是稳定的。将测地距离嵌入回欧氏空间,得到右边的Canonical form,其点的欧氏距离就具备了原来点的测地距离特性。这时我们再使用类似ICP的方法,就能够非常方便的建立对应关系。

表情即被认为是一种近似等距的非刚性形变,如果我们对人脸数据进行类似Canonical form的变换,那么变换的结果自然会获得对表情不变的结果。原论文中给出了示意图:

可以看到第一行的人脸是具有多种不同的表情的。但是这些人脸的Canonical form具有极其相近的几何表示。在Canonical form的基础上,设计三维人脸识别算法,自然能获得表情鲁棒特性。论文中还给了一个系统界面:

整个算法流程还是非常清晰的。但是求Δ需要的庞大计算量,限制了该算法的效率。

Reference

[1] Bronstein AM, Bronstein MM, Kimmel R. Three-dimensional face recognition[J]. International Journal of Computer Vision, 2005, 64: 5-30.

[2] Elad A, Kimmel R. Bending Invariant Representations for Surfaces[C]. Proceedings of the Conference on Computer Vision and Pattern Recognition, 2001, 2: 168-168.

[3] Bronstein AM, Bronstein MM, Kimmel R. Expression-invariant 3D face recognition[C]. International conference on Audio-and video-based biometric person authentication, 2003: 62-70.

[4] Young G, Householder A S. Discussion of a set of points in terms of their mutual distances[J]. Psychometrika, 1938, 3(1): 19-22.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/202164.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智能优化算法应用:基于鼠群算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于鼠群算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于鼠群算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.鼠群算法4.实验参数设定5.算法结果6.参考文献7.MATLAB…

6页手写笔记总结信号与系统常考知识大题知识点

题型一 判断系统特性题型二 求系统卷积题型三 求三大变换正反变换题型四 求全响应题型五 已知微分方程求系统传递函数题型六 已知系统的传递函数求微分方程题型七 画出系统的零极点图,并判断系统的因果性和稳定性 (笔记适合快速复习,可能会有…

2023 年最新 FPV 套件评测

FPV 飞行是近年来非常流行的一种新兴运动。它可以让您在第一人称视角下体验飞行的乐趣。FPV 套件可以分为多种类型,根据您的需求和预算,您可以选择合适的套件。 下面我们将对 2023 年最新的几款 FPV 套件进行评测,帮助您选择合适的产品。 Sp…

InST论文复现

论文地址:https://arxiv.org/abs/2211.13203 论文git:https://github.com/zyxElsa/InST 遇到的问题: 1.requests.exceptions.SSLError: HTTPSConnectionPool(hosthuggingface.co, port443): Max retries exceeded with url: /openai/clip-…

一个容器中填值,值太多不换行,而是调小字体大小和行高

<!-- clampLineHeight 重计算行高 --> <!-- clampTextSize 重计算字体大小 --> <!-- 这里的div高8mm, 宽6cm, 文本为text --> <div style"height:8mm;width:6cm;text-align:left"><span :style"{ fontSize: clampTextSize(text, 6cm…

用python测试网络上可达的网络设备

用python测试网络上可达的网络设备 之前使用的os在python中执行ping测试网络中可达的目标&#xff0c;但是他在执行ping命令时脚本会将系统执行ping时的回显内容显示出来&#xff0c;有时这些回显并不是必要的。如果用脚本一次性ping成百上千台网络设备或者URL时会影响美观和阅…

MySQL中的索引①——索引介绍、结构、分类、语法、SQL性能分析

目录 目录 索引概述--> 介绍---> 优缺点---> 索引结构--> ​编辑 存储引擎支持情况---> BTree---> BTree---> Hash---> Hash特点---> 思考题 索引分类--> InnoDB存储引擎中---> 聚集索引---> 二级索引---> 执行过程--…

SpringBootAdmin

SpringBootAdmin 文章目录 SpringBootAdmin创建SpringBootAdmin服务端创建SpringBootAdmin客户端启动应用 总结 github地址 https://github.com/codecentric/spring-boot-admin 可以查到所有的版本号 创建SpringBootAdmin服务端 创建springBoot项目的时候&#xff0c;在ops选项…

外贸平台获客技巧分享!(个人经历)

作为一名从事外贸行业多年的专业人士&#xff0c;我深知在竞争激烈的市场中获取客户的重要性&#xff0c;今天&#xff0c;我想与大家分享一些我在外贸平台上获客的技巧和经验&#xff0c;希望能够帮助到需要的人。 首先&#xff0c;我们需要明确一点&#xff0c;外贸平台是一…

机器学习-特征选择:如何用信息增益提升模型性能?

一、引言 在机器学习领域&#xff0c;模型的性能是衡量其成功与否的核心指标。一个高性能的模型可以准确地预测或分类未见过的数据&#xff0c;这对于各种应用场景如金融风险评估、医疗诊断和自然语言处理等都至关重要。为了构建这样的模型&#xff0c;特征选择成为了一个不可忽…

一键抠图|3个智能AI抠图软件实现抠图自由!

听说你对如何利用AI抠图技术去除白色背景感兴趣&#xff1f;设想一下&#xff0c;你有一张某人站在白色背景前的照片&#xff0c;而你只希望能留下这个人物。在过去&#xff0c;你可能需要花费大量时间和精力手动进行抠图。但现在&#xff0c;AI技术来拯救你了&#xff01;AI可…

利用COT思维链技术和Prompt提示语工程与微调后的大模型集成方式

COT思维链技术和Prompt提示语工程是通过对模型的输入进行设计和优化&#xff0c;以引导模型生成期望的输出。 COT思维链技术&#xff0c;是一种通过梳理和串联关键信息&#xff0c;形成逻辑严谨、条理清晰的思维链。在使用大型语言模型时&#xff0c;我们可以将这种思维链的关…

2024年MCM/ICM美国大学生数学建模竞赛备战指南

01 2024美赛基本要求 1.关于时间&#xff08;北京时间&#xff09; 比赛开始时间&#xff1a; 2024年2月2日6:00至 2024年2月6日9:00 提交截止时间&#xff1a;2024年2月6日10:00 结果发布时间&#xff1a;结果将于2024年5月31日或之前发布 2.关于规则 完整的解决方案现…

WordPress插件无法安装一直失败的原因和解决办法

WordPress建站程序之所以如此受欢迎&#xff0c;最大的原因可能就是拥有丰富多样的插件&#xff0c;可以实现任何想要的功能&#xff0c; 如联系表单、社交媒体分享按钮、搜索引擎优化、自动备份数据库、自动发布文章到社交媒体平台等&#xff0c;但是我们 在安装WordPress插件…

Redis应用-缓存

目录 什么是缓存 使用redis作为缓存 缓存的更新策略 通用的淘汰策略 redis内置的淘汰策略 缓存预热 缓存穿透 缓存雪崩 缓存击穿 什么是缓存 缓存(cache)是计算机中一个经典的概念,在很多的场景中都会涉及到. 核心思路就是把一些常用的数据放到触手可及(访问速度更快…

使用正确的js编写的正则表达式,但是无法匹配

其实只是自己感觉表达式正确而已&#xff0c;其实是错误的。 先直接说答案&#xff0c;.语法无法匹配\n&#xff08;点语法无法匹配\n&#xff09;&#xff0c;不知道大家有没有恍然大悟。 这里举例子介绍一下&#xff1a; 我现在有一个字符串&#xff0c;例如12!!333!!&…

用OpenCV与MFC写一个图像格式转换及简单处理程序

打开不同格式的图形文件&#xff0c;彩色装灰度图像、锐化、高斯滤波、边界检测及将其存储为需求格式是图像处理的最基本的操作。如果单纯用MFC编程&#xff0c;是一个令人头痛的事情&#xff0c;有不少的代码量。可用OpenCV与MFC编程就变得相对简单。下面来详细演示这一编程操…

敏捷:应对软件定义汽车时代的开发模式变革

随着软件定义汽车典型应用场景的落地&#xff0c;汽车从交通工具转向智能移动终端的趋势愈发明显。几十年前&#xff0c;一台好车的定义主要取决于高性能的底盘操稳与动力系统&#xff1b;几年前&#xff0c;一台好车的定义主要取决于智能化系统与智能交互能否满足终端用户的用…

五肽-13|提亮肤色,美白肌肤

五肽-13 INCI名称&#xff1a;五肽-13 说明&#xff1a; 五肽-13是一种合成肽&#xff0c;由丙氨酸、精氨酸、赖氨酸、脯氨酸和缬氨酸组成 功能&#xff1a; 五肽-13起到增白剂的作用 应用程序&#xff1a; 提亮和美白

MySQL四 | 约束

目录 约束的种类 添加外键约束 在创建表时添加外键 创建表之后添加外键 更新/删除外键约束的规则 删除外键 更新指令 约束是作用于表中字段上的规则&#xff0c;用于限制存储在表中的数据&#xff0c;可以保证数据库中数据的正确&#xff0c;有效性和完整性。 约束的种…