MetaPoint_速读

Meta-Point Learning and Refining for Category-Agnostic Pose Estimation

https://arxiv.org/abs/2404.14808https://github.com/chenbys/metapoint

abstract

这篇文章介绍了一种名为Meta-Point Learning and Refining的框架,用于实现类别不可知的姿势估计。该框架利用所谓的元点(meta-points)来提高姿势估计的准确性。通过渐进式可变形点解码器和松弛回归损失,该方法优于现有方法。文章重点讨论了如何利用元点改进类别不可知的姿势估计,以及可学习嵌入在捕获关键信息用于关键点预测中的作用。此外,渐进式可变形点解码器如何有助于更好地进行预测和监督也是文章的重要内容。

contribution

本文的主要创新点包括:

  1. 首次提出了用于类别不可知姿势估计的元点学习方法,通过学习类别不可知的潜在关键点来改进姿势估计的准确性。
  2. 引入了渐进式可变形点解码器和松弛回归损失,以实现更好的预测和监督,从而超越了现有方法。
  3. 提出了一种新颖的框架,利用元点学习和细化的方法来改善类别不可知的姿势估计,揭示了关键点的内在性质并取得了优越的性能。

related work

本文的相关工作可以从类别特定姿势估计和类别无关姿势估计两个方面概括如下:

  1. 类别特定姿势估计:

    • 传统的姿势估计方法通常针对特定类别,如人类、动物和车辆等。
    • 方法包括基于回归、基于热图和基于查询的技术。
    • 以往研究主要集中在特定类别的姿势估计上,对于新类别的适应性较差。
  2. 类别无关姿势估计:

    • 针对类别无关的姿势估计,研究者开始探索使用少量支持图像来估计任意类别的关键点位置。
    • 元点学习方法是本文的创新之处,通过学习潜在的关键点来提高关键点预测的准确性。
    • 本文引入了渐进式可变形点解码器和松弛回归损失,以实现更好的预测和监督,取得了优于现有方法的性能。

meta-learning

本文的方法与元学习(meta-learning)之间存在一定的联系和区别:

  1. 元学习是一种机器学习范式,旨在通过从先前任务中学到的知识或经验,来加速学习新任务。通常涉及在训练阶段模拟快速学习过程,以便在测试阶段能够快速适应新任务。
  2. 本文提出的元点学习方法并非典型的元学习方法,而是针对类别不可知姿势估计问题提出的一种新颖框架。该方法通过学习潜在的关键点(元点)来提高关键点预测的准确性,从而改进类别不可知的姿势估计。
  3. 虽然本文的方法也涉及从支持图像中学习信息以改进关键点预测,但其重点在于利用元点学习和细化的方法来提高类别不可知姿势估计的性能,而非典型的元学习任务。

method

本文方法的步骤可以详细介绍如下:

  1. 元点学习

    • 提出了元点学习的概念,即学习类别不可知的潜在关键点(meta-points)来改进姿势估计的准确性。
    • 维护可学习的嵌入以捕获各种关键点的内在信息,这些嵌入与图像特征图相互作用,无需任何支持信息即可生成元点。
  2. 元点生成和细化

    • 在给定查询图像的情况下,元嵌入将通过变换器解码器与其特征图相互作用,挖掘内在信息,从而生成元点。
    • 利用二部匹配的分配方法,根据支持信息为期望的关键点分配最佳的元点。
    • 利用支持特征向量和挖掘的内在信息,通过另一个变换器解码器对分配的元点进行细化。
  3. 渐进式可变形点解码器

    • 提出了渐进式可变形点解码器,逐步挖掘细粒度特征,以在最后一个点作为参考的基础上解码点。
    • 该解码器利用变形注意力来提高关键点的预测精度。
  4. 松弛回归损失

    • 引入了松弛回归损失,以减少辅助解码器层的不成熟梯度,从而提高模型的训练效果。

experiments

本文的实验可以概括如下:

  1. 数据集和指标

    • 在 Multi-category Pose (MP-100) 数据集上进行实验评估,该数据集包含100个类别和8个超类别,是用于类别不可知姿势估计最大的基准数据集之一。
    • 数据集包含超过18,000张图像和20,000个注释,关键点数量在不同类别之间的范围为8到68个。
    • 将100个类别划分为非重叠的训练/验证/测试集,比例为70:10:20,使用五个随机划分以减少随机性的影响。
    • 使用概率正确关键点(PCK)作为定量指标,并报告了不同阈值下的PCK@0.2结果以及更全面的mPCK评估。
  2. 实验设置

    • 遵循先前工作的实验设置,包括1-shot和5-shot设置。
    • 在推理阶段,使用最后一个解码器层的结果作为估计关键点。
    • 对于N-shot设置,对不同拍摄的支持关键点特征进行平均处理,以获得更好的分配和信息增强。
  3. 实验结果

    • 在MP-100数据集上进行1-shot和5-shot设置的实验,总结了PCK@0.2结果,并在表格中报告了mPCK结果。
    • 实验结果展示了本文方法在类别不可知姿势估计任务上的性能优势,证明了元点学习方法的有效性和优越性。

通过这些实验,作者验证了他们提出的方法在类别不可知姿势估计任务中的有效性和性能优势。

metric

本文实验中使用了以下评价指标:

  1. 概率正确关键点(PCK)

    • PCK 是一种常用的姿势估计评价指标,用于衡量预测关键点与真实关键点之间的匹配准确度。
    • 在本文中,使用 PCK@0.2 表示在阈值为0.2时的概率正确关键点,即预测关键点与真实关键点之间的距离小于图像尺寸的20%。
  2. 平均概率正确关键点(mPCK)

    • mPCK 是对 PCK 指标的扩展,通过在不同阈值(如0.05、0.1、0.15、0.2)下计算 PCK 并取平均值,以更全面地评估关键点匹配的准确度。

这些评价指标帮助评估模型在类别不可知姿势估计任务中的性能表现,从而验证了元点学习方法的有效性和优越性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/868635.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小红的因式分解(牛客周赛50)

要将 ax2bxc分解为 (a1xb1)(a2xb2)的形式&#xff0c;输出a1,a2,b1,b2,否则输出NO (a1xb1)(a2xb2)a1a2x(a1b2a2b1)xb1b2,所以aa1a2,ba1b2a2b1,cb1b2 #include<bits/stdc.h> using namespace std; void sol(){ int a,b,c;cin>>a>>b>>c; for(in…

一文清晰了解HTML——简单实例

想要仿照该页面编写HTML代码&#xff1a; 在vscode中输入&#xff01;自动生成默认模板&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevic…

第二证券股市资讯:深夜!突然暴涨75%!

一则重磅收买引发医药圈轰动。 北京时间7月8日晚间&#xff0c;美股开盘后&#xff0c;美国生物制药公司Morphic股价一度暴升超75%。音讯面上&#xff0c;生物医药巨子礼来公司官宣&#xff0c;将以57美元/股的价格现金收买Morphic&#xff0c;较上星期五的收盘价溢价79%&…

19_谷歌GoogLeNet(InceptionV1)深度学习图像分类算法

1.1 简介 GoogLeNet&#xff08;有时也称为GoogleNet或Inception Net&#xff09;是一种深度学习架构&#xff0c;由Google的研究团队在2014年提出&#xff0c;主要设计者为Christian Szegedy等人。这个模型是在当年的ImageNet大规模视觉识别挑战赛&#xff08;ILSVRC&#xf…

什么是T0策略?有没有可以持仓自动做T的策略软件?

​​行情低迷&#xff0c;持仓被套&#xff0c;不想被动等待&#xff1f;长期持股&#xff0c;想要增厚持仓收益&#xff1f;有没有可以自动做T的工具或者策略&#xff1f;日内T0交易&#xff0c;做到降低持仓成本&#xff0c;优化收益预期。 什么是T0策略&#xff1f; 可以提…

韦东山嵌入式linux系列-LED驱动程序

之前学习STM32F103C8T6的时候&#xff0c;学习过对应GPIO的输出&#xff1a; 操作STM32的GPIO需要3个步骤&#xff1a; 使用RCC开启GPIO的时钟、使用GPIO_Init函数初始化GPIO、使用输入/输出函数控制GPIO口。 【STM32】GPIO输出-CSDN博客 这里再看看STM32MP157的GPIO引脚使用…

ruoyi实用性改造--(四)选择数据源及非标准使用数据库

一、实用型数据直接访问/** 使用Druid中 application-druid.yml 中定义的副数据源Connection con=null; //手工调用Druid的配置访问Connection con2=null;try {//DruidDataSource ds = SpringUtils.getBean("masterDataSource");DruidDataSource ds = Spring…

Scala 数据类型

Scala 数据类型 Scala 是一种多范式的编程语言&#xff0c;它结合了面向对象和函数式编程的特点。在 Scala 中&#xff0c;数据类型是构建复杂程序的基础。本文将详细介绍 Scala 中的数据类型&#xff0c;包括其分类、特点以及使用方法。 数据类型分类 Scala 中的数据类型可…

jmeter-beanshell学习5-beanshell加减乘除运算

我用到的场景是计算金额&#xff0c;所以主要以金额为主&#xff0c;感觉这部分有点麻烦&#xff0c;直接写遇到的几个坑&#xff0c;就不演示解决的过程了。 1.最早写了个两数相减&#xff0c;但是小数精度容易出现问题。比如1-0.010.989999997这种情况&#xff0c;随便写的几…

初学SpringMVC之执行原理

Spring MVC 是基于 Java 实现 MVC 的轻量级 Web 框架 导入 jar 包 pom.xml 文件导入依赖&#xff1a; <dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>4.13.2</version></dependency><dep…

YOLOv9:一个关注信息丢失问题的目标检测

本文来自公众号“AI大道理” 当前的深度学习方法关注的是如何设计最合适的目标函数&#xff0c;使模型的预测结果最接近地面的真实情况。同时&#xff0c;必须设计一个适当的体系结构&#xff0c;以方便获取足够的预测信息。 现有方法忽略了一个事实&#xff0c;即输入数据在逐…

部署windows-exporter

一、安装 windows-exporter源码 下载对应版本 在windows中使用二进制方式部署 安装好之后,打开 http://127.0.0.1:9182/metrics 二、接入prometheus 1、通过静态文件配置加入 scrape_configs:# The job name is added as a label `job=<job_name>` to any timeser…

Nginx 是一个非常流行的 Web 服务器和反向代理服务器

Nginx 是一个非常流行的 Web 服务器和反向代理服务器&#xff0c;以其高性能、稳定性、丰富的功能集和低资源消耗而闻名。下面是一个简化的 Nginx 使用教程&#xff0c;包括基本的安装、配置和一些常见用途。 安装 Nginx 在 Ubuntu/Debian 上安装&#xff1a; sudo apt upda…

Ubuntu的奇葩bug汇总

键盘的Win键失效、被锁的解决办法 ——我还以为我电脑坏了&#xff0c;重装呜呜呜

docker安装以及简单使用

如何安装安装 yum install -y yum-utils yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo # 列出可用的版本 yum list docker-ce.x86_64 --showduplicates | sort -r yum install -y docker-ce-23.0.6-1.el8 #开机自动启动 …

day02_员工管理

文章目录 新增员工需求分析和设计代码开发功能测试代码完善录入的用户名已存在&#xff0c;抛出异常后没有处理新增员工的时候&#xff0c;创建人id和修改人id设置为了固定值ThreadLocal&#xff08;面试题&#xff09; 分页查询问题解决 启用禁用员工账号需求和分析代码设计 编…

Vue3项目打包优化

前言 本文介绍在实际项目中进行打包优化过程 目前评分 good npm install web-vitals在App.vue加入如下代码测试网页性能指标 import { onLCP, onINP, onCLS, onFCP, onTTFP } from web-vitals/attributiononCLS(console.log) onINP(console.log) onLCP(console.log) onFCP(…

cfDNA甲基化疾病早筛研究思路分享

游离DNA&#xff08;Circulating free DNA&#xff0c;cfDNA&#xff09;是人体组织释放到血液等循环体系中降解的DNA片段&#xff0c;是一种新型的肿瘤分子标志物。ctDNA甲基化是重要的表观学修饰之一&#xff0c;可以在不改变基因序列的情况下&#xff0c;改变遗传表现&#…

Java中的数据备份与恢复策略

Java中的数据备份与恢复策略 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 数据备份与恢复是任何系统中至关重要的一部分。在软件开发和运维过程中&#xff…

身边的故事(十五):阿文的故事:再消失

物镜人非&#xff0c;沧海桑田。像我们这些普通的凡人&#xff0c;哪有什么试错的机会&#xff0c;每走一步都是如履薄冰&#xff0c;小心谨慎&#xff0c;错一步可能就会万劫不复。唉&#xff0c;如果...唉...哪有什么如果... 阿文的房子很快装修完成&#xff0c;入新房那天就…