ACM MM 2023 | 基于去中心化表征的人体姿态估计方法

01. 前言

北京邮电大学与EVOL创新团队共同提出人体姿态估计方法DecenterNet,用于在提高在拥挤场景下人体姿态估计的准确度。该方法引入了一种去中心化的姿势表征方法,使得网络在纠缠区域/拥挤区域中将更加稳健地表达人体姿态。该方法还提出了一个解耦的姿势评估机制,以自适应地在多个姿态表征中选择最佳姿势。该论文DecenterNet: Bottom-Up Human Pose Estimation Via Decentralized Pose Representation已被ACM MM 2023接收。

02. 背景与动机

在拥挤的场景中进行多人体姿态估计仍然是一个极具挑战性的任务。我们发现目前的人体姿态估计方法在拥挤的场景中的失败大部分来自于无法定位或分组可见的关键点,而不是推理不可见的关键点,如表一。

因此,本文将拥挤的场景分为纠缠和遮挡两种情况,并观察到在拥挤的场景中,纠缠是一个重要的问题。基于这一观察,我们提出了DecenterNet,这是一种端到端的人体姿态估计方法,可以稳健、高效地进行拥挤场景中的姿态估计。

在DecenterNet中,我们引入了一种去中心化的姿势表征方法,该方法以所有可见关键点作为表征点来代表人体姿势,使得网络在纠缠区域/拥挤区域中将更加稳健地表达人体姿态。为了解决上述姿势表征引入过多的False Positive问题,我们还提出了一个解耦的姿势评估机制,该机制引入了location map,以自适应地在多个姿态表征中选择最佳姿势。此外,我们还构建了一个名为SkatingPose的新数据集,其中包含了更多带有纠缠的花滑场景。

03. 方法

3.1 去中心化的姿态表征(Decentralized Pose Representation)

传统的工作采用姿态的中心点、姿态的盆骨点或者人体部位的中心点来表征姿态,之后汇总这些表征点的输出,再经过NMS算法得到人体姿态。然而,当在拥挤的场景中人体姿态发生纠缠时,它们的表征点可能会相互遮挡,从而使得此点代表的姿态发生错误。因此,我们提出了去中心姿势表征(Decentralized Pose Representation)以缓解拥挤场景中的纠缠问题。具体来说,此表征以姿态所有可见关键点作为表征点,并缩小表征点范围来减小相互遮挡的可能性。一方面,姿态的可见点很难被完全遮挡,比中心点更具辨别性。另一方面,融合来自更多不同位置的表征点的预测会产生更全面、更稳健的预测。

3.2 解耦的姿势评估机制(Decoupled Pose Assessment)

可以预见的是,由于使用了过多的表征点,上述的姿势表征将引入大量的False Positive问题,因此我们提出了解耦的姿势评估机制,将传统的heatmap的选表征点和评估姿态的两个功能解耦给了heatmap和location map,如下图所示。

在此姿态评估机制中,location map的作用尤为关键。它一方面被用于从offset map中选取表征点,另一方面可以进一步增强heatmap的评分功能。具体来讲,location map是由4x4的全1正方形区域监督,并与offset map的loss相乘来动态地表征offset map上姿态的置信度。传统的表征点heatmap的极大值点并不能代表此表征点的姿态质量最好,而location map可以自适应地选择置信度高的姿态表征点,从而得到更优解。

04. 实验结果

我们在COCO,CrowdPose,SkatingPose三个数据集中进行了实验。相比于其他自底向上的人体姿态估计方法,DecenterNet以较低的参数量和计算量实现了SOTA结果。其中,CrowdPose数据集没有区分可见点与不可见点,我们使用人体实例方法Mask2Former来进行区分。

05. 总结

DecenterNet是一种用于拥挤场景中人体姿态估计的端到端方法。该方法采用去中心化的人体姿态表征,以所有可见的关键点作为表征点来表征人体姿势,从而在纠缠区域中得到更好的结果。此外,DecenterNet还采用了解耦的姿态评估机制,通过location map自适应地选择最优姿态。我们还构建了一个名为SkatingPose的新数据集,其中包含了更多带有纠缠的花滑场景。

EVOL创新团队成员介绍
EVOL联合创新团队负责人:
赵健(军事科学院),博士、北京图象图形学学会理事,入选北京市科协/中国科协“青年人才托举工程”,曾获吴文俊自然科学奖一等奖,研究方向为无约束视觉感知理解。
个人主页:
https://zhaoj9014.github.io/
金磊(北京邮电大学),博士、北京邮电大学特聘副研究员,研究方向包括人体姿态估计、人体解析、人体行为识别等。
个人主页:
ACM MM 2023 | 基于去中心化表征的人体姿态估计方法

  关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/90306.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用ElementUI完成登入注册的跨域请求提高开发效率

🎬 艳艳耶✌️:个人主页 🔥 个人专栏 :《Spring与Mybatis集成整合》​​​​​​​ ⛺️ 生活的理想,为了不断更新自己 ! 目录 ​编辑 1、前言 1.1.什么是ELementUI 2、完成登陆注册前端页面 2.1环境搭建 运行…

跨境电商如何利用海外代理IP,提高竞争力?

随着经济全球化的深度发展,跨境电商已经成为外贸发展的主要赛道,跨境电商王者般的新业态,近年来,我国跨境电商发展得到政府的大力扶持。而代理IP也逐渐成为助力跨境业务的强大工具之一。可以为我们跨境电商种出现的如地域限制、安…

CentOS 7系统安装与配置、常用100条操作命令

CentOS 7 是一个广泛使用的开源 Linux 操作系统,它是 Red Hat Enterprise Linux (RHEL) 的一个免费重建版本,以稳定性和安全性而著称。在 CentOS 7 上安装虚拟机通常使用虚拟化技术,如 VirtualBox 或 VMware 等。以下是 CentOS 7 的简要介绍以…

Zilliz@阿里云:大模型时代下Milvus Cloud向量数据库处理非结构化数据的最佳实践

大模型时代下的数据存储与分析该如何处理?有没有已经落地的应用实践? 为探讨这些问题,近日,阿里云联合 Zilliz 和 Doris 举办了一场以《大模型时代下的数据存储与分析》为主题的技术沙龙,其中,阿里云对象存储 OSS 上拥有海量的非结构化数据,Milvus(Zilliz)作为全球最有…

C语言-控制语句

C语言中有三大结构,分别是顺序结构、选择结构和循环结构(分支结构)。 一、C 判断语句 判断结构要求程序员指定一个或多个要评估或测试的条件,以及条件为真时要执行的语句(必需的)和条件为假时要执行的语句…

解决使用flex布局引起的变形问题

只需在变形的样式中加以下代码,禁止拉伸就ok了 flex-shrink: 0;

ipaguard界面概览

ipaguard界面概览 ipaguard界面分左右2块:左边菜单导航栏,右边的功能区 左侧菜单:按模块分成启动界面,代码模块,文件模块,重签名与测试模块 右侧主功能区会随着功能变化,但是整体分3块&#xf…

此芯科技加入百度飞桨硬件生态共创计划,加速端侧AI生态布局

近日,此芯科技(上海)有限公司(以下简称“此芯科技”)与百度签署硬件生态共创计划合作协议,正式加入由百度发起的硬件生态共创计划。双方将共同推动端侧AI和大模型在个人计算、车载计算以及元宇宙计算等领域…

BiMPM实战文本匹配【下】

引言 这是BiMPM实战文本匹配的第二篇文章。 注意力匹配 如上图所示,首先计算每个正向(或反向)上下文嵌入 h i p → \overset{\rightarrow}{\pmb h_i^p} hip​→​(或 h i p ← \overset{\leftarrow}{\pmb h_i^p} hip​←​)与另一句的每个正向(或反向)上下文嵌入 …

计算机图像处理-直方图均衡化

直方图均衡化 直方图均衡化是图像灰度变换中有一个非常有用的方法。图像的直方图是对图像对比度效果上的一种处理,旨在使得图像整体效果均匀,黑与白之间的各个像素级之间的点分布更均匀一点。通过这种方法,亮度可以更好地在直方图上分布。 …

2009-2018年31省份旅游收入(入境、国内、总收入;第三产值;GDP)

2009-2018年31省份旅游收入(入境、国内、总收入;第三产值;GDP) 1、时间:2009-2018年 2、指标: 汇率、入境旅游收入(万美元)、国内旅游收入(亿元&#xff0…

中秋节快乐

中秋节快乐,国庆节快乐

架构案例2022(四十二)

促销管理系统 某电子商务公司拟升级其会员与促销管理系统,向用户提供个性化服务,提高用户的粘性。在项目立项之初,公司领导层一致认为本次升级的主要目标是提升会员管理方式的灵活性,由于当前用户规模不大,业务也相对…

专栏更新情况:华为流程、产品经理、战略管理、IPD

目录 前言 01 华为流程体系入门课 CSDN学院 02 产品经理进阶课 CSDN学院 03 BLM 战略方法论进阶课 04 IPD 进阶 100 例专栏 作者简介 前言 已上线四大课程专栏更新情况: 01 华为流程体系入门课(视频图文); 02 硬件产品经…

安防监控产品经营商城小程序的作用是什么

安防监控产品覆盖面较大,监控器、门禁、对讲机、烟感等都有很高用途,家庭、办公单位各场景往往用量不少,对商家来说,市场高需求背景下也带来了众多生意,但线下门店的局限性,导致商家想要进一步增长不容易。…

C++之容器类有趣的实验(二百四十一)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…

无线WIFI工业路由器可用于楼宇自动化

钡铼4G工业路由器支持BACnet MS/TP协议。BACnet MS/TP协议是一种用于工业自动化的开放式通信协议,被广泛应用于楼宇自动化、照明控制、能源管理等领域。通过钡铼4G工业路由器的支持,可以使设备间实现高速、可靠的数据传输,提高自动化水平。 钡…

Kubernetes(k8s)上搭建一主两从的mysql8集群

Kubernetes上搭建一主两从的mysql8集群 环境准备搭建nfs服务器安装NFS暴露nfs目录开启nfs服务器 安装MySQL集群创建命名空间创建MySQL密码的Secret安装MySQL主节点创建pv和pvc主节点的配置文件部署mysql主节点 安装第一个MySQL Slave节点创建pv和pvc第一个从节点配置文件部署my…

聚观早报 | 飞书签约韵达速递;蔚来首颗自研芯片“杨戬”量产

【聚观365】9月22日消息 飞书签约韵达速递 蔚来首颗自研芯片“杨戬”10月量产 靳玉志接任华为车 BU CEO 亚马逊发布全新Alexa语音助手 OpenAI推出图像生成器DALL-E 3 飞书签约韵达速递 近日,国内物流服务公司韵达快递宣布全员上飞书。飞书解决方案副总裁何斌表…

Redis学习第九天

今天是Jedis!作者的Redis在游戏本上,但是Java的IDEA总是下载不了,所以只能作为概念听一听了,目前无法做到实操。 Jedis概念 Jedis实操 首先要保证redis的服务器开启,然后引入jedis依赖,最后通过服务器的I…