【AI视野·今日Robot 机器人论文速览 第七十二期】Mon, 8 Jan 2024

AI视野·今日CS.Robotics 机器人学论文速览
Mon, 8 Jan 2024
Totally 13 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

Deep Reinforcement Learning for Local Path Following of an Autonomous Formula SAE Vehicle
Authors Harvey Merton, Thomas Delamore, Karl Stol, Henry Williams
随着世界各地汽车工程师方程式协会 F SAE 竞赛不断引入无人驾驶赛事,各团队正在研究自动驾驶车辆堆栈的各个方面。本文介绍了使用深度强化学习 DRL 和逆强化学习 IRL 将局部观察到的锥体位置映射到赛道跟踪所需的转向角度。之前未在这种情况下测试过的两种最先进的算法软演员评论家 SAC 和对抗性逆强化学习 AIRL 用于在代表性模拟中训练模型。还讨论了 RL 算法在自动驾驶赛车环境中使用的三种新颖的奖励函数。在模拟和现实世界中进行的测试表明,这两种算法都可以成功训练局部路径跟踪模型。

iPolicy: Incremental Policy Algorithms for Feedback Motion Planning
Authors Guoxiang Zhao, Devesh K. Jha, Yebin Wang, Minghui Zhu
本文提出了基于策略的机器人系统运动规划。运动规划文献主要关注开环轨迹规划,然后进行在线跟踪。相比之下,我们通过解决相关的反馈控制问题来同时解决路径规划和控制器综合问题。我们提出了一种用于运动规划的新型增量策略 iPolicy 算法,该算法集成了基于采样的方法和定值最优控制方法来计算机器人系统的反馈控制器。特别是,我们使用采样来增量构建系统的状态空间。在采样的状态空间上执行异步值迭代以合成增量策略反馈控制器。我们展示了估计对连续状态空间中的最优值函数的收敛。

Omnidirectional Multi-Rotor Aerial Vehicle Pose Optimization: A Novel Approach to Physical Layer Security
Authors Daniel Bonilla Licea, Giuseppe Silano, Mounir Ghogho, Martin Saska
将多旋翼飞行器 MRAV 集成到 5G 和 6G 网络中可增强覆盖范围、连接性和拥塞管理。这促进了通信感知机器人技术的发展,探索机器人技术和通信之间的相互作用,但也使 MRAV 容易受到干扰等恶意攻击。应对这些攻击的一种传统方法是在 MRAV 上使用波束成形来应用物理层安全技术。在本文中,我们探索姿态优化作为对抗 MRAV 干扰攻击的替代方法。该技术适用于全向 MRAV,这种无人机能够独立控制其位置和方向,而不是更常见的欠驱动 MRAV,后者的方向无法独立于其位置进行控制。在本文中,我们考虑全向 MRAV 作为合法地面节点的基站 BS,受到恶意干扰机的攻击。

Integrating Flow Theory and Adaptive Robot Roles: A Conceptual Model of Dynamic Robot Role Adaptation for the Enhanced Flow Experience in Long-term Multi-person Human-Robot Interactions
Authors Huili Chen, Sharifa Alghowinem, Cynthia Breazeal, Hae Won Park
在本文中,我们介绍了一种机器人在与人类长期互动中的行为适应的新颖概念模型,将动态机器人角色适应与心理学的心流体验原理相结合。这种概念化引入了基于流程体验的分层交互目标,作为机器人的总体适应目标。该目标将认知和情感子目标交织在一起,并纳入个人和群体层面的人为因素。动态角色适应方法是我们模型的基石,强调机器人能够流畅地适应从领导者到追随者的支持角色,目的是保持活动挑战和用户技能之间的平衡,从而促进用户的最佳流程体验。此外,这项工作深入探讨了我们提出的概念化的局限性和潜在应用。我们的模型特别强调多人 HRI 范式,这是 HRI 的一个维度,目前正在探索中且具有挑战性。

Comparative Evaluation of RGB-D SLAM Methods for Humanoid Robot Localization and Mapping
Authors Amirhosein Vedadi, Aghil Yousefi Koma, Parsa Yazdankhah, Amin Mozayyan
在本文中,我们对用于 SURENA V 人形机器人定位和建图的三种 RGB D SLAM 同时定位和建图算法 RTAB Map、ORB SLAM3 和 OpenVSLAM 进行了比较评估。我们的测试要求机器人遵循完整的圆形模式,并在其头部安装英特尔实感 D435 RGB D 摄像头。在评估定位精度时,ORB SLAM3 的 ATE 为 0.1073,优于其他方案,其次是 RTAB Map(0.1641)和 OpenVSLAM(0.1847)。但值得注意的是,当机器人遇到特征点有限的墙壁时,ORB SLAM3和OpenVSLAM都面临着保持精确里程计的挑战。尽管如此,OpenVSLAM 展示了检测闭环的能力,并在机器人接近其初始位置时成功在地图内重新定位自身。调查还扩展到了地图绘制功能,RTAB Map 凭借提供多样化的地图输出(包括密集地图、OctoMap 和占用网格地图)而表现出色。

Object-Centric Instruction Augmentation for Robotic Manipulation
Authors Junjie Wen, Yichen Zhu, Minjie Zhu, Jinming Li, Zhiyuan Xu, Zhengping Che, Chaomin Shen, Yaxin Peng, Dong Liu, Feifei Feng, Jian Tang
人类通过识别观察中物体的身份和位置来解释场景。对于执行诸如引用拾取和放置之类的任务的机器人来说,了解对象是什么以及它们所在的位置至关重要。虽然前者在使用大型语言模型来丰富文本描述的文献中得到了广泛的讨论,但后者仍然未被充分探索。在这项工作中,我们引入了 textit 以对象为中心的指令增强 OCI 框架,以通过位置提示增强高度语义和信息密集的语言指令。我们利用多模态大语言模型 MLLM 将对象位置知识融入自然语言指令中,从而帮助策略网络掌握多功能操作的操作。此外,我们提出了一种特征重用机制,将现成的预训练 MLLM 中的视觉语言特征集成到策略网络中。

Kinematic Base State Estimation for Humanoid using Invariant Extended Kalman Filter
Authors Amirhosein Vedadi, Aghil Yousefi Koma, Masoud Shariat Panahi, Mahdi Nozari
本文介绍了右不变扩展卡尔曼滤波器 RIEKF 的设计和实现,用于估计 Surena V 人形机器人运动学基础的状态。机器人的状态表示在李群 SE 4 3 上定义,包括底座的位置、速度和方向,以及左脚和右脚的位置。

Design Optimization of Wire Arrangement with Variable Relay Points in Numerical Simulation for Tendon-driven Robots
Authors Kento Kawaharazuka, Shunnosuke Yoshimura, Temma Suzuki, Kei Okada, Masayuki Inaba
腱驱动机器人最重要的特征之一是电线布置的简便性及其提供的自由度,使得能够通过修改电线布置来构造满足所需特性的身体。已经提出了各种电线布置优化方法,但它们通过假设电线到接头的力臂是恒定的,或者通过忽略跨越多个接头并包括中继点的电线布置来简化配置。在本研究中,我们制定了更灵活的电线布置优化问题,其中每条电线由一个起点、多个中继点和一个终点表示,并基于黑盒优化实现了所需的物理性能。

VoroNav: Voronoi-based Zero-shot Object Navigation with Large Language Model
Authors Pengying Wu, Yao Mu, Bingxian Wu, Yi Hou, Ji Ma, Shanghang Zhang, Chang Liu
在家用机器人领域,零射击对象导航 ZSON 任务使代理能够熟练地穿越不熟悉的环境并从新类别中定位对象,而无需事先进行明确的训练。本文介绍了 VoroNav,这是一种新颖的语义探索框架,它提出了简化的 Voronoi 图,从实时构建的语义图中提取探索路径和规划节点。通过利用拓扑和语义信息,VoroNav 设计了基于文本的路径和图像描述,这些描述很容易被大型语言模型 LLM 解释。我们的方法提出了路径和远视描述的协同作用来表示环境背景,使法学硕士能够应用常识推理来确定导航的最佳路径点。对 HM3D 和 HSSD 数据集的广泛评估证实,VoroNav 在成功率和勘探效率方面都超过了现有的 ZSON 基准,HM3D 上为 2.8 成功,SPL 为 3.7,HSSD 上为 2.6 成功,SPL 为 3.8。

Robot Vulnerability and the Elicitation of User Empathy
Authors Morten Roed Frederiksen, Katrin Fischer, Maja Matari
本文描述了 Amazon Mechanical Turk 的一项受试者间研究 n 220,该研究调查了机器人的情感叙事如何影响其引发人类观察者同理心的能力。我们首先进行了一项试点研究,以开发和验证机器人的情感叙事。然后,在完整的研究中,机器人使用了三种不同的情感叙事策略之一:有趣、悲伤、中性,同时在交互过程中其购物任务的功能变得越来越少。随着机器人功能的退化,参与者被反复询问是否愿意帮助机器人。结果表明,传达悲伤的故事会显着影响参与者在整个互动过程中帮助机器人的意愿,并决定参与者在整个互动过程中是否对机器人产生同理心。此外,更多的过去使用机器人的经验也增加了参与者帮助机器人的意愿。

Autonomous Multi-Rotor UAVs: A Holistic Approach to Design, Optimization, and Fabrication
Authors Aniruth A, Chirag Satpathy, Jothika K, Nitteesh M, Gokulraj M, Venkatram K, Harshith G, Shristi S, Anushka Vani, Jonathan Spurgeon
无人机已成为军事、农业、监视和物流领域的关键,彻底改变了数据收集和环境交互。随着无人机技术的进步,迫切需要开发一种用于设计无人机的整体方法。这项研究的重点是建立一个程序,包括概念设计、复合材料的使用、重量优化、稳定性分析、航空电子集成、先进制造,以及通过为满足特定应用而定制的目标检测模型结合自主有效载​​荷交付,同时保持成本效率。该研究对潜在的复合材料和各种四轴飞行器框架配置进行了比较评估。新颖的功能包括有效载荷下降机构、一体式臂固定装置以及碳纤维轻木复合材料的使用。使用所提出的方法设计和分析四轴飞行器,然后使用增材制造和真空袋技术进行制造。

Robot-Assisted Deep Venous Thrombosis Ultrasound Examination using Virtual Fixture
Authors Dianye Huang, Chenguang Yang, Mingchuan Zhou, Angelos Karlas, Nassir Navab, Zhongliang Jiang
深静脉血栓形成(DVT)是一种常见的血管疾病,深静脉内出现血栓,可能阻塞血流,甚至引发危及生命的肺栓塞。使用超声 US 成像进行 DVT 的典型检查是按压目标静脉,直至其管腔完全受压。然而,压缩检查高度依赖于操作员。为了减轻内部和相互之间的变化,我们提出了一种机器人 US 系统,该系统具有新颖的混合力运动控制方案,可确保位置和力跟踪精度以及探头软着陆到目标表面上。此外,提出了一种基于路径的虚拟夹具,以实现轻松的人机交互,以便在病变位置重复压缩操作。为了确保在不同检查中获得的生物测量结果具有可比性,使用外部 RGBD 相机和 US 图像以从粗到细的方式确定 6D 扫描路径。首先使用RGBD相机提取物体上的粗略扫描路径。然后,使用超声图像中分割的血管腔来优化扫描路径,以确保目标物体的可见性。为了生成用于开发虚拟夹具的连续扫描路径,提出了一种考虑位置和方向的基于弧长的路径拟合模型。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/614955.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法通关村番外篇-跳表

大家好我是苏麟 , 今天来聊聊调表 . 跳表很少很少实现所以我们只了解就可以了 . 跳表 链表在查找元素的时候,因为需要逐一查找,所以查询效率非常低,时间复杂度是O(N),于是就出现了跳表。跳表是在链表基础上改进过来的&#xff0…

OpenCV——图像按位运算

目录 一、算法概述1、逻辑运算2、函数解析3、用途 二、代码实现三、结果展示 OpenCV——图像按位运算由CSDN点云侠原创,爬虫自重。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。 一、算法概述 1、逻辑运算 OpenCV4 针对两个图像之…

JDBC初体验(二)——增、删、改、查

本课目标 理解SQL注入的概念 掌握 PreparedStatement 接口的使用 熟练使用JDBC完成数据库的增、删、改、查操作 SQL注入 注入原理:利用现有应用程序,将(恶意的)SQL命令注入到后台数据库引擎执行能力,它可以通过在…

银河麒麟v10安装前端环境(Node、vue、Electron+vite)

此帖子所提到的所有依赖包都是基于银河麒麟v10真机的arm架构包,如果是在windows上的虚拟机上 把依赖包换成x64的包即可,方法步骤都是一样 一.node安装 原始方法安装(建议用第二种nvm方法,因为更简单): 1…

工业异常检测AnomalyGPT-训练试跑及问题解决

写在前面,AnomalyGPT训练试跑遇到的坑大部分好解决,只有在保存模型失败的地方卡了一天才解决,本来是个小问题,昨天没解决的时候尝试放弃在单卡的4090上训练,但换一台机器又遇到了新的问题,最后决定还是回来…

图像识别与计算机视觉有什么区别?

图像识别和计算机视觉在很多方面存在差异,这些差异主要体现在以下几个方面: 1. 研究范围 图像识别是计算机视觉领域的一个子集。计算机视觉不仅包括图像识别,还涵盖了更广泛的内容,如场景理解、目标跟踪、分割、识别和解释等。简而…

jsPlumb、mxGraph和Antv x6实现流程图选型

解决方案 结合我们项目以及主流解决方案,提供以下几种方案: 序号技术栈性质是否开源说明1jsPlumb国外框架社区版、商业版中台项目现有方案2mxGraph国外框架开源比较有名的开源绘图网站draw.io (和processOn类似),使用…

JavaScript基础02

1 - 运算符(操作符) 1.1 运算符的分类 运算符(operator)也被称为操作符,是用于实现赋值、比较和执行算数运算等功能的符号。 JavaScript中常用的运算符有: 算数运算符 递增和递减运算符 比较运算符 逻…

第五站:C++的内存解析

目录 C内存分布 变量的四种存储方式 函数返回值使用指针(指针函数) 动态分配内存空间 不能使用外部函数的普通局部变量的地址 通过指针函数返回静态局部变量的地址 动态内存 根据需要分配内存,不浪费(根据用户的需求设置内存的容量) 被调用函数之外需要使用被调用函数内…

2024年1月11日 主题:非枪人生

2024年1月11日15:58:29 2024年1月11日15:35:13 2024年1月11日15:57:51 对物理进行大致预 2024年1月11日20:27:14 结论:不适合进行数据结构的训练和对电路的模拟感受 2024年1月11日20:28:32 今天也平静的结束了 不需要键盘的支持也就这么结束了我也不知道…

应用在LCD显示器电源插头里的氮化镓(GaN)MTC-65W1C

LCD(Liquid Crystal Display)显示器是利用液晶显示技术来进行图像表现的显示装置,从液晶显示器的结构来看,无论是笔记本电脑还是桌面系统,采用的LCD显示屏都是由不同部分组成的分层结构。LCD显示器按照控制方式不同可分…

适配 IOS 安全区域

安全区域指的是一个可视窗口范围,处于安全区域的内容不受圆角(corners)、齐刘海(sensor housing)、小黑条(Home Indicator)影响。 造成这个问题的主要原因就是 iphoneX 之后在屏幕上出现了所谓…

实现STM32烧写程序-(1)获取Bootloader版本信息

简介 如何像ST Flash Loader等工具一样写自己的烧写程序呢?文档 AN3155: USART protocol used in the STM32 bootloader 步骤 Boot模式 将 开发板例如STM32F103C8T6 Boot0->1 & Boo1->0 重启或复位进入系统存储模式 物理连接 将USART1 通过 USB转TTL线连接到…

NLP(十八):LLM 的推理优化技术纵览

原文:NLP(十八):LLM 的推理优化技术纵览 - 知乎 目录 收起 一、子图融合(subgraph fusion) 1.1 FasterTransformer by NVIDIA 1.2 DeepSpeed Inference by Microsoft 1.3 MLC LLM by TVM 二、模型压…

Windows7共享文档—开启方法及用户权限设置

使用计算机的朋友,在工作中经常需要在局域网中将文件共享给其他用户,这样其他人可以方便的通过局域网查看,甚至修改这些共享文件。当然,根据文件的重要程度,使用等级不同,不同的用户会赋予不同的权限&#…

PPT插件-大珩助手-《提取选中的幻灯片》-选中新建

选中新建 提取选中的幻灯片到新的幻灯文稿中。PDF编辑器可以提取指定的页面到新的PDF文档中,PPT没有这个功能,因此开发。 软件介绍 PPT大珩助手是一款全新设计的Office PPT插件,它是一款功能强大且实用的PPT辅助工具,支持Wps Wo…

js(JavaScript)数据结构之字典

什么是数据结构? 下面是维基百科的解释: 数据结构是计算机存储、组织数据的方式。数据结构意味着接口或封装:一个数据结构可被视为两个函数之间的接口,或者是由数据类型联合组成的存储内容的访问方法封装。 我们每天的编码中都会…

K8S的dashboard使用账号密码登录

原文网址:K8S的dashboard使用账号密码登录-CSDN博客 简介 本文介绍K8S的dashboard使用账号密码登录的方法。 ----------------------------------------------------------------------------------------------- 分享Java真实高频面试题,吊打面试官&…

uniapp中uview组件库丰富的ActionSheet 操作菜单使用方法

目录 #平台差异说明 #基本使用 #配置顶部的提示信息和底部取消按钮 #如何知道点了第几项 #API #Props #Event 本组件用于从底部弹出一个操作菜单,供用户选择并返回结果。 本组件功能类似于uni的uni.showActionSheetAPI,配置更加灵活,所…

使用知行之桥EDI系统的HTTP签名身份验证

本文简要概述了如何在知行之桥EDI系统中使用 HTTP 签名身份验证,并将使用 CyberSource 作为该集成的示例。 API 概述 API 是”应用编程接口”的缩写。这听起来可能很复杂,但它的真正含义是一种允许两个不同实体相互通信的软件。自开发以来,…