【AI视野·今日Robot 机器人论文速览 第七十一期】Fri, 5 Jan 2024

AI视野·今日CS.Robotics 机器人学论文速览
Fri, 5 Jan 2024
Totally 11 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

Machine Learning in Robotic Ultrasound Imaging: Challenges and Perspectives
Authors Yuan Bi, Zhongliang Jiang, Felix Duelmer, Dianye Huang, Nassir Navab
本文回顾了智能机器人超声超声成像系统的最新进展。我们首先介绍机器人超声成像中常用的机器人机制和控制技术及其临床应用。随后,我们重点关注机器学习技术在机器人超声检查师开发中的部署,强调旨在增强这些系统智能的关键发展。实现自主行动推理的方法分为两类:依赖隐式环境数据解释的方法和使用显式解释的方法。在整个探索过程中,我们还讨论了实际挑战,包括与医疗数据稀缺性、深入了解所涉及的物理方面的需要以及有效的数据表示方法相关的挑战。

AERIAL-CORE: AI-Powered Aerial Robots for Inspection and Maintenance of Electrical Power Infrastructures
Authors Anibal Ollero, Alejandro Suarez, Christos Papaioannidis, Ioannis Pitas, Juan M. Marredo, Viet Duong, Emad Ebeid, Vit Kratky, Martin Saska, Chloe Hanoune, Amr Afifi, Antonio Franchi, Charalampos Vourtsis, Dario Floreano, Goran Vasiljevic, Stjepan Bogdan, Alvaro Caballero, Fabio Ruggiero, Vincenzo Lippiello, Carlos Matilla, Giovanni Cioffi, Davide Scaramuzza, Jose R. Martinez de Dios, Begona C. Arrue, Carlos Martin, Krzysztof Zurad, Carlos Gaitan, Jacob Rodriguez, Antonio Munoz, Antidio Viguria
大型基础设施很容易因老化、环境影响和大量使用而老化。通过定期检查和维护确保其安全对于防止严重影响公共安全和环境的事件至关重要。这在电力网络的背景下尤其重要,电力网络虽然对于能源供应至关重要,但也可能是森林火灾的根源。智能无人机有可能彻底改变检查和维护,消除人类操作员的风险,提高生产力,减少检查时间并提高数据收集质量。然而,目前空中机器人技术的大多数方法和技术主要是在室内试验台或严格控制条件下的室外环境中进行试验的,并且始终在人类操作员的视线范围内。此外,这些方法和技术通常是孤立评估的,缺乏全面的集成。本文介绍了第一个结合了各种创新空中机器人的自主系统。该系统专为超出视线范围的大范围检查而设计,具有用于维护任务的空中机械手,并包括用于在高处工作的操作员的支撑机制。

How Do Pedestrians' Perception Change toward Autonomous Vehicles during Unmarked Midblock Multilane Crossings: Role of AV Operation and Signal Indication
Authors Fengjiao Zou, Jennifer Harper Ogle, Patrick Gerard, Weimin Jin
阻碍行人广泛接受自动驾驶汽车的主要障碍之一是他们对自动驾驶汽车的理解有限。本研究采用虚拟现实 VR 为行人提供一个身临其境的环境,以便在无标记的中路多车道交叉口期间与自动驾驶汽车互动并理解自动驾驶汽车。对各种自动驾驶汽车驾驶行为进行建模,以显示带有黄色信号指示的谈判行为或带有蓝色信号指示的不让行行为。本文旨在研究自动驾驶汽车行为和信号、行人过去行为等各种因素对行人对自动驾驶汽车感知变化的影响。 VR 实验前后,参与者完成了评估他们对自动驾驶汽车看法的调查,重点关注态度和系统有效性两个主要方面。 Wilcoxon 签名排名测试结果表明,在 VR 实验之后,行人对自动驾驶汽车的整体态度评分和对自动驾驶系统有效性的信任度均显着提高。值得注意的是,对黄色信号表现出更大信任的个人更倾向于对自动驾驶汽车表现出更高的态度分数,并增强他们对自动驾驶系统有效性的信任。这表明黄色信号灯的设计让行人对与自动驾驶汽车的互动更有信心。此外,与那些具有更积极的过路行为的行人相比,表现出更积极的过路行为的行人不太可能改变对自动驾驶汽车的看法。

Enabling Digitalization in Modular Robotic Systems Integration
Authors Daniella Tola
将机器人系统集成到生产线中是一个耗时的过程。在数字化时代,新技术的研发对于改进集成流程至关重要。众多挑战,包括缺乏标准化以及复杂的利益相关者关系,使机器人系统集成的过程变得复杂。该过程通常包括机器人系统的获取、集成和部署。本论文重点关注有助于自动化和简化机器人系统集成的三个领域。在与采集相关的第一个领域,演示了基于约束的配置器,它解决了机器人设备之间的兼容性挑战,并使配置过程自动化。这降低了集成不兼容设备的风险,并减少了配置阶段对专家的需求。在与集成相关的第二个领域中,研究了可互操作的建模格式(统一机器人描述格式 URDF),并进行了详细分析,揭示了显着的不一致和关键的改进。这种格式广泛用于机器人的运动学建模和 3D 可视化,并且其模型可以跨仿真工具重复使用。改进这种格式使广泛的用户受益,包括机器人工程师、研究人员和学生。在与部署相关的第三个领域,探索了机器人系统的数字孪生DT,因为它们可以提高效率并减少停机时间。对 DT 进行了全面的文献综述,并开发了模块化机器人系统的案例研究。这项研究可以加速 DT 在机器人行业的采用。

Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation
Authors Zipeng Fu, Tony Z. Zhao, Chelsea Finn
从人类演示中进行的模仿学习在机器人技术中表现出了令人印象深刻的表现。然而,大多数结果都集中在桌面操作上,缺乏一般有用任务所需的移动性和灵活性。在这项工作中,我们开发了一种用于模仿需要全身控制的双手移动操作任务的系统。我们首先推出 Mobile ALOHA,这是一种用于数据收集的低成本全身远程操作系统。它通过移动底座和全身远程操作界面增强了 ALOHA 系统。然后,我们使用 Mobile ALOHA 收集的数据执行监督行为克隆,并发现与现有静态 ALOHA 数据集的协同训练可以提高移动操作任务的性能。每项任务进行 50 次演示,协同训练可将成功率提高多达 90 倍,使 Mobile ALOHA 能够自主完成复杂的移动操作任务,例如炒虾和上菜、打开两门壁柜存放沉重的烹饪锅、呼叫并进入电梯,并使用厨房水龙头轻轻冲洗用过的锅。

On Time-Indexing as Inductive Bias in Deep RL for Sequential Manipulation Tasks
Authors M. Nomaan Qureshi, Ben Eisner, David Held
在解决复杂的操纵任务时,操纵策略通常需要学习一组不同的技能来完成这些任务。这组技能通常是多模态的,每个技能可能具有截然不同的动作和状态分布。标准深度策略学习算法通常将策略建模为具有单个输出头确定性或随机性的深度神经网络。这种结构需要网络学习在内部模式之间切换,这可能导致样本效率较低和性能较差。在本文中,我们探索了一种简单的结构,有利于许多操作任务所需的技能学习。具体来说,我们提出了一种策略架构,可以在固定的时间内顺序执行不同的动作头,从而能够学习基本技能,例如伸手和抓握。

ODIN: A Single Model for 2D and 3D Perception
Authors Ayush Jain, Pushkal Katara, Nikolaos Gkanatsios, Adam W. Harley, Gabriel Sarch, Kriti Aggarwal, Vishrav Chaudhary, Katerina Fragkiadaki
ScanNet 等当代 3D 感知基准的最先进模型使用和标签数据集提供了 3D 点云,这些点云是通过感测的多视图 RGB D 图像的后处理获得的。它们通常在域中进行训练,放弃大规模 2D 预训练,并优于以 RGB D 多视图图像为特征的替代方案。使用姿势图像的方法与后处理的 3D 点云的方法之间的性能差距让人更加相信 2D 和 3D 感知需要不同的模型架构。在本文中,我们挑战了这一观点,并提出了 ODIN Omni Dimensional INstance 分割,这是一种可以分割和标记 2D RGB 图像和 3D 点云的模型,使用在 2D 视图内和 3D 跨视图信息融合之间交替的转换器架构。我们的模型通过所涉及标记的位置编码来区分 2D 和 3D 特征操作,该编码捕获 2D 补丁标记的像素坐标和 3D 特征标记的 3D 坐标。 ODIN 在 ScanNet200、Matterport3D 和 AI2THOR 3D 实例分割基准上实现了最先进的性能,在 ScanNet、S3DIS 和 COCO 上实现了具有竞争力的性能。当使用感测到的 3D 点云代替从 3D 网格采样的点云时,它的性能大大优于以前的所有工作。当在可指导的具体代理架构中用作 3D 感知引擎时,它为对话基准的 TEACh 动作设定了新的技术水平。

Direction of Arrival Estimation Using Microphone Array Processing for Moving Humanoid Robots
Authors Vladimir Tourbabin, Boaz Rafaely
近年来,人形机器人的听觉系统受到越来越多的关注。该系统通常通过麦克风阵列来获取周围的声场。然后使用各种方法处理阵列采集的信号。广泛应用的方法之一是到达方向估计。传统的到达方向估计方法假设在估计期间阵列固定在给定位置。然而,对于安装在移动人形机器人上的阵列来说,情况不一定如此。如果没有适当考虑阵列运动,可能会在估计的到达方向上引入显着的误差。当前的论文提出了一种考虑运动的信号模型。基于该模型,提出了两种处理方法。第一个补偿机器人的运动。第二种方法适用于周期性信号,并利用运动来将性能提高到超出固定阵列的水平。提供了数值模拟和实验研究,证明运动补偿方法几乎消除了与运动相关的误差。

Inherently robust suboptimal MPC for autonomous racing with anytime feasible SQP
Authors Logan Numerow, Andrea Zanelli, Andrea Carron, Melanie N. Zeilinger
近年来,自动驾驶等应用对高性能控制器的需求不断增长,推动了针对特定控制问题的优化例程的开发。在本文中,我们提出了一种高效的不精确模型预测控制 MPC 策略,用于具有固有鲁棒性的自主微型赛车。我们依赖于一种可行的顺序二次规划 SQP 算法,该算法能够生成可行的中间迭代,以便求解器可以在任意次数的迭代后停止,而不会危及递归的可行性。通过这种方式,我们提供了一种计算次优但可行的解决方案的策略,其计算足迹远低于基于局部最优解决方案计算的最先进方法。在对终端集和系统可控性属性的适当假设下,我们可以说,对于影响系统动态的任何足够小的扰动,可以保证递归可行性。我们在模拟中验证了所提出策略的有效性,并将其部署到自动微型赛车的物理实验中。仿真和实验结果都表明,与采用提前终止而不提供可行解的策略相比,使用可行的 SQP 方法,可以通过适度的额外计算工作来获得可行解。

Estimating continuous data of wrist joint angles using ultrasound images
Authors Yo Kobayashi, Yoshihiro Katagi
超声波成像最近被引入作为联合运动估计的传感接口。使用超声图像作为估计方法有望提高辅助设备和人机界面的控制性能。本研究旨在使用超声图像估计连续的腕关节角度。具体来说,在实验中,在伸展屈曲运动期间获得关节角度信息,并获取相关肌肉的超声图像。利用从超声图像获得的特征,使用多元线性回归模型来估计关节角度。使用来自超声图像的光流获得的特征点的坐标被用作多元线性回归模型的解释变量。每个参与者都对模型进行了每次试验的训练和测试,以验证估计的准确性。结果显示,所有试验的估计精度的平均值和标准差为均方根误差 RMSE 1.82 pm 0.54 deg,决定系数 R2 0.985 pm 0.009。

Perceptions of Humanoid Robots in Caregiving: A Study of Skilled Nursing Home and Long Term Care Administrators
Authors Rana Imtiaz, Arshia Khan
随着人口老龄化的加剧和医护人员短缺的加剧,研究其他照顾老龄化人口的方法的必要性也随之增加。其中一种方法是使用人形机器人来照顾 65 岁以上人群的社交、情感和身体健康。了解熟练的长期护理院管理员对人形机器人在护理方面的看法至关重要,因为他们的见解影响着机器人的实施及其对居民福祉和生活质量的潜在影响。作者对 269 名疗养院管理人员进行了调查,以了解他们对在疗养院设施中使用人形机器人的看法。数据经过编码,结果显示,高管们热衷于探索其他护理途径,例如机器人技术,以增强疗养院照顾居民的能力。定性分析揭示了在疗养院中集成人形机器人的不同观点。虽然承认提高参与度和员工支持等好处,但对成本、对人类互动的影响以及对机器人有效性的怀疑仍然存在。这凸显了复杂的财务、技术和人力障碍,并强调了战略实施的必要性。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/605211.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

redis可视化工具 RedisInsight

redis可视化工具 RedisInsight 1、RedisInsight是什么2、下载RedisInsight3、使用RedisInsight4、其他redsi可视化工具 1、RedisInsight是什么 RedisInsight 是一个用于管理和监控 Redis 数据库的图形用户界面(GUI)工具。它是由 Redis Labs 开发的&…

idea使用ssh连接docker,并通过Dockerfile文件,直接在idea中启动docker应用,并进行远程debug

idea使用ssh连接docker,并通过Dockerfile文件,直接在idea中启动docker应用,并进行远程debug 第一步: idea通过ssh连接docker第二步:使用Dockerfile文件在远程启动应用第三步: 远程debug 容器运行的好处是减轻本地运行的负担(本地电…

NSSCTF 2048

开启环境: 按F12查看网络,看到2048.js文件,打开 修改score>20000或者直接运行:(控制台输入) alert(String.fromCharCode(24685,21916,33,102,108,97,103,123,53,51,49,54,48,99,56,56,56,101,50,53,99,51,102,56,50,56,98,50,51,101,51,49,54,97,55,97,101,48,56,51,125)); …

Quartus II 13.1的安装及使用

Quartus II 13.1的安装及使用_quartus13.1-CSDN博客1.3 Verilog 环境搭建 | 菜鸟教程 学习 Verilog 做仿真时,可选择不同仿真环境。FPGA 开发环境有 Xilinx 公司的 ISE(目前已停止更新),VIVADO;因特尔公司的 Quartu…

Marching Cubes算法再回顾

1,确定包含等值面的体元 首先介绍一下 体元的概念,体元是三维图像中由相邻的八个体素点组成的正方体方格,英语也叫 Cube,体元中角点函数值分为两种情况,一种是大于等于给定等值面的值 C0 ,则将角点设为 1 称该角点在等值面内部&a…

本地部署 gemini-openai-proxy,使用 Google Gemini 实现 Openai API

本地部署 gemini-openai-proxy,使用Google Gemini 实现 Openai API 0. 背景1. 申请 Google Gemini API key2. (Optional)Google Gemini 模型说明3. gemini-openai-proxy Github 地址4. 本地部署 gemini-openai-proxy5. 测试 0. 背景 使用 Google Gemini 实现 Opena…

Java 之 CAS(CompareAndSwap)底层原理详解

目录 一. 前言 二. CAS 底层原理 2.1. 代码实例 2.2. 源码分析 2.3. 底层汇编 2.4. ABA 问题 三. 总结 3.1. CAS 缺点 3.2. CAS 会导致 ABA 问题 一. 前言 CAS 的全称是 Compare-And-Swap,它是 CPU 并发原语。它的功能是判断内存某个位置的值是否为预期值。…

MySQL 8.0 开关 Redo Logging

一 前言 前几天有客户测试使用云数据库的时候提出 要禁止mydumper 关闭redo log的操作 (说白了就是导入数据时保持MySQL 实例的redo logging功能), 这才想起 在 MySQL 8.0.21 版本中,开启了一个新特性 “Redo Logging 动态开关”。 在新实例导数据的场…

【IPC通信--消息队列】

消息队列(也叫做报文队列)是一个消息的链表。可以把消息看作一个记录,具有特定的格式以及特定的优先级。对消息队列有写权限的进程可以向消息队列中按照一定的规则添加新消息;对消息队列有读权限的进程则可以从消息队列中读走消息…

[C#]Onnxruntime部署Chinese CLIP实现以文搜图以文找图功能

【官方框架地址】 https://github.com/OFA-Sys/Chinese-CLIP 【算法介绍】 在当今的大数据时代,文本信息处理已经成为了计算机科学领域的核心议题之一。为了高效地处理海量的文本数据,自然语言处理(NLP)技术应运而生。而在诸多N…

电子实验室设备:从零开始配置实验室(一)

本文译自 Electronics Lab Equipment: Kitting out a Lab from Scratch 随着多次国际迁徙以及在几家公司(或其分支机构)工作,尤其是在没有强大电子工程团队的情况下,我不得不为自己和客户设置多个电子实验室。那些计划进行内部测试…

网页设计与制作web前端设计html+css+js成品。电脑网站制作代开发。vscodeDrea 【企业公司宣传网站(HTML静态网页项目实战)附源码】

网页设计与制作web前端设计htmlcssjs成品。电脑网站制作代开发。vscodeDrea 【企业公司宣传网站(HTML静态网页项目实战)附源码】 https://www.bilibili.com/video/BV1Hp4y1o7RY/?share_sourcecopy_web&vd_sourced43766e8ddfffd1f1a1165a3e72d7605

【C++】STL 算法 ⑥ ( 二元谓词 | std::sort 算法简介 | 为 std::sort 算法设置 二元谓词 排序规则 )

文章目录 一、二元谓词1、二元谓词简介2、 std::sort 算法简介3、 代码示例 - 为 std::sort 算法设置 二元谓词 排序规则 一、二元谓词 1、二元谓词简介 " 谓词 ( Predicate ) " 是一个 返回 布尔 bool 类型值 的 函数对象 / 仿函数 或 Lambda 表达式 / 普通函数 , …

逆置算法和数组循环移动算法

元素逆置 概述:其实就是将 第一个元素和最后一个元素交换,第二个元素和倒数第二个元素交换,依次到中间位置。用途:可用于数组的移动,字符串反转,链表反转操作,栈和队列反转等操作。 逆置图解 …

2024年1月7日15:09:50

2024年1月7日15:09:55复习:我今天学了有价值的东西,那就是在瓦罗兰特拿到了三杀 2024年1月7日15:11:10学习了如何使用vivopad2的键盘 可以稍微用一下 2024年1月7日15:17:58 学习一个编程的题目 2024年1月7日15:31:27不用机械键盘打字效率就是比不用低…

深入理解堆(Heap):一个强大的数据结构

. 个人主页:晓风飞 专栏:数据结构|Linux|C语言 路漫漫其修远兮,吾将上下而求索 文章目录 前言堆的实现基本操作结构体定义初始化堆(HeapInit)销毁堆(HeapDestroy) 重要函数交换函数(…

Talk | EMNLP 2023 最佳长论文:以标签为锚-从信息流动的视角分析上下文学习

本期为TechBeat人工智能社区第561期线上Talk。 北京时间1月4日(周四)20:00,北京大学博士生—王乐安的Talk已准时在TechBeat人工智能社区开播! 他与大家分享的主题是: “以标签为锚-从信息流动的视角分析上下文学习”,介绍了他的团队在上下文学…

STM32深入系列02——BootLoader分析与实现

文章目录 1. STM32程序升级方法1.1 ST-Link / J-link下载1.2 ISP(In System Programing)1.3 IAP(In Applicating Programing)1.3.1 正常程序运行流程1.3.2 有IAP时程序运行流程 2. STM32 Bootloader实现2.1 方式一:Boo…

Qt/QML编程学习之心得:Linux下Thread线程创建(26)

GUI设计中经常为了不将界面卡死,会用到线程Thread,而作为GUI设计工具,Qt也提供了一个这样的类,即QThread。 QThread对象管理程序中的一个控制线程。线程QThread开始在run()中执行。默认情况下,run()通过调用exec()启动事件循环,并在线程内运行Qt事件循环。 也可以通过…

【第6期】使用Iview的Select组件进行远程搜索并在编辑时设置一个或多个默认值

本期简介 下拉框这个组件用的地方非常多,普通用法就是将数据列表一次性查询渲染,在列表里面直接本地搜索,优点是可缓存、速度快,但在某些场合并不适用,比如要在下拉框中选择一所中国的学校,幼儿园/小学/初…