医疗机器人中的具身智能进展——自主超声策略模型的任务编码和局部探索

医疗机器人一直是具身智能的研究热点。医学图像、医疗触诊、血压血氧、心率脉搏和生物电信号等多模态生物医学信息,不断丰富着医疗机器人的感知范畴。

自主超声

“自主超声”属于具身智能医疗机器人领域中话题度较高的研究方向。作为临床检查的重要手段之一,传统医疗超声成像技术面临的主要问题为:长期重复性工作造成超声医师的肌体劳损;较长的培训周期导致专业超声医师的缺口持续增大;面对传染性疾病,医患隔离的需求难以满足。临床上,超声医师通过手眼配合和手感训练,锻炼出了对超声探头精准灵巧的操作手法,如图1所示。

图1
在这里插入图片描述

临床超声医师的专业性在于,一方面需要结合日积月累的专业医学知识,对超声图片进行实时的观察和判断,另一方面,超声医师的灵巧操作手法也需要因人而异,病人的高矮、胖瘦、性别、年龄,都会影响超声探头应被施加的压力和扫查方向。

研究进展

超声机器人系统大致可以区分为遥操作和自主式两种。在遥操作超声机器人系统中,超声扫查由超声医师通过直接动作映射进行远程控制。而在自主系统中,超声机器人须具备部分自主决定的能力,保证在超声医师尽量不干预的情况下完成扫查任务。例如,自主超声任务可以被定义为搜寻特定的区域或体积,通常需结合其他医学成像方式如磁共振成像(MRI)和计算机断层扫描(CT)。除此之外,一些研究将自主超声定义为路径跟踪任务,但是需事先在3D相机捕获的点云上进行标记。以上的方法非常依赖于超声医师预先定义的运动规则和引导。与之相比,更理想的自主超声系统应该能够学着去理解超声图像,然后自动完成规划以定位到超声图像。研究学者们也尝试用传统计算机视觉技术与深度学习方法来制定详尽的运动规划方案。此外,一些最新的研究也正在开发基于强化学习和模仿学习的策略模型,有可能在某些特点任务中替代超声医师。

问题与挑战

对于具有显著个体差异的患者群体而言,现有方法在安全性和可靠性方面仍然是一个问题,这归结于两个因素。首先,作为具身智能医疗机器人的研究方向之一,几种关键的临床医疗数据模态并未整合到现有的策略学习框架中,例如超声探头方向和其与患者皮肤的多维接触力。这些医疗数据模态都会显著影响超声扫查的质量,并在患者群体中表现出显著的个体差异性。其次,如何从分布内患者的策略模型外推泛化到分布外的超声技能,例如从年轻到年长、从瘦小到肥胖,从男性到女性,这一关键问题始终没有被提出、强调和验证。

解决思路

武汉大学的李淼教授带领其团队在国际期刊“IEEE Transactions on Automation Science and Engineering (TASE)”上发表了一篇题目为“Learning Freehand Ultrasound Through Multimodal Representation and Skill Adaptation”的文章。其主要贡献点在于,提出了一种多模态融合框架来隐性表征临床超声医师徒手示教的扫查技能,不需要额外地在超声图片中标注兴趣区域和器官轮廓,并综合考虑了超声图像、探头方向和接触力等数据模态。同时,提出了一种超声技能的自适应方案,改善了超声技能在具有显著个体差异性的患者群之间外推泛化的能力。

图2
在这里插入图片描述

图2展示了所提出的可学习和可泛化的自主超声工作流程。首先从临床场景中收集徒手超声的示教数据;在学习阶段,通过多模态融合框架将这些示教数据表征到低维空间中;在部署阶段,将离线建模的自主超声技能复现到徒手超声或机器人超声的应用中。

图3所示为临床场景中收集徒手超声的示教数据的硬件设备细节。除了使用视频捕捉设备获取实时超声图片,超声探头上搭载的惯性测量单元(IMU)和6D力/扭矩传感器能够获得超声探头的方向和接触力数据模态。临床实验场景如图4所示。

图3
在这里插入图片描述

图4
在这里插入图片描述

在多模态融合框架中,超声图像特性通过Masked Auto-Encoder(MAE)进行提取。预处理图像被表征为40维的特征向量,并与4维的探头姿态向量和6维的探头接触力向量进行拼接融合。完成示教数据的降维编码后,用高斯混合模型(GMM)进行建模和预测,如图5所示。

图5
在这里插入图片描述

图6
在这里插入图片描述

在图6所示的算法流程中,通过临床徒手示教的多模态时间序列被嵌入到潜在空间。利用概率模型对示教中的全局动作分布进行建模,并由此可以确定选择某一动作的概率,称之为“似然值”。动作的似然值可以被视为一个潜在的评价指标,似然值低的动作被判定为不可靠的预测结果,后续需利用局部搜索对其进行微调,使其更加接近可靠动作。局部搜索方法如图7所示,其中橙色、绿色、蓝色和紫色区域绘制了四个高斯分布。若预测值能够对应到任意高似然动作(例如A1),则表明该预测结果是可靠的。在此条件下,后续算法将执行逐步迭代过程,沿着条件概率的梯度方向找到局部最优解。而如果预测值位于低似然区域(例如B1),则被判定为不可靠动作。在这种情况下,由于缺乏类似的示教数据,概率空间中的局部似然值仅有着非常小的变化梯度,逐步迭代往往无法找到局部最优解。此时应进行局部探索以找到最近的高斯分布(例如从B1到B2),从而避免沿着条件概率梯度而遇到相对随机的结果(例如从B1到B∗)。

图7
在这里插入图片描述

局部搜索的方法很好地解决了离线学习的自主超声策略模型在部署阶段泛化和外推能力不足的问题,能够在完整的超声检查任务过程中取得接近于人类超声专家的决策能力。如图8所示为超声专家和所提出自主超声算法,在完成同样的患者左肾检查任务中的表现(灰色为人类专家的动作,橙色为自主超声算法的动作)。

图8
在这里插入图片描述

论文中开展了大规模临床实验,从总计24名志愿者中收集了120条示教轨迹,共包含53571组“临床左肾俯卧位检查”的多模态样本。志愿者中包含14名男性和10名女性,年龄跨度从19岁到67岁,BMI指标范围从16.4(瘦小)到26.7(超重)。除了“患者内”和“患者间”的验证方法,实验中提出了一系列相较于N则交叉验证更加复杂和困难的实验方式,将不同患者按照个体差异性划分到训练集和验证集中:将年龄偏小、身材瘦小、或者男性患者的数据作为训练集,而将年龄偏大、身材超重、或者女性患者的数据作为验证集,以此凸显在实际应用中可能面临的数据分布偏移的极端情况。如图9所示,相比于基准算法,论文中提出的自主超声算法框架取得了显著的性能表现和预测精度。

图9
在这里插入图片描述

论文同样验证了所提出的自主超声策略框架兼容一些流行的表征学习基础架构,并在超声图像质量欠佳的情况下表现出良好的训练稳定性。在未来的工作中,基于具身智能的自主超声机器人将更快地进入人们的视野。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/41316.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

线性系统理论及应用GUI设计及仿真

目录 1.控制系统的状态空间模型 1.1.状态空间模型 1.2 传递函数模型 1.3 传递函数转换为状态空间模型 1.4.状态空间模型转换为传递函数 1.5.状态空间模型转化为约当标准型 2.线性系统的时域分析 2.1.矩阵指数函数的计算 2.2.线型定常连续系统的状态空间模型求解 3.线…

ubuntu24.04按关键字卸载不需要的apt包

使用的时候发现一个imagemagic无法正常读取文件,试图卸载 man apt经过尝试后,发现list的一个神奇关键字,用来显示已安装的软件包 sudo apt list --installed | grep image按image关键字过滤: 之后按软件名卸载即可 sudo apt pu…

开关电源——调制模式和工作模式

一、开关电源的调制模式 开关电源作为一种广泛应用于电子设备中,用于将一定电压和电流转换为另一种电压和电流的技术,以下是开关电源三种常见的调制模式: 脉冲宽度调制(Pulse Width Modulation) 脉冲频率调制&#xff…

高德地图 key 和安全密钥使用

参考高德地图:JS API 安全密钥使用 高德地图 key 和安全密钥使用 一、通过明文方式设置参数查看如下成功后返回的信息 二、通过代理服务器转发实验:通过本地地址转发返回错的错误信息,如下通过正确的项目的的服务地址,返回正常参数…

【VUE基础】VUE3第一节—vite创建vue3工程

什么是VUE Vue (发音为 /vjuː/,类似 view) 是一款用于构建用户界面的 JavaScript 框架。它基于标准 HTML、CSS 和 JavaScript 构建,并提供了一套声明式的、组件化的编程模型,帮助你高效地开发用户界面。无论是简单还是复杂的界面&#xff0…

Java+MySQL8.0.36+ElementUI数字化产科信息管理系统之”五色管理”

JavaMySQL8.0.36ElementUI数字化产科信息管理系统之”五色管理” 一、数字化产科信息管理系统概述 数字化产科信息管理五色管理是一种基于孕产妇妊娠风险的分类管理方法,通过数字化手段实现孕产妇全周期的健康风险评估与管理。该方法将孕产妇按照风险等级分为绿色、…

DC-DC充放电原理

文章目录 前言1. 电子器件1.1 电容1.2 电感 2. 升压电路3. 降压电路4. 电压均衡电路4.1 被动均衡4.2 主动均衡 5. 我的疑问5.1 对于升压电路,怎么设计升压到多少V后,停止升压?5.2 什么是等效电阻?5.3 快充是如何实现的&#xff1f…

LightGlue: Local Feature Matching at Light Speed【文献阅读】

论文:LightGlue: Local Feature Matching at Light Speed 代码:https://github.com/cvg/LightGlue 作者:1 ETH Zurich__2 Microsoft Mixed Reality & AI Lab Abstract 提出的LightGlue是一个深度神经网络用于学习图像间的局部特征匹配。…

WAIC | 上海人形机器人创新中心 | 最新演讲 | 详细整理

前言 笔者看了7月4号的人形机器人与具身智能发展论坛的直播,并在7月5日到了上海WAIC展会现场参观。这次大会的举办很有意义,听并看了各家的最新成果,拍了很多照片视频,部分演讲也录屏了在重复观看学习 稍后会相继整理创立穹彻智…

算法系列--分治排序|归并排序|逆序对的求解

一.基本概念与实现 归并排序(mergeSort)也是基于分治思想的一种排序方式,思路如下: 分解:根据中间下标mid将数组分解为两部分解决:不断执行上述分解过程,当分解到只有一个元素时,停止分解,此时就是有序的合并:合并两个有序的子区间,所有子区间合并的结果就是原问题的解 归并…

第一节 网络安全概述

一.网络空间安全 网络空间:一个由信息基础设施组成相互依赖的网络。 ---- 海陆空天(大海、陆 地、天空、航天) 通信保密阶段 ---- 计算机安全 ----- 信息系统安全 ----- 网络空间安全 计算机安全:开始秉持着“严于律己&#x…

C语言 指针和数组—指针数组及其在字符串处理中的应用

目录 问题的提出 问题的解决 回头看——指针、数组及其他类型的混合 指针数组与指向数组的指针 字符串的排序 问题的提出 问题的解决 回头看——指针、数组及其他类型的混合  基本数据类型  int 、 long 、 char 、 short 、 float 、 double……  数组是一种从…

设计模式之模版方法

模版方法介绍 模版方法(Template Method)模式是一种行为型设计模式,它定义了一个操作(模板方法)的基本组合与控制流程,将一些步骤(抽象方法)推迟到子类中,使得子类可以在…

【UE5.1】Chaos物理系统基础——03 炸开几何体集

目录 步骤 一、通过径向向量将几何体集炸开 二、优化炸开效果——让破裂的碎块自然下落 三、优化炸开效果——让碎块旋转起来 四、优化炸开效果——让碎块旋转的越来越慢 步骤 一、通过径向向量将几何体集炸开 1. 打开上一篇中(【UE5.1】Chaos物理系统基础—…

Spring IOC基于XML和注解管理Bean

IoC 是 Inversion of Control 的简写,译为“ 控制反转 ”,它不是一门技术,而是一种设计思想,是一个重要的面向对象编程法则,能够指导我们如何设计出 松耦合、更优良的程序。 Spring 通过 IoC 容器来管理所有 Java 对象…

如何从 Windows 11/10/8.1/8/7 恢复已删除的视频

意外删除了视频或格式化了 SD 卡/硬盘?没有备份已删除的视频?别担心,我们有解决方案来恢复 Windows 11、10 中已删除的视频并处理这种糟糕的情况。 但在了解如何恢复已删除的视频和视频恢复应用程序之前,请知道 Windows 会为您提…

ARMv8寄存器详解

文章目录 一、ARMv8寄存器介绍二、通用寄存器三、 PSTAE寄存器四、特殊寄存器五、系统寄存器 一、ARMv8寄存器介绍 本文我来给大家介绍一下ARMv8的寄存器部分,ARMv8中有34个寄存器,包括31个通用寄存器、一个栈指针寄存器SP(X31),一个程序计数器寄存器PC…

Transformer前置知识:Seq2Seq模型

Seq2Seq model Seq2Seq(Sequence to Sequence)模型是一类用于将一个序列转换为另一个序列的深度学习模型,广泛应用于自然语言处理(NLP)任务,如机器翻译、文本摘要、对话生成等。Seq2Seq模型由编码器&#…

JavaEE初阶-网络原理1

文章目录 前言一、UDP报头二、UDP校验和2.1 CRC2.2 md5 前言 学习一个网络协议,最主要就是学习的报文格式,对于UDP来说,应用层数据到达UDP之后,会给应用层数据报前面加上UDP报头。 UDP数据报UDP包头载荷 一、UDP报头 如上图UDP的…

Emacs之解决:java-mode占用C-c C-c问题(一百四十六)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…