介绍
呼吸不仅是人类生存的基础,而且其模式也是评估个体健康状态的关键指标。异常的呼吸模式往往是呼吸系统疾病的一个警示信号,包括但不限于慢性阻塞性肺病(COPD)、阻塞性睡眠呼吸暂停(OSA)、肺炎、囊性纤维化、哮喘,以及新型冠状病毒感染(COVID-19)。特别是在COVID-19的病例中,症状可能表现为呼吸频率的增加、单次通气量的减少(即每次呼吸时进出气道和肺部的空气量减少),以及呼吸节律的不规律性。因此,能够准确且迅速地评估呼吸模式对于COVID-19及其变种的诊断和治疗管理极为关键。
本文介绍了一种创新的诊断平台,该平台融合了磁性呼吸传感技术(MRST)和机器学习(ML),旨在实时监测和诊断COVID-19及其他呼吸道疾病。该技术平台通过实时追踪呼吸模式,为医疗专业人员提供了一个强有力的工具,以便更早地识别疾病迹象,从而及时进行干预。
MRST作为一种先进的传感技术,能够通过监测人体磁场的微妙变化来评估呼吸活动,而无需对患者造成任何不适或干扰。结合机器学习算法的强大数据处理能力,该平台能够从大量的呼吸数据中提取出关键特征,并学习区分健康和病理状态的模式。
经过精心设计和严格的验证过程,该平台已经证明其在实时追踪和诊断COVID-19及其他呼吸道疾病方面的有效性。它不仅提高了诊断的准确性,还为患者提供了更快的反馈和更早的治疗机会。
论文地址:https://arxiv.org/abs/2311.00737
实现方法
磁性呼气检测
磁性呼吸监测系统(图 1a)作为整个监测流程的起点,采用霍尔效应传感器来精确捕捉因呼吸运动而引起的磁场变化。这些变化由贴在人体胸部的小型永久磁铁产生,确保了对呼吸模式进行非侵入式、细致的追踪。
在呼吸数据收集阶段(图 1b),实施了一套全面的呼吸测试方案,旨在建立一个研究基线。该方案涵盖了三种基本的呼吸模式:正常呼吸、屏气和深呼吸。通过这种多样化的测试方法,可以收集到广泛的呼吸活动数据,为后续分析提供了一个坚实的、可靠的数据基础。
随后,进入信号处理和特征提取环节(图 1c),在这里,应用了专为呼吸数据分析而设计的高级算法。这一步骤至关重要,因为它涉及到从收集到的数据中识别出具有诊断价值的模式,为疾病的早期发现提供了关键信息。
最终,这些经过精心提取的特征被输入到机器学习(ML)模型中(图 1d)。该模型根据特定的呼吸标记物进行了定制化训练,旨在识别和诊断新型冠状病毒感染(COVID-19)。ML模型的这一应用,显著提高了诊断的准确性和效率。
研究对象和数据收集
研究时间与背景
该研究在2021年7月至2021年10月的三个月期间进行。这一时期,越南采取了“零新冠状病毒”政策,旨在通过强化隔离措施控制病毒的传播。该政策要求医院或医疗营地对所有新感染的患者进行严格的隔离管理。
研究参与者
在胡志明市Binh Tan医疗营,共有33名新型冠状病毒感染患者参与了这项研究。同时,还有37名居住在胡志明市的健康参与者作为对照组加入项目。这些参与者的参与为研究提供了宝贵的数据,有助于更好地理解COVID-19的传播特性和影响。
研究意义
这项研究的进行,正值全球抗击COVID-19疫情的关键时期。越南的“零新冠状病毒”政策提供了一个独特的研究环境,使得研究者能够在一个相对控制的条件下观察和收集数据。通过对比感染患者和健康参与者的呼吸模式,研究者可以更深入地了解COVID-19如何影响人体的呼吸系统,并探索更有效的诊断和治疗方法。
究的潜在影响
这项研究的结果不仅能够为越南的疫情防控提供科学依据,还可能对全球的COVID-19研究和应对策略产生重要影响。通过分析和比较不同参与者的呼吸数据,研究者可以识别出COVID-19感染的早期迹象和特征,这对于早期诊断和治疗至关重要。
此外,这项研究还可能推动呼吸监测技术的发展和应用。通过将磁性呼吸监测系统与机器学习模型相结合,研究者可以开发出更精确、更高效的监测工具,为全球公共卫生安全做出贡献。
实验结果
收集的数据概览
下表 1 显示,新型冠状病毒感染患者的平均年龄略大于健康受试者。不过,标准偏差显示两组患者的年龄范围都很大,突出了数据集的多样性。此外,两组患者的性别分布基本平衡,最大限度地减少了研究结果中以性别为中心的偏差。
值得注意的是,新型冠状病毒感染患者的平均住院时间约为 6 天,这显示了这一群体病情的严重性,这可能体现在他们的呼吸模式上。将体温、血压和体重指数等生理参数以及新型冠状病毒感染的症状包括在内,可以全面了解参与者的健康状况。
特征提取
在此,我们详细探讨了基于整理的呼吸信号数据的详细特征提取分析。目的是突出健康受试者与新型冠状病毒感染患者在呼吸模式上的明显差异。下图 2 列出了两组患者在正常呼吸、屏气和深呼吸三种呼吸测试中呼吸信号的峰值检测和功率谱密度(PSD)分析。
数据显示,健康受试者和受影响受试者的峰值模式和相关频谱内容存在明显差异(图 2a-2l)。此外,还记录了时域和频域的四个代表性特征:平均呼吸频率 (RR)、平均突出度 (Prom)、归一化功率谱密度 (NPSD) 和主导频率 (Freq)。如图 2m-2o 所示。很明显,在比较正常人和 COVID-19 受试者时,这些特征存在明显差异,这表明该疾病对呼吸动力学有明显影响。
图 3显示了使用先进的非线性分析方法 RQA对呼吸信号的动态特征进行封装的结果。
图 3 所示的 RQA 结果突出显示了两组患者在三种呼吸条件下的特征复现图(图 3a-3f)。这些图生动地显示了被称为 "指纹 "区域的特定区域,它们是 COVID-19 患者复杂呼吸动态的独特特征。这些区域还标有三个关键的 RQA 指标:确定性(DET)、熵(ENT)和层状性(LAM)。两组患者的这些特征的三维散点图(图 3g-3i)显示出高度分离的集群,尤其是在屏气和深呼吸时。这表明这些 RQA 指标具有很强的鉴别力。此外,图 3j-3l 比较了两组的六个 RQA 指标。这些 RQA 指标的比较结果显示了健康受试者和 COVID-19 患者呼吸行为的重要特征数据。然而,我们必须认识到,并非所有指标在每种呼吸状况下都显示出显著差异,这反映了 COVID-19 对呼吸动力学的复杂影响。因此,量化这些特征的统计意义对于在 ML 模型中明智选择研究特征至关重要。
特征选择和机器学习模型
在本研究中,在对呼吸信号进行特征提取和详细分析后,通过特征选择阶段缩小了最相关特征的范围。这样就能将重点放在突出的属性上,并有效降低数据集的维度。图 4 展示了这一过程,图中显示了三种呼吸测试的结果:正常呼吸、屏气和深呼吸。
图 4a-c 显示了使用 Kolmogorov-Smirnov (KS) 统计量对四个特征组的特征进行优先排序的结果:时域、频域、峰值分析和 RQA。对于正常呼吸,这些特征组中最突出的特征是通量平均值、NPSD、Prom std 和 ENT。在憋气时,通量 BF std、平均 freqAll、Prom AF 平均值和 ENT 是最容易识别的特征。在深呼吸中,峰值2峰值AF、PSDAll 平均值、Prom AF std 和 LMAX 是最有提示性的特征。这些见解为区分健康受试者和 COVID-19 患者提供了重要指导,并反映在初步特征提取和分析中。
使用流形学习的 t-SNE 方法对复杂特征空间进行可视化的结果如图 4d-f 所示。这些三维图结果突出了健康受试者和 COVID-19 受试者在转换特征域中的区别,并强调了所选特征的鉴别能力。
选择特征后,在 COVID-19 病例上训练 ML 模型,并评估它们区分 COVID-19 病例和健康对照组的效果。由此产生的混淆矩阵(图 4g-i)是每个模型分类能力的缩影,显示了区分两个队列的显著准确性。此外,还进行了五部分交叉验证,并绘制了接收者操作特征曲线(ROC)(图 4j-l)。这里,曲线下面积(AUC)量化了每个模型的分类能力。值得注意的是,对于正常呼吸,精细高斯 SVM 模型的灵敏度为 99%,特异度为 94.1%,平均 ROC 曲线面积 (AUC) 为 0.954。对于屏气,袋装树模型的灵敏度稍低,为 94.1%,特异性为 90%,但其 AUC 值为 0.962。对于深呼吸,粗高斯 SVM 模型表现最佳,灵敏度为 99%,特异性为 94.1%,AUC 值为 0.956。
这些在多个呼吸测试和多重多重模型中进行的评估表明,本研究中的特征选择非常严格,随后的模型能够高精度地区分 COVID-19 患者和健康受试者。
总结
本文结合磁性呼吸传感技术(MRST)和机器学习(ML)的优势,提出了一种对 COVID-19 及其变种进行实时监测和诊断的开创性方法。该研究强调了呼吸信号特征在区分 COVID-19 患者和健康人方面的有效性,为全球抗击该流行病做出了重要贡献。