关键词:膝关节声发射、膝关节生物标志物、因果关系、机器学习
声学膝关节健康评估长期以来一直被看作是一种替代临床可用医学成像工具的替代方法,如声发射技术是通过检测膝关节在运动过程中产生的微小裂纹或损伤引起的声波信号,从而评估关节的健康状况。这种技术可以实时监测膝关节在不同活动状态下的声发射信号,帮助医生更准确地诊断和评估膝关节的损伤程度,但这种方法尚未在医疗实践中未得到广泛采用。目前该领域由处理声学特征的机器学习模型引领,这些模型已经展示了有希望的诊断性能。然而,这些方法忽视了音频信号的复杂多源性质和起作用的基本机制。
1、声学特征与膝关节健康状态相关
- 使用声学特征进行膝关节健康分类可以达到96%的准确率,表明声学特征与膝关节健康状态之间存在关联。
- 对公开的关节炎患者数据集进行复制,发现一个33kHz的外部噪声成分,在去除该噪声后,分类准确率显著下降,表明该噪声成分与患者健康状态相关。
- 在膝关节手术患者实验中,使用声学特征进行分类可以达到75%的准确率,同时声学特征还反映了左腿和右腿的差异,表明特征与健康状态之间存在关联。
- 使用特定声学特征,如Mel频率倒谱系数,成功区分健康和患病膝关节,显示声学特征与膝关节健康状态相关。
2、当前基于机器学习的方法在诊断膝关节疾病方面存在的问题
- 缺乏验证:当前的机器学习方法缺乏对膝关节生物标志物的验证,仅依赖分类准确率不能充分证明声学特征是生物标志物。
- 未考虑多源特性:未充分考虑声学信号的多源特性,即未将信号中的信息归因于不同的来源,例如膝关节机制或外部干扰。
- 忽视偏差来源:忽视外部信息源对分类任务的潜在影响,可能导致分类性能的虚高。
- 缺乏因果探究:缺乏对声学特征的因果探究,仅依赖统计差异无法直接推断声学特征与膝关节健康之间的因果关系。
- 缺乏严谨实验设计:一些研究缺乏严谨的实验设计,未考虑环境条件、传感器等因素对结果的影响。
- 样本量小:部分研究的样本量较小,可能增加外部信息源对分类的影响。
- 标签定义不明确:一些研究对健康状态的标签定义不够明确和准确。
3、模拟实验
3.1 预期对声学特征解释的影响
- 实验设置:使用同一受试者在5天内收集的膝关节声学数据。
- 实验方法:将数据分别解释为健康/不健康,发现相同的声学数据在不同预期下解释为不同的特征,表明仅凭分类准确率无法确定因果关系。
3.2 实验协议对结果的影响
- 实验设置:复制公开数据集,包含18名健康和25名关节炎患者。
- 实验方法:发现一个外部噪声成分导致分类准确率下降,说明环境条件的一致性对结果至关重要。
3.3 可穿戴设备对结果的影响
- 实验设置:使用两种不同可穿戴设备收集16名患者膝关节声学数据。
- 实验方法:发现设备差异可能成为外部信息源,导致性能膨胀。
通过三个模拟实验,我们发现仅凭高分类准确率无法充分证明声学特征与膝关节健康状态之间存在因果关系,需要综合考虑外部信息源的影响,进行因果推断验证。
4、如何确认声学特征与膝关节健康之间的因果关系
4.1 理论分析
建立理论框架,描述膝关节健康状态如何影响理想振动信号,以及实际测量中可能存在的偏差。
- 将膝关节的健康状态H和其理想振动V进行假设性关联,但由于无法直接测量V,实际测量的是V的近似值~V。
- 通过函数g将~V映射为声学特征X。
- 使用分类器f对X进行训练,以推断膝关节的健康状态Y。
- 提出考虑多源性的贝叶斯公式,将分类问题分解为源识别和源特定分类两部分。
- 通过控制外部信息源的影响,即最小化第二部分求和项,可以验证声学特征是否反映膝关节健康状态。
- 外部信息源的影响可以通过三种方式控制:使外部观察独立于健康状态,屏蔽传感器不受外部干扰,或在实验环境中去除外部源。
- 通过上述方法可以验证声学特征是否反映膝关节健康状态,从而验证它们作为生物标志物的有效性。
4.2 验证实验
通过严谨的实验设计来控制外部信息源的影响,确保分类性能的提高是基于膝关节健康状态的变化,而不是其他因素。
- 反事实思维实验:使用同一受试者连续5天的膝关节声学数据,分别作为5个不同受试者的数据,考察不同健康状态预期对结果的影响。
- 复制公开数据集实验:对公开的膝关节关节炎患者数据集进行复制,考察环境噪声对分类结果的影响,并通过手动检查声学信号和分频带分类进一步分析。
- 膝关节手术患者实验:使用自制的装置收集16名膝关节手术患者的声学数据,考察不同装置对分类结果的影响,并通过特征分析揭示数据结构对结果的影响。
4.3 多源分解
将分类问题分解为源识别和源特定分类,考察外部信息源对分类的贡献。它可以帮助区分来自膝关节内部结构和其他外部因素(如环境噪声或设备噪声)的信号。
- 定义信息源和观测:定义一组可能的信息源(如膝关节和外部噪声),并确定每个源对应的观测(如膝关节声和噪声声)。
- 估计源概率:估计每个源在实验中发生的概率,以及传感器检测每个源的概率。
- 源识别模型:建立一个模型,根据观测估计最可能的源,即估计观测来自每个源的似然概率。
- 分解算法选择:选择合适的算法进行多源分解。常见的算法包括独立成分分析(ICA)、主成分分析(PCA)、盲源分离(BSS)等。
- 应用分解算法:将所选算法应用于信号特征,以分离出不同源的成分。这可能需要多次迭代和优化。
- 源识别和验证:识别分解后的成分各自属于哪个源,并验证这些成分的正确性。这可能需要领域专家的知识或额外的数据。
- 解释结果:对分离出的信号源进行解释,理解它们对整体信号的贡献和意义。
- 迭代优化:根据结果反馈,可能需要返回到前面的步骤,调整模型或算法参数,以改进分解的效果。
4.4 统计与因果检验
除了统计分析外,还进行因果推断检验,如条件独立性检验,以验证特征与状态的因果关系。这提供了更严格的证据支持。
4.5 重复实验
进行重复实验,以验证结果的稳健性。独立的结果复制有助于提高结论的可靠性。
4.6 专家知识
在膝关节振动信号分析的案例中,生物医学工程师、骨科医生、生物统计学家等专家的知识和经验对于理解信号的生物力学特性、区分正常和异常信号以及解释多源分解结果至关重要。通过与这些专家紧密合作,研究人员可以更准确地进行数据分析,解释特征变化与膝关节健康状态变化之间的内在机制,这有助于建立特征与状态之间的直接联系。