文章目录
- day20
- 设备对象维度
- 建模方法维度
- 专家规则驱动的方法:AI-FIT-PM过程模型
- 少量样本驱动的方法
- 数据驱动的方法
- 软件维度
day20
今天是第20天,昨日是对第九章节行业知识沉淀中知识工程、维度模型、模式要素模型进行讲解,尤其是维度模型中维度分为:模型要素、设备对象、建模方法、软件功能,今日主要针对剩余维度进行阐述
设备对象维度
针对设备对象维度,可以使得沉淀出来的模型在同一类设备上具有普适性,可以提高模型重用度,主要因为大量设备中存在很多共性的单元以及不同类型的工业单元的故障原因或故障现象应该是类似的。针对一个设备,可以围绕故障模式,从FTA、FMECA(故障模式、影响及其危害性分析)、RCA(根因分析)等不同角度去分析
- FTA:从设备结构的角度去分解故障模式
- FMECA:定量给出了故障频度、故障影响,帮助筛选重要的故障模式
- RCA:可以进行深层次故障原因分析
建模方法维度
从建模方法维度判断,工业中的研判逻辑可以分为三类
- 专家规则:存在相对明确的逻辑,也包括机理模型的情形,存在相对可靠的机理模型。根据实测值和机理模型输出的残差趋势进行研判
- 数据驱动的监督学习:存在大量的标记样本,通过监督学习等算法,构建研判模型,属于经典的机器学习问题
- 典型样本学习:存在少量的标记样本(正常样本或异常样本),通过相似度来评价一个新样本正常与否
三种建模方式对比如下图,但是三种方式也可相互转换
专家规则驱动的方法:AI-FIT-PM过程模型
主要是分为7个阶段:
-
需求分析:明确业务需求和专家知识系统的定位,初步评估业务价值和数据基础支持度
-
知识获取:需要与领域专家协同完成,根据系统结构与工作原理梳理出定性的领域知识,比较典型的专家知识的获取办法有三种
- 逻辑分解与推理方法,采用合适的结构化模型,通过因果推演和逻辑分解的方法,推动专家经验的沉淀,避免访谈过程的发散
- 案例归纳法:从现有的案例文档,归纳总结并抽象形式化,形成具有一定通用性的规则
- 现有研判逻辑文档的精化方法,通常适用已经有了初步的研判规则,但不精准的场景
-
知识形式化表达:将知识转换为形式化业务规则,进一步消除歧义,这一阶段包含两个小步骤
- 规则逻辑流图描述:用相对严格的业务规则流图,对上面总结的定性运行经验进行刻画,并补充一些隐性的前提条件
- 总结归纳故障描述元语:知识工程师用既有的故障描述元语和业务对象模型进行进一步形式化
-
业务规则开发:将形式化逻辑规则转为可执行计算模型的过程
-
规则测试和评价:
- 专家规则模型开发人员的逻辑检验能力,通过列举反例,不断明确研判规则内的内涵
- 借助海量模拟数据,去检验规则或算子的强壮性,特别是模拟各种数据缺失的场景
- 借助大数据的伪证能力,在大量历史数据计算报警率与预期的报警率相对比,看规则是过松还是过紧
-
部署:需要根据数据通路情况、模型的运行周期,决定模型的运行环境,是在中心部署还是在属地端部署
-
管理与维护:对模型的运行性能、模型本身的性能实现在线监测,对模型性能的下降进行及时处理
少量样本驱动的方法
工业场景上,很多数据都没有标记,这里介绍两种少量样本驱动的方法:
- 基于正常样本的核函数拟合方法:选择若干正常样本作为参考向量矩阵,对于实际的时序,系统基于核函数非参数拟合,估计每个变量的正常预计值,根据预测值和实际值的残差序列进行异常研判
- 基于异常样本的相似度匹配方法:提供异常样本,根据时序相似度算法,在历史数据集上进行自动匹配,业务专家进行确认,机器学习自适应学习,通过多轮迭代,形成稳定的异常模式库和研判准则
数据驱动的方法
软件维度
工业数据分析建模的敏捷性体现在开发效率、迭代速度、部署速度三个方面,图形化界面建模可大大降低建模门槛,业务有一个通用的叫法:算子库。算子库在知识形式化表达时,可有很多共性的算子,比如:缓慢上升、持续振动、存在毛刺之类。算子可分为:通用算子、领域算子、行业算子三类
- 通用算子:数据源、数据预处理、机器学习、数据输出、时序征兆特征等
- 领域算子:主要针对特定的工业分析领域,例如振动分析、热效率分析
- 行业算子:特定行业的算子