图1-1956年达特茅斯会议上的那些AI界大神们
来源:产业智能官
最近几年,随着AlphaGo逐渐干掉了人类的顶级棋手、波士顿“大狗”不断进化的能力使得人们对人工智能充满了期待,人工智能的热潮席卷了大学、企业,春风也吹进了工业这个一直处于默默无闻的领域,据说“工业才是AI的试金石”—所以大量的商业AI领域的企业也想进军工业领域,以证明自身的硬核,这使得默默无闻了数十年的制造业开始变得具有了“Fashion”的氛围,时下,如果你不谈谈人工智能,就会显得落后了,人们似乎忘记了,自从1956年达特茅斯会议定义了“AI”这个词以来 ,其实AI就已经经历过几次大起大落,人们寄予厚望—似乎又要回到“西部掘金”的那个年代。
我们一直走在一个不被称为AI的AI道路上
今天我们为什么探讨的各种AI主要在“学习”,监督/非监督、强化、深度学习?在过去的几十年里,连接主义学派主要在研究“大脑”(Brain)的神经系统传递与堆叠形成的智慧,而符号主义则在研究心智(Mind)的逻辑推理获得判断的智慧,行为主义则关注“行动”(Action)反馈与执行,经过各种曲折的过程,人们发现 “学习”是人类智慧的起源,这也是今天主要在讨论机器学习的原因。而行为主义—来自于维纳“控制论”的智能这个学派则默默无闻的工作着,只是一种自下而上的过程经常被认为不是人工智能,但是,它在现代机电控制、控制工程领域却做出了杰出的贡献。
图2-维纳《控制论》代表着“行为主义”学派的发端
其实在模糊控制、自适应控制领域,包括数据驱动的很多控制方法上,自动化领域一直沿袭着行为主义的“测量、反馈、控制、执行”的这个闭环思想,在对非线性、不确定扰动等工程问题进行着不懈的探索,有时候,我们需要为自己正名—就是自动化本身就是一个AI的学派分支。
机器学习的分类
图3所示机器学习的主要方法包括监督、非监督和强化学习,对应的一些算法和模型,当然,这个我们用户不用关注,主要是看解决哪类问题,使用什么样的算法会比较好。
图3-机器学习的分类
数据集的一个样本(Instance)是有属性(Attribute)、和特征(Feature),如果样本有“标签”(Label),就是一个监督学习的样例(Example),监督学习和非监督学习是比较常用的方法,但是,在工业中很多时候无法对数据打标签或打标签工作量巨大,算法可以自动分析训练集中的数据的相似和相异进行分类形成模型,而强化学习与监督与非监督学习的区别在于它不同于监督和非监督学习从历史经验中学习,而是一种基于环境对行为收益的评价来改进自身的模型,就相当于我们鼓励小孩子的行为—如果她勇敢的提问,就鼓励她这样的行为,她就会形成积极发言的品质,但是我们要惩罚她乱丢垃圾,她就会养成良好的生活习惯,这里需要给她一个评价。而迁移学习则是将一个数据丰富的源领域的知识迁移到一个数据匮乏的目标领域,因为迁移学习可以实现“知识复用”,因此具有较为广泛的前景。
人工智能真的是无所不能吗?
对于人工智能市场的炒作热度,工业界相对保持比较冷静的态度。贝加莱方案研究院院长陈妮亚博士是一个有多年AI算法研究和实践的专家,她对此表示“在工业领域,AI还有很长的路要走,并且AI就目前来看,能够应用的场景是有限的”,当然了,陈妮亚博士并非要给大家泼冷水,而是希望大家冷静客观、遵循科学规律来认识、学习、分析、实践AI的工业应用。
图4-贝加莱方案研究院院长陈妮亚博士
“因为工业用户是非常苛刻的,必须有现实的商业价值,而不能仅仅是单纯的学术研究。必须能用AI解决现场实际的生产问题,提升效率、降低成本、提高质量,才能用实际价值吸引更多的投入。我们方案研究院的工作聚焦于通过机械、电气控制、智能算法与模型以解决产业的实际问题”。
图5-数据到智慧的过程(图片源于网络)
图5是一张普遍流传于互联网世界的图,这张图非常形象的向我们描绘了数据、信息、知识、洞见、智慧的过程,从数据到处理为价值的信息、形成领域知识、并对其中的关联清晰的把握与洞察,就无法形成所谓的“智慧”-判断与执行力,因此,在整个人工智能中,就目前而言,人依旧扮演非常关键的角色来对数据信息进行预处理,并设计合适的特征值再进行训练验证,机器干的都是“蛮力”,算力比较高。
因此,从这个角度来说,人工智能能做什么,取决于人的需求以及对它的规划和设计。
相对于模型驱动而言,数据驱动的方法更适合于解决非线性系统的问题,而这个就是AI擅长的。
为啥以前不用现在开始热闹了?
那么为啥以前大家不关注AI现在开始关注了呢?其实有以下几个原因:
1.算力变得便宜了:制造业里大家都是锱铢必较的,不是说先进就好,得经济,只有经济性才能真正推动下去,技术实现成本低,而且简单易用才行,现在随着芯片技术的进步,一个手机的算力都顶得上当年APOLLO工程的整个计算机的算力,因此,这个技术推动力具有了。
2.软件成熟了:随着IT技术的发展,在与AI开发相关的领域的软件工具也变得更为简单易用,这使得AI具有了一定的普及的基础。
3.竞争太激烈了:其实,制造业是很苦的,竞争压力大,不断得想办法节省那么一点点材料、一点点时间,但是,累积下来就是一笔不少的利润,谁的良品率比别人高1%那就是丰厚的利润回报,工艺切换速度比别人快几分钟,就是真金白银的竞争力,随着在传统的机理模型下的潜能不断的被压榨,人们开始在寻找更为精细的生产工艺改进,以前基于安全考虑的PID参数就不能满足要求了,得动态的随着外外界条件变化来解决问题了,随着制造业的业务挖潜的需求,使得对于AI来解决一些传统解决不了的问题的需求变得更多了。
商业人工智能与工业AI的差异在哪里?
但是,毕竟工业与商业还是两个不同的世界,这使得在商业领域的成功较难在工业领域里进行复制,必须进行一些“改造”才能更好的进行应用,如表1我们所列了工业中的AI与商业中的一些不同。
表1-商业与工业AI的异同
工业哪些场景需要AI支持呢?
陈妮亚博士在2020年3月6日贝加莱橙色讲堂中分享了她对AI工业应用的几个有价值场景的认识,包括了几个重要的方面。
1. 智能导引
今天智能制造的推进,使得业务端更为个性化的生产需求,而这使得制造产线经常会遇到变化,因此在离散的制造业存在大量的“非标”产线—更确切的说,几乎每个产线都是定制的,而且生产不断的变化,这会让工厂运营商出现大量的机械调整与修改,在制品物流成为了一个非常关键的一环,包括生产单元间的输送等,而机器人则具有更好的灵活性,那么给机器人配置一个“眼睛”,让它去学习工作场景(零配件、加工路径上的工装夹具、任意位置的摆放)中的变化并指引机器人去抓取,就变得十分必要。灵活、复杂、多变的场景,常需要AI 算法的介入,以获得高精度的识别性能。
2. 预测性维护
传统的基于模型驱动的预测性维护已经有数十年的历史,但是,其主要针对的是类似于飞机、大型燃气发电机组这类重型设备。工业领域需要特别专业的人经过数十年的积累,通过数据驱动的学习模式可以缩短这个过程,并且可能挖掘出更多的潜在信息。借助于云计算、边缘智能的基础设施与能力,来推进更为广泛的工业场景预测性维护是一个非常有前景的领域,如图6。
图6-预测性维护是一个最为普遍的AI应用场景
3. 缺陷检测
随着电子制造技术的发展,制造视觉系统的元器件本身也变得便宜了,而视觉又是具有非常多的感测能力的(中心点计算、测量、匹配…非常多的可用场景),尤其是为了保障不良品不流入下一个工序,大量的视觉缺陷检测将被用于产线,同样也是一个场景变化非常大,无法有效的构建新的程序并大量测试验证,因为对于个性化生产来说,没有足够的批量进行物理测试验证生产已经结束了,那么就需要最为具有广泛适用性的缺陷检测模型来对各种变化的场景进行建模,形成健壮的模型对新的产品进入获得认知,进行分拣、剔除等动作。
4. 参数寻优
在传统的控制中,都是针对一个静态的控制过程,并且参数往往基于安全值控制的角度来进行,那么,这并非是最优的,而是最安全可靠的,而在动态的变化中,如加速、减速过程、快速工艺切换的过程中,这些都会造成浪费,如何在系统中为各种变化的生产状态提供最优的参数,这个可以通过大量的学习来寻找最优值的组合。
整体来说,机器学习在硬件成本下降、灵活度及复杂性提高的行业大趋势中,凸显了它的优势。而传统的模型驱动会需要较长的时间与经验积累,较难在灵活的应用场景中达到简单易用的效果。
当然,说到了机器学习,那一定要来点干货—不过,请诸位读者谅解,只能给大家聊个概括,因为机器学习就是这样,依赖于领域专家的智慧,如何选择特征值,如何对数据清洗、降维、如何去设定评判标准等过程,都是非常依赖于贝加莱机电工程与AI专家的洞察(Insight),就像网上经常流传的这张图一样。
贝加莱工业AI的架构如何搭建?
如图7所示,贝加莱其实具有各种场景和组合下的机器学习架构。
图7-贝加莱可支持的机器学习架构
其实,普通的控制器就可以做一些简单的学习—想想,AI就是一个程序啊!贝加莱这个控制器本来就可以高级语言编程(追溯到1993年),当然了,控制器本身主要业务是干控制,真正想干AI大的任务还是得用贝加莱集成Hypervisor技术的APC,这个可以支持Windows或Linux可以去处理AI程序开发和与控制任务(RTOS核)交互,PCIe的卡槽里可以插入一个华为ATLAS加速器这样的大算力,然后通过OPC UA到云端训练,下载到AI加速器上本地推理,并与运动控制、机器人进行交互,就可以干智能导引、缺陷检测与处理、预测性维护、参数寻优等活啦!
当然,说起来就是这么简单,做起来还是需要兼通AI、控制、机电的专家一同来开发。
举例:
例1:前沿送纸机构精准的送纸是模切质量与效率保障的关键,其传动采用伺服的电子凸轮曲线来完成,在运动过程中,纸张的规格、类型、速度、加速度、机械磨损等都会影响送纸的精度,如何让机器更为“智能”,即,如何自主根据变化来适应获得最佳的凸轮曲线参数,电子凸轮曲线由多个多项式构成,如图8所示,而每段有速度、加速度、加加速度作为参数,如何为其制定最佳工艺?
图8-电子凸轮曲线的参数寻优
在这个项目中,工程师们为当前的CAM曲线控制叠加了一个“成本函数”来约束它,并不断训练以获得该函数最小值,该成本函数有两种状态,一种是可微分状态那就意味着可以采用梯度策略来处理,而另一种则是不可微分的状态,采用遗传算法对其收敛过程进行学习,并判定最终收敛值。
例2:预测性维护
图9-多线切割机
对于多线切割设备(如图9所示)而言,由于晶硅材料成本较高,而且加工精度也比较高,因此,机器的健康状态对于质量非常关键,如果能够早期预测机器故障状态,显然会为生产带来很大的成本和风险的降低。
通过特征提取的非监督学习模式来进行学习过程,在这个系统中,工程师们在众多的参数中(包括电流、电压、温度、速度、位置)中选择了以4个轴承温度为测量点,并构建了温度相关特征提取的策略,确保数据的有效性、内在关联性。
在此基础上,对这些参数进行了适当的算法处理,并获得温度残差,即,温度的斜率 -均值(斜率的均值)得到残差,然后系统对残差数据进行基于三个目标参数的学习,寻找其最优值:
1.检测滑动窗口:W(秒)
2.发散水平阈值: α
3.比例阈值:β
通过大量数据的学习(超过20GB数据),以获取W, α,β的最优组合(考虑到商业机密,此处不再深入介绍)。
衡量系统效果的关键指标在于“检出率”与“误报率”,这两个参数通常成对出现,在设计算法时,追求检出率则会阈值设置比较低,但误报率就会提高,通过设置合适的阈值以寻求最优的故障预测。通过在15台机器上数千刀的裁切过程,获得了91%的检出率及0.1%的误报率,获得超预期的学习效果,由于这个学习仅采用了原本机器就有的温度,没有成本的增加,而如果采用震动传感器的方式,获得更好的检出率和降低误报率。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”