AI工业大模型报告:体系架构、关键技术与典型应用

研究意义

随着新一代人工智能的发展, 大模型(如 GPT-4o 等)凭借大规模训练数据、网络参数和算 力涌现出强大的生成能力、泛化能力和自然交互能力, 展现出改变工业世界的巨大潜力. 尽管大模型 已在自然语言等多个领域取得突破性进展, 但其在工业应用中的探索仍处于初级阶段, 当前工业大模 型的系统性研究仍属空白. 工业应用中特有的异质数据模态、复杂多样的专业化场景、长流程的关 联性决策、以及对于可信性实时性的高要求, 使得通用大模型无法直接用于解决复杂的工业问题, 亟 需开展全新的工业大模型基础理论和关键技术研究. 本文系统地探讨了工业大模型的挑战问题、概 念内涵、体系架构、构建方法、关键技术与典型应用. 从五个挑战问题的分析出发, 提出了工业大模 型的全新定义和体系架构;同时, 提出了工业大模型的四阶段构建方法, 阐述了工业大模型核心关键 技术;然后, 基于所提出的工业大模型六种核心应用能力, 探讨了面向产品全生命周期的工业大模型 典型应用场景, 并给出了”基石“工业大模型原型系统在生成式人工智能方面的应用实例;最后, 探 讨和展望了工业大模型未来的研究方向和开放性问题. 本文将为工业大模型这一全新研究方向的开 辟与发展, 提供基础理论、关键技术和行业应用的全面指导。

本文工作

近年来, 大模型(如 GPT-4o 等)凭借大规模训练数据、大规模参数、大规模算力涌现出传统 AI 模型所不具备的强大的生成能力 [1]、泛化能力和交互能力, 在语言的理解和生成、图像的识别和 生成等任务中展现了令人惊叹的能力. 在自然语言处理领域 [2] , 大模型能够生成高质量的文本并完。成复杂的对话任务;在计算机视觉领域 [3] , 大模型能够实现精准的图像识别并生成高保真的图像或 视频. 此外, 大模型还在医学 [4]、教育 [5] 等专业领域展现出巨大的应用潜力, 通过对领域数据的学 习, 提供准确的问答、诊断、预测和决策支持. 大模型已成为迈向通用人工智能的里程碑技术 [4,6] . 工业制造业是立国之本和强国之基, 建设制造强国是我国的重大战略决策. 在新一代信息通信 技术的推动下, 制造业正从数字化网络化迈向智能化的全新发展阶段 [7] . 如何推进人工智能赋能新 型工业化, 培育面向工业领域的大模型, 推动人工智能与实体经济深度融合, 成为当前重要的国家创 新战略. 欧美发达国家已开始探索大模型在工业领域的应用. 例如, 西门子采用 ChatGPT 来自动生 成可编程逻辑控制器(PLC)代码 [8] , OpenAI 采用多模态大模型操控机器人并尝试在宝马制造车间 从事简单的抓取工作 [9] , 英伟达正在基于大模型打造通用人形机器人平台 [10] . 当前国内外的研究主 要是利用已有的通用大模型尤其是大语言模型, 尝试来解决工业制造业的具体问题. 学术界和产业 界对于工业大模型的巨大发展潜力抱有极高的期待. 然而, 工业制造业的复杂性, 使得工业大模型的 发展面临以下严峻挑战.

挑战一:工业跨模态协同难. 通用大模型擅长处理文本、图像、视频等常见数据模态, 来源于互 联网等公开数据获取渠道, 然而通用大模型对于工业制造业难以获取的特有数据模态如 CAX 模型、 传感信号、工艺文件、机器指令等知之甚少. 工业场景中多模态数据融合处理时存在异质性和同步 性问题, 例如不同类型的传感数据有不同的采样率和数据格式, 存在信息冗余和语义不一致性, 大模 型难以对复杂异质的工业数据模态进行有效对齐和协同. 导致这一问题的原因是大模型缺乏对工业 复杂模态数据特性的深刻理解, 导致其在跨模态数据协同处理上能力有限.

挑战二:工业高可信输出难. 通用大模型对于输出的精准性可靠性没有统一的严格要求, 能够容 忍一定程度的幻觉现象. 而工业应用要求极高的准确性和可靠性, 如机械臂协作装配的精确控制等. 现有大模型建立在概率预测的基础上, 输出结果不确定性高, 难以满足工业任务的高精度要求. 导致 这一问题的原因是大模型的概率特性和非目标驱动特性, 导致其难以学习到任务背后的工业机理和 规律. 此外, 多任务优化与单任务的冲突使得模型在处理高精度任务时可能出现信息冲突和遗忘, 降 低了单任务的性能.

挑战三:工业多场景泛化难. 通用大模型当前常见的文本或图像内容生成、知识问答等应用场 景具有较为统一的底层逻辑, 并且大多可基于对话界面完成场景任务. 而工业领域产品全生命周期 涵盖多类不同的应用场景, 例如研发设计、生产制造、试验测试、运维服务等, 不同行业不同场景任 务需求各异, 且生产任务需要机器设备执行才能完成, 大模型难以适应复杂多变的工业场景. 导致这 一问题的原因是大模型对于工业多学科跨领域专业知识的泛化能力不足, 并且工业场景中存在大量 硬件设备交互任务, 导致当前大模型主流应用范式无法适应复杂的工业场景.

挑战四:工业多流程关联难. 通用大模型应用场景涉及的多流程关联逻辑性任务较少. 而工业 制造业应用则离不开具有内在关联的多流程业务, 各个流程任务之间的关联和依赖关系往往非常复 杂, 例如跨企业多工序多因素耦合的质量问题追溯与根因分析, 如何实现多个流程任务的有效关联和 协同是一个重要挑战. 对于复杂的工业流程语境和任务间的动态关系, 大模型难以全面理解和认知. 导致这一问题的原因是大模型缺乏对复杂流程的深层次任务关联和长期记忆能力, 导致其难以有效 处理多流程任务.

挑战五:工业高实时推理难. 通用大模型对于应用的实时性没有统一的高要求. 而工业现场应 用如设备控制等具有严格的实时性要求(例如毫秒级), 同时又受到算力设施的限制, 因此大模型在工业边缘实时应用中面临资源受限的挑战. 现有轻量化方法如模型剪枝、量化等, 虽然在压缩率和加 速效果方面取得了一定进展, 但仍然无法满足工业边缘轻量实时应用的高要求. 导致这一问题的原 因大模型具有庞大的参数规模并且需要激活大部分的计算单元来执行工业任务, 难以在工业边缘有 限的计算资源下实时运行.

从上述挑战分析可见, 当前通用大模型无法直接用于解决复杂的工业问题, 因此工业大模型并不 是通用大模型在工业领域的一套垂直应用解决方案, 而亟需开展全新的工业大模型基础理论和关键 技术研究, 当前国内外关于工业大模型的系统性研究仍属空白. 本文提出了工业大模型的全新定义, 提出了工业大模型体系架构, 包括基础设施层、基座层、模型层、交互层、应用层;同时, 提出了工 业大模型的四阶段构建方法, 阐述了工业大模型核心关键技术;基于所提出的工业大模型六种核心 应用能力, 探讨了面向工业制造业全生命周期的大模型典型应用场景, 并给出了”基石“工业大模型 原型系统在生成式人工智能方面的应用实例;最后, 探讨和展望了工业大模型未来的研究方向和开 放性问题.

构建方法

工业大模型是面向工业产品全生命周期应用的、具有大规模参数的深度学习模型体系, 包 括工业基座大模型、工业任务导向大模型、工业行业领域大模型等不同层次和类别的模型系统, 具有 工业数据和机理知识融合驱动、工业专业化内容生成、高可信高可靠输出、工业多场景跨域任务学 习与自适应、工业多模态融合交互、人-智能体-工业系统协同、算力与效率灵活适配等主要特征, 具 备智能问答、场景认知、过程决策、终端控制、内容生成、科学发现等核心任务能力, 能够适配离散 行业和流程行业不同行业领域、不同工业任务, 为产品研发设计、生产制造、试验测试、经营管理、 运维服务等全业务域智能化升级提供基于大模型的新应用范式和新方法技术.

工业大模型的构建主要包括以下4个阶段:工业数据制备,工业基座模型训练,工业任务/行业模型适配,工业场景交互应用,如图2所示。

应用场景

与通用大模型不同,工业大模型面向工业应用的需求,在其独特的架构和训练方法的支持下,形成6种核心应用能力,包括智能问答、场景认知、过程决策、终端控制、内容生成和科学发现。工业大模型贯穿产品全生命周期、围绕六项核心应用能力的典型应用场景。工业大模型在实际工业生产流程中可以将工业智能体作为载体之一,与工业场景中所涉及的人员与工业赛博物理系统进行交互完成特定任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/60820.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电子电气架构 --- 电动汽车 800V 高压系统

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 所有人的看法和评价都是暂时的,只有自己的经历是伴随一生的,几乎所有的担忧和畏惧…

shell编程之变量与引用

目录 深入认识变量什么是变量变量的名称变量数据类型变量的定义自定义变量环境变量位置变量 变量赋值和作用域赋值:变量名变量值read从键盘读入变量值变量和引号变量的作用域变量的运算 深入认识变量 什么是变量 变量是在程序中保存用户数据的一段内存存储空间&am…

UE5 材质里面画圆锯齿严重的问题

直接这么画圆会带来锯齿,我们对锯齿位置进行模糊 可以用smoothstep,做值的平滑过渡(虽然不是模糊,但是类似)

鸿蒙HarmonyOS开发:一次开发,多端部署(工程级)三层工程架构

文章目录 一、工程创建1、先创建出最基本的项目工程。2、新建common、features、 products 目录 二、工程结构三、依赖关系1、oh-package.json52、配置ohpm包依赖 四、引用ohpm包中的代码1、定义共享资源2、在common模块index文件中导出3、在phone模块oh-package.json5文件中引…

【笔记】关于git和GitHub和git bash

如何推送更新的代码到github仓库 如何在此项目已经提交在别的远程仓库的基础上更改远程仓库地址(也就是换一个远程仓库提交) 如何删除github中的一个文件 第二版 删除github上的一个仓库或者仓库里面的某个文件_github仓库删除一个文件好麻烦-CSDN博客 …

20241112-Pycharm使用托管的Anaconda的Jupyter Notebook

Pycharm使用托管的Anaconda的Jupyter Notebook 要求 不要每次使用 Pycharm 运行 Jupyter 文件时都要手动打开 Anaconda 的 Jupyter Notebook 正文 pycharm中配置好会自动安装的,有的要自己配置 Pycharm中配置 文件 ——> 设置 ——> 语言和框架……&am…

集合的介绍与比较器的应用

1.集合: 是一种容器,一种变量类型,跟数组很像 数组的缺点: A.数组的空间长度固定,一旦确定不可以更改。多了浪费,少了报错。 B.使用数组 操作数据的时候,【删除,增加】效率比较低。…

动态规划---解决多段图问题

ok 小伙伴们,我现在有点小小的红温,有点毛躁。 怎么解决多段图问题呢?求取最短路径有多种方法可取。 家人们,毫无思绪可言……………………………… 要实现动态规划,条件:子问题重叠度较高,并…

基于Spring Boot的在线性格测试系统设计与实现(源码+定制+开发)智能性格测试与用户个性分析平台、在线心理测评系统的开发、性格测试与个性数据管理系统

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

cMake编译github中源码

https://github.com/gflags/gflags 记录一下防止遗忘,本次编译为gflags库 1.下载CMake-gui https://cmake.org/ 安装时,选择自动创建环境变量,安装完输入,查看是否安装成功 cmake --version 2.下载源码,解压打开文…

web——upload-labs——第四关——.htaccess文件绕过

先尝试直接上传一个普通的一句话木马 显示此文件不允许上传,这道题并没有提示不允许上传什么后缀的文件,经过尝试,基本上所有后缀能够被解析为php语句执行的文件都不能成功上传。试试正常的图片能不能上传: 我们再来试试图片马能不…

Gitcode文件历史记录查看和还原

文件历史记录 文件历史记录用于记录代码文件的更改历史,它允许用户查看文件的不同版本,了解每个版本的修改内容、作者和提交消息。这对于跟踪文件演进、恢复错误更改、审查代码以及了解项目进展都非常有用。 文件历史记录功能提供了以下核心功能&#…

前端神经网络入门(二):如何利用 WebGPU 进行数值计算,实现大规模数据的计算加速?- 边读边按下F12跑代码吧

在 Web 应用开发中,JavaScript 是前端开发者们最常用的语言。然而,当面对大规模数据处理和计算任务时,JavaScript 在浏览器中的执行往往会受到诸多性能瓶颈的限制。幸运的是,WebGPU 的出现,为我们提供了在前端实现高性…

新手教学系列——善用 VSCode 工作区,让开发更高效

引言 作为一名开发者,你是否曾经在项目中频繁地切换不同文件夹,打开无数个 VSCode 窗口?特别是当你同时参与多个项目或者处理多个模块时,这种情况更是家常便饭。很快,你的任务栏上挤满了 VSCode 的小图标,切换起来手忙脚乱,工作效率直线下降。这时候,你可能会问:“有…

Oracle故障处理:ora-12514 与 ora-28547

目录 项目场景 问题分析 问题总结 项目场景 现场同事求助说:有个刚刚部署在Windows上的Oracle11gR2数据库(单机单实例),使用PLSQL工具连接不上。帮忙查看后,发现未装Oracle client,指导其安装完Oracle客…

【miniMax开放平台-注册安全分析报告-无验证方式导致安全隐患】

前言 由于网站注册入口容易被机器执行自动化程序攻击,存在如下风险: 暴力破解密码,造成用户信息泄露,不符合国家等级保护的要求。短信盗刷带来的拒绝服务风险 ,造成用户无法登陆、注册,大量收到垃圾短信的…

26-ES集群搭建、身份认证配置

虚机搭建 添加es用户 elasticsearch 默认不允许root用户启动,所以需要创建es用户 useradd elasticsearch passwd elasticsearch 解压安装包 #解压es tar -xvzf elasticsearch-7.14.2-linux-x86_64.tar.gz 将文件夹赋予es用户权限 #将文件夹赋予es用户权限 sud…

OpenHarmony的公共事件

OpenHarmony的公共事件 公共事件简介 CES(Common Event Service,公共事件服务)为应用程序提供订阅、发布、退订公共事件的能力。 公共事件分类 公共事件从系统角度可分为:系统公共事件和自定义公共事件。 系统公共事件&#…

【AlphaFold3】开源本地的安装及使用

文章目录 安装安装DockerInstalling Docker on Host启用Rootless Docker 安装 GPU 支持安装 NVIDIA 驱动程序安装 NVIDIA 对 Docker 的支持 获取 AlphaFold 3 源代码获取基因数据库获取模型参数构建将运行 AlphaFold 3 的 Docker 容器 参考 AlphaFold3: https://github.com/goo…

npm list -g --depth=0(用来列出全局安装的所有 npm 软件包而不显示它们的依赖项)

您提供的命令 npm list -g --depth0 是在 Node Package Manager (npm) 的上下文中使用的,用来列出全局安装的所有 npm 软件包而不显示它们的依赖项。 这是它的运作方式: npm list -g --depth0-g: 指定列表应包括全局安装的软件包。--depth0: 限制树形结…