0 提纲
机器学习、深度学习、计算机视觉等技术已在勘探开发、油气生产、炼油炼化、经营管理等重点环节进行应用与推广。请思考:
- 输入:数据是什么(数字、文本、图)?如何理解数据?如何清洗数据?(需要专业领域知识)
- 输出:任务是什么(安全检测、层位识别、产量预测等)?
- 方案:传统方案有什么不足?为什么需要人工智能?问题转化(油气领域问题–>人工智能领域问题)?
- 主要方案:小样本学习、迁移学习、主动学习、知识图谱等。
本章的提纲:
- 人工智能基本概念
- 人工智能发展的历史阶段
- 人工智能主要研究领域
- 新一代人工智能关键技术
- 人工智能在勘探开发领域的应用
参考书籍:《油气人工智能》 龚仁斌,李欣,李宁,吴杰文编著 石油工业出版社 2021年9月
1 人工智能基本概念
1.1 初识人工智能
人工智能也被称为AI,是Artificial Intelligence的缩写。谈到人工智能,人工智能的定义到底是什么?
- 达特茅斯会议上对人工智能的定义:是使一部机器的反应方式就像是一个人在行动时所依据的智能;
- 百度百科上显示人工智能的定义:它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;
- 清华大学人工智能研究院张钹院长给出的定义:人工智能是用机器模仿人的智能行为;
- 人工智能是计算机科学的一个分支:它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
1.2 人工智能的价值
人工智能的价值主要体现在:
- (1)改变产业结构:跨界整合,助力升级,如智能选股、智慧交通、智能油气;
- (2)改变城市形态:立体空间,高效管理,如智慧城市;
- (3)改变生活方式:高度自由,简单方便,如扫地机器人;
- (4)改变科技格局:人工智能,领跑世界,如AI助力医药研发。
1.3 计算的诞生:从可计算到不可计算
20世纪初,人们发现有许多问题无法找到解决的方法。于是开始怀疑,是否对这些问题来说,根本就不存在算法,即不可计算。
举例:从费马猜想到费马定理。
费马( Pierre de Fermat ):法国人,律师,业余数学家(1601-1665)。
费马猜想:当整数 n > 2 n > 2 n>2时,关于 x , y , z x, y, z x,y,z的方程 x n + y n = z n x^n + y^n = z^n xn+yn=zn没有正整数解。
证明过程体现了计算能力的提升:
2 人工智能发展的历史阶段
2.1 起源阶段与图灵测试
人工智能之父——艾伦·麦席森·图灵:
图灵测试:测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。
进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。
人工智能的起源–“达特茅斯会议”:
1956年达特茅斯会议的学者们
2006年达特茅斯会议的部分学者重聚达特茅斯
2.2 人工智能的三次浪潮与三种模式
- 逻辑主义模式:主张使用逻辑和数学方法来推导出正确的答案,以及构建人类专家的知识库。
- 连接主义模式:连接主义是一种基于神经网络及网络间的连接机制与学习算法的智能模拟方法。思想来源于仿生学,特别是人脑模型的研究;
- 互联网大数据,深度学习模式:深度学习是从连接主义方法发展起来的,这一范式反映了这样一种假设,即计算网络的连接方式对构建智能机器至关重要。20世纪80-90年代,深度学习表现为联结主义。直到2006年,真正以深度学习之名复兴。深度学习的概念源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本等。
2.3 了解人工智能的三个层次
- 弱人工智能:是指不能制造出真正地推理和解决问题的智能机器,这些机器只不过看起来像是智能的,但是并不真正拥有智能,也不会有自主意识。弱人工智能不具备独立意识,其行为都是设计者的意愿,所以只能在人类设计的程序范围内决策,事情的发展一旦超出了提前预设的程序范围,那么弱人工智能是无法应对的。
- 强人工智能:指有可能制造出真正能推理和解决问题的智能机器,并且,这样的机器将被认为是有知觉的,有自我意识的,可以独立思考问题并制定解决问题的最优方案,和生物一样有自己的价值观和世界观体系。弱人工智能和强人工智能的本质区别在于是否拥有自主意识。严格来说,现在世界上所有的人工智能技术都处在弱人工智能阶段。
- 超人工智能:指一种超越人类智能的人工智能系统。它具有几乎所有领域都超过最优秀的人类大脑所具备的智能、知识、创造力、智慧和社交能力。
2.4 当前阶段人工智能产品的发展现状与不足
人工智能产品“可实用性”开始落地:当前人工智能已经从“空想”“不实用”转变为实用且新产品层出不穷的阶段。尤其在科技发达的国家,人工智能技术的实用性日益增强,成为人们工作、生活的重要帮手。
人工智能产品需求日益增多:随着人工智能技术的不断提升,无论从技术人员还是从需求者来说,对于人工智能产品的需求种类与数量都在于日俱增。基于人工智能的创新产业发展迅猛。“智能+X”应用范式日趋成熟。
特定领域人工智能产品取得突破性进展:面向特定领域的人工智能(即弱人工智能)产品由于应用背景需求明确、领域知识积累深厚、建模计算简单可行,因此形成了单点突破,在局部智能水平的单项测试中可以超越人类智能。
当前阶段人工智能产品的不足:
- 是“专才”,却不是“通才”;
- 有“智商”,却没有“情商”;
- 有“智能”,却没有“智慧”。
举例:
“东北的夏天,有多少穿多少。”
“东北的冬天,有多少穿多少。”
“昨天我骑自行车差点摔倒,幸亏我一把把把把住了。”
问:晚上你想吃什么?
答:吃食堂,吃面,吃大碗儿。
2.5 全球人工智能产业发展现状比较
2.6 我国人工智能产业发展现状与布局
2015年7月,国务院印发《关于积极推进“互联网+”行动的指导意见》;
2016年3月,国务院发布《国民经济和社会发展第十三个五年规划纲要(草案)》,人工智能概念进入“十三五”重大工程。
2017 年 3 月,在十二届全国人民代表大会第五次会议上,“人工智能”首次被写入《政府工作报告》;同年 7 月,国务院发布《新一代人工智能发展规划》,明确指出新一代人工智能发展分三步走的战略目标;同年 10 月,人工智能进入十九大报告;同年 12 月,《促进新一代人工智能产业发展三年行动计划(2018—2020 年)》发布。
2021年9月,浙江大学中国科教战略研究院发布了《重大领域交叉前沿方向2021》,认为当前以大数据、深度学习和算力为基础的人工智能在语音识别、人脸识别等以模式识别为特点的技术应用上已较为成熟,但对于需要专家知识、逻辑推理或领域迁移的复杂性任务,人工智能系统的能力还远远不足。
2021年9月国家新一代人工智能治理专业委员会主任薛澜发布了《新一代人工智能伦理规范》,旨在将伦理融入人工智能全生命周期,为从事人工智能相关活动的自然人、法人和其他相关机构等提供伦理指引,促进人工智能健康发展。
2022年7月26日,工业和信息化部在发布会上称,我国人工智能核心产业规模超过4000亿元,企业数量超过3000家。
中国迈向新一代人工智能,自然子刊《机器智能》, 2020 ,312–316
中国迈向新一代人工智能的挑战和机遇:
- 培育本土人工智能人才;
- 规范人工智能伦理;
- 培育人工智能生态(AI Ecosystem)。
作业:查找一篇人工智能在产业中应用的报道。
3 人工智能主要研究领域
3.1 专家系统
专家系统模拟人类专家求解问题的思维过程求解领域内的各种问题,其水平可以达到甚至超过人类专家的水平。
3.2 自动程序设计
程序综合:用户只需要告诉计算机要“做什么”, 无须说明“怎么做”,计算机就可自动实现程序的设计。
百度自动程序设计:
3.3 机器人
20世纪60年代初,研制出尤尼梅特和沃莎特兰两种机器人。
机器人发展:程序控制机器人(第一代) 、自适应机器人(第二代)、智能机器人(现代)。
3.4 自动驾驶
自动驾驶等级根据不同程度,从零到完全自动化,共分为六个等级,以下具体介绍:
-
L0级自动驾驶:无自动油门、刹车、方向盘全程皆由驾驶者掌控,它是最普通的驾驶方式,包括定速巡航,只能设定固定的速度,车辆不会自动调整速度,如加速/减速或驾驶员的操作需要。
-
L1级自动驾驶。驾驶操控为主,系统适时辅助主要还是由驾驶者操控车辆,但在特定的时候系统会介入,如ESP 电子车身稳定系统或ABS防锁死煞车系统,主要用于提高行车安全性。以小的变化,丰田威驰国内新品上市为例,配备了TRC、HAC上坡起步辅助牵引主动安全设备在这个范围。
-
L2级自动驾驶。部份自动化,驾驶者仍需专心于路况第二级自动驾驶可说是目前各大车厂的主流,如果第一级自动驾驶仪是辅助油门和刹车的话,第二级是添加到方向盘,如特斯拉自动驾驶仪,沃尔沃飞行员协助,梅赛德斯-奔驰驱动试验等,车辆的速度和转向可以在一定的条件下控制。
-
L3级自动驾驶。有条件自动控制,该系统可自动控制车辆在大多数路况下,驾驶注意力不需专注于路况相较于第二级还是需要驾驶专注于路况且双手须置于方向盘,第三级自动驾驶仪可以在一定条件下驱动注意力,而不关注路况,双手甚至可以离开方向盘。
-
L4级自动驾驶。高度自动化,还是具有方向盘等介面提供驾驶适时操控车辆在启动自动驾驶后,计算机将在目的地设置后按路线行驶,无需干预全面驾驶,但只需在高速公路或市区等特定区域进行干预,但它已经能够处理大部分的动态驱动任务。
-
L5级自动驾驶。全自动化,人类完全成为乘客第五级自动驾驶车辆将完全自动化,车上什至连方向盘等驾驶机构都不需要,完全透过电脑感知与运算来驾驶车辆,不论任何环境、路况,都不需要人类驾驶介入操控。
3.5 人工神经网络
传统人工智能的研究部分地显示了人脑的归纳、推理等智能。
但对人类底层的智能,如视觉、听觉、触觉等方面,计算机信息处理能力还不如一个幼儿园的孩子。
3.6 分布式人工智能与多智能体
分布式问题求解:把一个具体的求解问题划分为多个相互合作和知识共享的模块或者结点。
多智能体系统:研究各智能体之间行为的协调。
比如现在很火的研究领域:联邦学习。
3.7 智能游戏
1997年5月11日凌晨4时许,深蓝和卡斯帕罗夫“最后决战”,美国IBM公司的超级计算机“深蓝”仅用了一小时便轻松击败了国际象棋特级大师卡斯帕罗夫。
2016年3月16日,谷歌旗下英国公司DeepMind 开发的AlphaGO 计算机程序,在与世界顶尖天才棋手李世石的五番棋对决中,以4:1取得完胜。
3.8 智能操作系统
智能操作系统的基本模型:以智能机为基础,能支撑外层的AI应用程序,实现多用户的知识处理和并行推理。
智能操作系统三大特点:
- 并行性:支持多用户、多进程,同时进行逻辑推理等;
- 分布性:把计算机硬件和软件资源分散而又有联系地组织起来,能支持局域网和远程网处理;
- 智能性:一是操作系统处理的是知识对象,具有并行推理功能,支持智能应用程序运行;二是操作系统的绝大部分程序使用AI程序编制,充分利用硬件并行推理功能;三是具有较高智能程序的自动管理维护功能,如故障的监控分析等,帮助维护人员决策。
3.9 人工生命
人工生命是以计算机为研究工具,模拟自然界的生命现象,生成表现自然生命系统行为特点的仿真系统。
4 新一代人工智能关键技术
4.1 关键技术1:知识图谱
知识图谱:一种基于图的数据结构,知识图谱本质上是语义网络:
- 由节点(point)和边(Edge)组成;
- 每个节点表示一个“实体”,每条边为实体与实体之间的“关系”。
知识图谱构建关键技术:知识抽取。
- 数据源的分为两种:结构化的数据和非结构化的数据;
- 处理非结构化数据:自然语言处理技术(实体命名识别、关系抽取、实体统一、指代消解等)。
知识图谱构建关键技术:实体命名识别。
提取文本中的实体,并对每个实体进行分类或打标签:
- “1984年12月30日”记为“时间”类型;
- “克利夫兰骑士”和“迈阿密热火”记为“球队”类型。
知识图谱构建关键技术:关系抽取。
关系抽取是把实体之间的关系抽取出来的一项技术:根据文本中的一些关键词,如“出生”、“在”、“转会”等,判断詹姆斯与地点俄亥俄州、与迈阿密热火等实体之间的关系。
知识图谱构建关键技术:实体统一。
在文本中可能同一个实体会有不同的写法,比如说“LBJ”就是詹姆斯的缩写,因此“勒布朗詹姆斯”和“LBJ”指的就是同一个实体,实体统一就是处理这样问题的一项技术。
知识图谱构建关键技术:指代消解。
指代消解跟实体统一类似,都是处理同一个实体的问题。比如说文本中的“他”其实指的就是“勒布朗詹姆斯”。所以指代消解要做的事情就是,找出这些代词,都指的是哪个实体。
指代消解和实体统一是知识抽取中比较难的环节。
4.2 关键技术2:自然语言处理
计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法;
NLP:在机器语言和人类语言之间沟通的桥梁,用以实现人机交流的目的。
NLP由以下两个部分组成:自然语言理解;自然语言生成。
自然语言处理:自然语言理解。
希望计算机能够像人一样,具备正常的语言理解能力,包括分词,词性标注,句法分析,文本分类/聚类,信息抽取/自动摘要等任务。
“订机票”的例子,我们对订机票有很多种表达方式:
- 有去上海的航班吗?
- 订一张机票去上海,下周二出发。
- 下周二要出差上海,帮我看下机票。
- 我要搭最近的飞机去上海。
- ……
自然语言对于“订机票”的表达是无穷多的,这对于计算机来说是一种巨大的挑战。
自然语言处理:自然语言生成。
NLG(Natural Language Generation,自然语言生成)是一种自动将结构化数据转换为人类可读文本的软件过程。
自然语言处理:四个典型应用。
- 情感分析:信息想要表达的内容是五花八门的,但抒发的情感是一致的:正面/积极的 – 负面/消极的,通过情感分析,可以快速了解用户的舆情情况;
- 聊天机器人:随着智能家居,智能汽车的发展,聊天机器人会有更大的使用价值;
- 语音识别:语音识别已经成为了全民级的引用,微信里可以语音转文字,导航可以直接说目的地,输入法也可以直接语音而不用学习拼音…;
- 机器翻译:使用 Google 翻译完全可以看懂文章的大意,传统的人肉翻译未来很可能会失业。
4.3 关键技术3:机器学习
机器学习使计算机能够从研究数据和统计信息中学习;
人工智能是一个宏大的愿景,目标是让机器像人类一样思考和行动,既包括增强人类脑力也包括增强人类体力的研究领域;
学习只是实现人工智能的手段之一,并且只是增强我们人类脑力的方法之一。
所以,人工智能包含机器学习,机器学习又包含了深度学习。
机器学习帮助机器从现有的复杂数据中学习规律,以预测未来的行为结果和趋势;
例如:当我们在网上商城购物时,机器学习算法会根据我们的购买历史来推荐可能会喜欢的其他产品,以提升购买概率。
用人类的学习过程来类比机器学习,机器学习跟人类学习过程很相似:
- 训练集:认字的卡片在机器学习中叫训练集;
- 特征:“一条横线,两条横线”这种区分不同汉字的属性叫特征;
- 建模:小朋友不断学习的过程;
- 模型:学会了识字后总结出来的规律;
- 机器学习:通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫机器学习。
4.3.1 机器学习:监督学习
监督学习是指给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法。
让机器学会如何识别猫和狗:
学习方式效果较好,但打标签的成本非常高。
4.3.2 机器学习:非监督学习
非监督学习中,给定的数据集没有“正确答案”,所有的数据都是一样的。
无监督学习的任务是从给定的数据集中,挖掘出潜在的结构。
我们把一堆猫和狗的照片给机器,不给这些照片打任何标签,但是我们希望机器能够将这些照片分类:
4.3.3 机器学习:强化学习
强化学习主要是指导训练对象每一步如何决策,采用什么样的行动可以完成特定的目的或者使收益最大化。
- AlphaGo下围棋,AlphaGo就是强化学习训练对象,AlphaGo走的每一步不存在对错之分,但存在“好坏”之分。
- 强化学习的训练基础在于AlphaGo的每一步行动环境都能给予明确的反馈,是“好”是“坏”?“好”“坏”具体是多少,可以量化。
- 强化学习在AlphaGo这个场景中最终训练目的就是让棋子占领棋面上更多的区域,赢得最后的胜利。
类似于马戏团训猴:
4.4 计算芯片
AI芯片也被称为AI加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。
当前,AI芯片主要分为 GPU 、FPGA 、ASIC。
5 人工智能在勘探开发领域的应用
5.1 中国石油勘探开发人工智能技术研发中心
西南石油大学参与共建。
当前,世界大油气能源公司和服务公司正加快构建油气人工智能技术体系,加快数字化和智能化转型,打造竞争新优势,拓展发展新空间,力争实现大幅降本增效,在新一轮能源转型竞争中掌握主导权。
5.2 人工智能+油气勘探
人工智能技术的应用已成为油气数字化转型的关键一步,不仅可以应用于提高生产运营效率、降低运营生产成本,还可以用来保障安全生产、降低环境风险。
其中,机器学习、深度学习、计算机视觉等技术已在勘探开发、油气生产、炼油炼化、经营管理等重点环节进行应用与推广。
人工智能在油气领域的应用主要集中在上游的井筒工程、油气田生产及下游的炼油炼化、油品销售等。
但在实践落地中,存在着一些共知的“老大难”问题:由于储层的非均质性,石油地质问题具有多解性,难以获得高质量的数据,数据质量参差不齐;大多数地质数据获取成本较高,多为小样本数据量,无法满足深度学习的要求;石油行业具有较强的专业性,定制化需求高,需根据具体的应用场景设计模型。
深度学习技术可应用在地震数据处理与解释,测井数据处理与解释、钻完井诊断预警、钻井事故复杂、岩心分析、生产动态历史拟合与数值模拟预测、及井数据驱动油气藏产量预测等领域;
计算机视觉技术已在油气场站/炼厂无人值守、管道巡检、设备智能管理、数字油田/数字炼厂安全运营等领域得到广泛应用,工业应用效果突出,是目前行业内应用最广泛、成熟度最高的技术之一。
5.3 应用实例
认知智能被应用于油藏开发预测上。比如英国BP石油公司和Beyond Limits公司合作开发人工智能软件,可以根据本地已有钻井地质特征以及生产参数为依据,精确预测油藏地质甜点,优选井位,降低油气勘探成本。
在工程领域,钻井井壁失稳是危及到井下施工人员生命安全的一大安全隐患:
- 人工智能通过预测性分析减轻钻井事故的影响。
- 通过现场传感器监测的数据实时返回到云端进行处理分析,以实时快捷方式预测井壁失稳风险,有效缩短钻井周期,减少井下事故发生的几率。
泰国国家石油公司PTTEP的工程师采用决策树(Decision Tree)算法,分析考虑多因素(包括井的参数、生产条件、流体参数、油藏参数、地面设施、利润来源、供应商条件、HSE要求)的情况下,优选举升系统,优化结果与人工决策相比,明显地降低了成本并且提高了产量。
国民油井华高公司(National Oilwell Varco)应用人工神经网络方法,对钻头选择数据库的数据进行训练,形成优化钻头选型的人工智能方法。
用户输入地理位置数据、地质数据、岩石力学数据和已钻井数据后,即可输出选择的钻头类型、该钻头的性能预测及使用指南。
斯伦贝谢的DELFI多维环境软件,更是将深度学习、数据分析、自动化等多个技术优势整合,使得勘探开发工作更加智能化。
DELFI平台为石油工程师和科学家提供了大量的AI工具。DELFI平台中,融入AI技术的地质工程软件可以做到断层智能识别、甜点智能识别、智能历史拟合、复杂多层位智能追踪等工作。
美国Nervana System公司将人工智能引入到油气行业用于地震数据分析,帮助作业者对地下情况有更加深入的了解,快速准确识别断层及褶皱,发现油气资源,实现收益的最大化。
对于页岩气勘探开发而言,定向钻井技术是能否达成高产气流的重中之重,这一技术需要耗费大量的人力物力,特别是需要高技能的工程师在工作过程中应对各种突发状况,不断进行决策。为了应对这一情况,壳牌和微软联合研发推出的Shell Geodesic可以实时收集钻井数据并自动做出决策,并且可以通过机器学习和控制算法软件,给地质学家和钻井人员绘制出更为逼真的油气层图像。
对于动辄三四千米深的页岩气藏,借助地震勘探反演储层缝网发展状况,并且结合数值模拟方法探究页岩储层压裂效果是目前的主流研究思路。通过图像分析处理,研究人员可以设定一定的图像阈值,对已有的数据进行优化。
例如上图的原始缝网数据,包含了噪点信息,用于模拟计算需要耗费大量时间成本,应用人工智能可以对原始数据优化分析,提高模拟计算效率。
在岩石CT断层扫描技术中,需要对得到的三维重构图像缝网进行二次处理,运用图像信息化处理可快速进行分析判断继而完成重构。
科技巨头与石油行业的强强联合也不断促进着人工智能在石油领域的蓬勃发展。道达尔和谷歌合作开发了一套能够解释地层图像的人工智能程序,该程序能够利用计算机成像技术实现地震数据的机器学习,并利用自然语言处理技术自动分析数据文件,建立更加精确的地质模型。
人工智能+石油勘探开发大有可为: