9月8日,IBM举行了“科技一席谈”线上媒体访谈会,此次访谈以“数据与AI”为主题,由IBM 大中华区科技事业部、客户成功管理部总经理朱辉,IBM 中国混合云与 AI 华东及华南大区总经理许伟杰作主题分享。
在数字化转型的时代,很难有一家企业能仅凭一己之力满足所有客户的需求。在这样的大环境下,越来越多企业开始采用混合云架构。从IBM此前的公开数据显示,在过去的12个月,IBM的云业务营收达到 270 亿美元,超过总收入的三分之一
朱辉表示,成为一家全球领先的混合云与AI能力的供应商,是IBM当下的公司战略。今年年初,无论是从IBM的组织架构调整,再到全球的售前、售后服务团队等新组织成立,包括IBM大中华区科技事业部客户成功管理部的成立,均体现了IBM以成就客户为中心致力于成为企业信赖的数字化转型伙伴的坚定理念。
朱辉 (Jerry Zhu) IBM 大中华区科技事业部客户成功管理部总经理
朱辉还透露,目前IBM硬件、软件、服务、咨询等各条业务线已经统一到了混合云与AI的战略平台上。其次,从产品尤其是软件的角度来看,过去五六年间的调整与整合,使整个软件的产品线都已经集中到了基于容器化平台之上的Cloud Paks之上。
另外,从售前、售后服务体系方面,IBM也已经形成了以数字化转型、混合云与AI能力为主轴的咨询服务,通过车库文化、Design Thinking Workshop的方式和客户共同创新。帮助客户运用最新的技术,在完成数字化转型、产生新的业务创新和业务价值的过程中,来发现、定义新的业务场景和MVP(最小可行性产品)。让在企业本身的业务转型、数字化进程,以及运用AI技术在混合云架构之上搭建新的现代化IT架构的大型项目中,缩短回报周期。
而对于Cloud Paks,许伟杰也给出了另一个诠释:“Cloud Paks相当于把这些能力都非常好地通过容器化、微服务化来展现,这里面不仅仅是简单地把这些工具给容器化,放在容器上跑,里面还有很多基于容器的协同、管理的能力。”
许伟杰 IBM 中国混合云与AI 华东及华南大区总经理
对于Cloud Paks的部署,许伟杰认为,当企业发展到大量技术协同应用需要这个能力时,就可以把现有所有的投资和应用场景放到新的Cloud Paks容器化环境当中去,使得技术可以得到平滑过渡和转移。
混合云+AI,已逐渐成为企业IT架构的新基石
从IBM透露的数据显示,目前全球已有3200多个企业级客户使用IBM的混合云平台,有4万用户使用IBM的人工智能技术。从这两个数据中可以看出,目前混合云与AI的市场量级和需求巨大。而混合云+AI,在企业新的IT架构和IT环境中发挥重要作用的时代已经到来。
任何新的技术都会带来很大的生产力提高,创造新的价值,但是同时也都会产生一些新的技术上面新的要求、挑战,有的时候甚至是困境。
目前IBM看到的客户对技术上最主要的三个主要诉求是:
- 如何尽快、简单、低风险、低成本地搭建起混合云的环境和基础架构;如何把公有云、私有云上面部署的应用和拥有的数据,以及多年来在本地系统当中运行的应用,在混合的IT环境下面进行高效的监管、运营、运维?
- 智能自动化。如何通过技术和智能的能力,把低端、低价值的工作自动化?
- 怎么样通过人工智能来实现数据的价值?
到目前为止,第三部分的诉求还远没有达到理想状态。根据IDC的数据显示,高达90%有价值的企业数据存在着无从访问、无法信任、未被分析利用等问题,对企业决策、企业对业务表现实现实时可视化、对客户的响应能力等方面都有所阻碍。
朱辉认为,在混合云架构下,如何释放企业停留在不同角落、不同应用系统中的数据所带来的技术的挑战尤为重要。在二十年前,数据领域里最先进的技术是数据仓库,把不同应用中产生的数据慢慢集中到设计好的数据仓库的架构上面,使它能够被分析,能够得出分析结果。而若干年后,大数据、数据集市、数据湖的概念相继出现,但作用仍然是把来自于企业不同应用、不同部门、不同角落的数据集中到一个数据平台上来,产生一个统一的可被分析的视角。
到了今天,许多企业已经进入了混合云的轨道,并大量使用了AI的技术,这种情况下,会产生哪些技术问题?
- 数据量急剧增加。随着非结构化数据加入到整个企业级数据的来源当中,成为越来越重要的来源之后,一个企业所拥有的数据量以及增长速度正在呈几何级增长。
- 数据不光来自于不同的应用系统,还存在于不同的形态当中,包括公有云、私有云、本地应用上。
如果按照原来数据仓库、数据集市、统一数据平台的概念将这些数据全部复制或移动,会导致成本和复杂度越来越高、可靠性越来越低、所需要的时间越来越多。也就是说,这件事情要做成的难度越来越高。
我们如何运用AI的技术解决刚才的问题,AI发挥了哪些作用?这是另外一个新的挑战。为了解决如何在新的混合云IT架构时代当中发挥数据价值的问题, Data Fabric数据架构的理念因此诞生。
Data Fabric,利用AI将数据价值最大化
如何用AI挖掘数据价值?IBM的解决方案是把Data Fabric 融入到了产品中去,也就是Cloud Pak for Data之上。
Data Fabric首先是一个数据架构,数据架构的目的是在正确的时间,从任意位置,将正确的数据与正确的人连接起来,从而全面释放数据价值,加速企业的数字化转型。
动态协调分布式数据,用跨数据平台的数据以可信赖的方式来支持各种不同的分析或者是应用系统的场景,而非机械性地搬运或复制数据,也不是点对点连接,或以集中式、单一枢纽式的数据集成方式来将数据放在统一的平台上分析。这样做看起来简单,但在混合云的环境中,成本和复杂度增加,时间成本也高。所以Data Fabric其实是一个跨越不同数据来源的虚拟网络,使这些数据互相之间产生了虚拟的连接,从而使得在不需要发生物理流动的情况下,能够被人看到、被查询、被分析。
想要实现用智能的、安全的、可信的,甚至是自服务的方式获得不同数据源的数据,AI需要在当中发挥非常大的作用。在IBM Cloud Pak for Data上,智能化Data Fabric可以提供四种AI自动化能力:
1、AutoCatalog(自动分类)。可以看成是IBM研发AI赋能的分类大脑。元数据的管理的目的是挖掘数据价值,是把各个不同来源的数据很好地利用起来的重要技术环节。它可以根据发现数据和分类的流程实现自动化,进行自动分类之后建立自动化目录,维护来自于不同数据环境数据资产的Dynamic(动态的)的Real time catalogue(实时目录)。实时目录是一个非常重要的自动化的能力,用于提供能力上的支撑,是为跨企业内不同业务团队之间的数据完成轻松查找的重要设计。
2、AutoAI(自动建模)。主要作用为尽量降低AI模型开发、模型校正、模型自我重新培训的技术门槛和人力付出,从而对动态的数据和整个AI本身算法生命的周期进行自动化。能够帮助确保在正确的时间把正确的数据给到正确的人。
3、AutoPrivacy(自动识别隐私规则)。主要是通过数据隐私框架当中的关键能力,使用AI的能力智能化地识别企业内部的敏感数据,被调用时系统能够识别、监控到,甚至在后续定义敏感数据的使用和保护时,可以为企业内部的政策实施自动化提供技术和智能化的保障。
4、AutoSQL(自动查询)。通过AutoSQL的技术来实现访问数据的自动化,无须物理地移动这些数据,从而提高了数据查询的速度,也降低了使用数据的人对数据来源所需要的了解。
这样一来,对于不同的数据源都使用同一个查询引擎,就能够统一地得到数据、分析数据。可以保证企业在挖掘数据价值过程中节省大量的时间和资源,避免了移动数据和维护多个查询引擎所带来的额外成本、复杂度,对人员技能的要求也无需太高。
IBM将这四项重要的AI赋能的Auto的能力,都加入到最新的Cloud Pak for Data 4.0版本当中。从目前实验室内部做的一些比对来看,Data Fabric的价值以及自动化能力,可实现查询速度提高8倍以上、同时成本降低一半。
当前AI和大数据领域,最需要什么样的人才?
在混合云IT架构的大环境下,对于从事AI和大数据领域的开发者而言,又该关注哪些领域、掌握什么技能?
对于这个问题,朱辉认为,首先围绕着数据领域来讲,开发者社区当中对于数据科学本身的这部分技能,将来一定会非常吃香。
其次,对于为企业工作的大多数开发者而言,对业务线(LOB,Line-of-Business),也就是对于业务系统的了解将来会变得越来越重要。在整个IT的栈当中,基础能力模块和组件、功能的产生和维护,将来会越来越自动化,甚至代码的产生本身也是自动化的。所谓的AutoAI自我培训出来的模型,其实就是自我产生的代码。像这些能力模块的建立,一直以来是靠软件工程师、码农一条一条写出来的。这样的工作不会消失,但是一定会减少。相反,在朱辉看来,对于系统、IT的从业人员而言,尤其是做数据相关工作的IT从业人员,如果不懂业务,将来很难生存,这是他的主要建议。对于业务的熟悉,对数据科学来说是非常重要的技能培养方向。
“其实现在的市场就是这样子的,对任何一个工种来说,跨界能力很重要。很简单,一个会某某编程语言的开发者,如果按照这个筛选条件,可能有一万个人。但是一个做过两个头部汽车企业的开发者,筛选后可能只有200人,这200人恰恰是企业要的。”许伟杰补充道。
许伟杰表示,无论是开发人员、算法工程师、还是销售、行业咨询顾问,都是一样的道理。尤其是国内的市场很大,任何一个细分行业都非常巨大。很多细分行业中有两种、三种复合能力的人,在里面会特别有机会脱颖而出,去做很多不一样的事情。