徐波所长专访 | 人工智能:从“作坊式”走向“工业化”新时代

80175b1b19e1e588e43e31d59ad541ed.png

来源:人民网

人工智能创新不断 “一体两翼”快速发展

人民网:当前,人工智能技术创新不断,应用层出不穷。它究竟走到了哪一步?能否谈谈您是如何看待我国人工智能技术发展现状的?

徐波:人工智能是一个高度交叉复合、快速发展的领域。如果要对其发展现状作一个全面概括,可以从人工智能 “一体两翼”构成来着手分析。

其中“一翼”是指人工智能的基础理论。人工智能快速发展无疑受益于大数据和大算力发展,但基础还是15年前深度学习基础理论和方法的突破。人工智能越发展,其计算、生物、数学、材料、心理学和社会学等交叉复合特性就越明显。我国人工智能高水平论文发表数量已经位居世界一二,人工智能基础研究发展态势良好,已经成为人工智能基础研究大国。但成为人工智能基础研究强国,还需要在需求牵引下,按照问题导向继续弘扬“十年磨一剑”的科学家专注精神。

另外“一翼”就是人工智能的应用。人工智能具有无所不在的广阔应用场景,技术落地需要和工业制造、农业发展、医疗制药、社会治理等领域深度结合。我国有市场、人才、规模、数据等方面的优势,在应用方面走得比较快,对各行业的渗透深度和广度前所未有,具有世界上独一无二的优势,已经走在世界发展最前列。

人工智能中间非常关键的“一体”,指的是人工智能的基础软硬件,包括芯片、算法、软件硬件协同、开源框架、应用开发接口等等。它作为一个桥梁,把人工智能基础研究成果和场景应用广泛地结合在一起。目前,我们的基础软硬件研发已经从“可用”走到基本“好用”的阶段,发展了自主可控的人工智能基础软硬件生态。

人民网:产业应用是技术发展中很重要的部分。您认为我国要发展人工智能产业,占领关键技术高地,未来的突破口在哪里?

徐波:随着我国新一代人工智能的发展,人工智能应用呈现出遍地开花的良好发展态势。但人工智能落地中,也碰到很多问题,例如对数据质量要求高、缺乏相应标准、落地周期长成本高、人才昂贵等。

我认为可以从这几方面寻找突破口。

首先是复合型人才的培养。智能社会发展过程中需要培养一批既懂行业需求流程、又懂人工智能的专业人才。人工智能还完全没有发展到可以通过调几个参数就能上线替代部分人工作的水平。其中行业数据的获取、清洗和加工,以及如何按照业务需求建立相应的应用模型都需要一些这样的复合型人才支撑。

其次要降低人工智能的应用门槛。现在按照专用人工智能技术发展的应用,在很多时候发现还不如用个人更省成本。所以,如何从专用型的人工智能,逐步向更具泛化能力的人工智能技术发展,是一个重要的技术突破口,也是未来5-10年人工智能技术发展的主流。

这个过程中,从推动产业发展的角度选择一些超级场景对于牵引人工智能应用发展非常关键。例如,自动驾驶会是人工智能在单一领域里最大的产业场景,也是汽车工业发展的必争之地。类似的还有人工智能+医疗,也是一个特别大的场景。中国有四百万医生、全世界最大的临床海量医疗数据,最适合人工智能去发挥智能化优势。所以,要选择一些这样的超级场景,作为推动人工智能进步的突破口。

加快原始创新策源 努力占据制高点

人民网:中科院自动化所作为我国“国家战略科技力量”的重要组成部分,“十四五”期间在人工智能领域的研究和应用方面,有哪些相应的目标和计划?

徐波:我们按照“两加快一努力”要求,加快原始创新策源和关键核心技术突破,努力占据人工智能科技创新制高点。

中国科学院自动化研究所始终关注人工智能中长远发展布局。十年前在深度学习刚刚开始应用于语音、图像并产生技术突破时,我们意识到感知类人工智能应用将逐渐由产业界为主导,于是开始布局更前瞻性的类脑智能,推动人工智能和脑科学的交叉研究实现,并与科学院神经所成立脑科学与智能技术交叉研究中心。目前这个方向已经成为研究所三大主力研究方向,相信在下一代人工智能发展中也将扮演重要角色。

人工智能想要在经济发展、社会治理、大工程系统等复杂问题的决策中发挥作用,需要人工智能与复杂系统进行交叉融合,这也是人工智能从感知、认知走向决策的必然发展趋势。因此,研究所进一步布局了可自主进化智能方向,研究建模人、环境和机器之间的演化、合作和竞争等关系,并通过交互提升人和机器对环境的认识和认知。这项技术可广泛应用于大量复杂问题的智能辅助决策。

这儿要重点谈一下我们最近研发的“紫东太初”多模态大模型。这是基于我们多年基础积累形成的面向关键技术攻关的研究方向。我们人类对世界的认识天然是多模态的。举个例子,我说“猫”这个字,你马上脑子里能想到猫的图片、猫叫的声音、猫的文字。我们大脑里面把猫有关的声音、图像和文字关联在一起,共同组成了“猫”这样一个语义。这个语义是跨模态存在的。模拟人的多模态认知特点,自动化所推出了全球首个千亿参数的三模态大模型“紫东太初”,把图像、文本和语音结合起来,它采用了多层次、多任务、自监督、预训练的学习方式,不仅可以实现跨模态理解,还能实现跨模态生成。这是我们在已有多个很好技术积累基础上,通过多模态把人工智能众多方向加以融合创新的研究成果,服务于产业和国民经济主战场。

人民网:在人工智能创新链中,科研院所在扮演怎样的角色?自动化所又是如何面向国民经济主战场,为我国人工智能产业链发展赋能?

徐波:人工智能包括智能和智能化。智能即智能科学内涵、基础理论和模型算法等,智能化则是智能与各个领域行业的结合。研究所发展规划一方面要承担主责主业,大力探索智能本身。同时,需要考虑智能怎么去和社会、和企业、和政府合作,政产学研结合,面向国民经济主战场,为人工智能产业链发展赋能。无论从科研还是产业化,我们始终秉持在低潮时坚守、在高潮时冷静的理念,努力成为默默的开拓者和引领者。

六年前,人工智能落地应用刚刚萌芽,基于人工智能自身发展特点,研究所及时推出了“离岗创业”制度,鼓励已在智能应用领域深耕多年的团队进行转化。制度实施以来,已经诞生了在工业视觉、融媒体、生物特征识别等垂直行业里多家有影响力的企业。离岗创业,这是一种人工智能技术转化1.0版本形式。

作为一种赋能千行百业的技术,我们不能止步于此。我们正在探索人工智能技术转化的2.0版。2.0核心就是要利用研究所力量,以核心创新为抓手,以构建创新生态为目标,做一个大的人工智能平台。如上所述,目前人工智能存在落地周期、成本、人才等问题,同时国产基础软硬件从基本“好用”到非常“好用”,都需要协同各方力量共同努力。

为了解决这一行业痛点,今年5月,中国科学院自动化研究所、华为技术有限公司、武汉东湖高新区管委会签署《人工智能技术开发合作备忘录》,三方共同筹建武汉多模态大模型人工智能平台。该平台以自动化所的“紫东太初”大模型为核心,以全国产的昇腾AI基础软硬件为底座(包含昇腾AI处理器、异构计算架构CANN和全场景AI框架昇思MindSpore等),通过合作支撑当地产业实现智能升级。大模型、大底座、大数据形成了一个天然的合作模式,来为各个行业赋能。这是我们技术转化2.0的一个开始的初步尝试。

打破应用门槛 解决人工智能“落地难”痛点

人民网:您如何看待这个平台的未来发展?

徐波:这是人工智能向更加通用化方向迈出的重要一步。以前的人工智能是属于“作坊式”的。想要做一个应用,需要从算法开始进行开发,类似于我们常说的“重复造轮子”。多模态大模型人工智能平台,是人工智能从“作坊式”向“工业化”转型升级的一次重要探索。通过对多模态大模型人工智能平台的持续研发、应用、优化、升级等,大大降低应用门槛和对应用人才要求,同时推动全自主可控软硬件体系的形成。

这个过程中大模型技术持续创新研发是我们的主责主业。例如现在计算量还比较大、成本和能耗也比较大,未来大模型在现有基础上还会有很多突破。需要我们不断融合类脑等智能新机制,使得大模型的运营成本越来越低,越来越好用。

目前,我们也正在同步研究大模型基础上蒸馏出小模型技术,这也非常重要。对于不想上云的,或者是应用场景不那么复杂的,其实并不需要用到大模型。因为大模型的参数特别多,使用成本非常高。这个时候,就可以用大模型中蒸馏出一个小模型,小到可能只有几兆的大小,不但降低成本,而且实现从通用向专用的进一步优化。

打个比方来说,大模型类似于一个知识非常渊博的老师,他学了无数多的数据,但是如果从事一件具体的工作,就不需要那么渊博的知识,这时候,我们可以根据需求,自动蒸馏出一个小模型,教出一个小徒弟来做这项工作。

人工智能要迈上工业化阶段,必须要满足以下几个条件,批量化,成本低,易访问,轻能耗以及最大程度的开源开放。未来,“云端的大模型+末端小模型”很可能会成为人工智能应用的重要模式。

人民网:这个平台,目前是否有一些成功的应用?

徐波:我们已经有一些应用,效果很好。以前解决不了或者解决不好的现在有了全新的技术手段。

我们在智慧媒体方面做了一些探索。和头部视频网站合作,针对其海量的短视频、电影和电视剧,做到了跨模态内容的检索。比如输入一段文字,就能定位到视频中的某一个片段;可以根据电视剧的简介自动生成1分钟的视频摘要;还可以指定某个特定演员出现的场景、某件事的前因后果等内容进行“跳播”。

工业视听觉已经进行了应用尝试。过去,人工智能在工业领域的应用是一个痛点,因为样本非常少,而且很多时候数据是多模态的。比如发动机的质检,往往是靠老师傅们“听”出来的。用人工智能怎么做呢?我们把各种各样的工业缺陷数据混合在一起,首先让机器进行模型自学,应用的时候只需要给两个样本,就可以达到很高的质检精度。这方面我们已经实验过了,原来可能需要一万个样本才能做到90%以上的识别率,现在只要用几个或几十个样本,精度就能达到90%,大幅降低了人工智能的应用门槛。

另外一个应用案例是具像化的教学,可以在打手语的同时生成对应图片,辅助学生理解,更好地达到教学目的。

类似的应用还有很多,只靠自动化所一家单位去落地,会错失大量的助推产业升级的机会,也会比较慢,所以一定要在推广模式上创新,吸引更多的人、更多的机构来实践,来应用。我刚才说的“2.0”就是这个意思。现在我们自己先做一些样例出来,然后进一步完善模型,通过标准化、流程化等一系列手段,将门槛降下来。未来越多人用,这个模型就会越完善,也越好用。

近期,自动化所联合大学、产业界等在积极推进 “多模态人工智能产业联盟”的建设,这个联盟的成立就是为了让产学研各界都能更好的应用我们创新的成果,并基于这些成果再去推广、完善。12月18日即将在武汉举行的“2021东湖国际人工智能高峰论坛”上,我们也会就推动人工智能通用化、技术应用国产化和参会嘉宾进行进一步的探讨与合作。

人民网:多年来您在研究人工智能的过程中,有没有觉得它的发展速度超越了您的想象?

徐波:有句话说,“大多数人高估了他们一年所能做的事情,却低估了他们十年所能做的事情。”

这句话来描述人工智能的发展也很适用。它的影响是潜移默化的。目前人工智能落地碰到一些困难,但过了十年以后回头来看,人工智能的发展速度会比你原来想象的要快。

目前,全世界很多优秀的人在研究人工智能,每个人都从不同的角度攻克其中一块砖,最终合力去建立起一座人工智能的高楼大厦。人工智能的发展非常激动人心。

这里的每一块砖可能就是一个很小的研究或者应用领域,它们正在以飞快的速度不断迭代和突破。人工智能研究离终极目标还有很远的距离,但人类正在朝着它光明前景的快速道上大步前进,并看到沿途一路风景。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

42a21563a555ce9f789de6e6b6e33321.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483023.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux——线程(1)

文章目录1.线程概念1.1 什么是线程1.2 线程和进程区别1.3 线程实现原理1.4 三级映射1.5 线程共享资源1.6 线程非共享资源1.7 线程优、缺点2.线程控制原语2.1 pthread_self 函数2.2 pthread_create 函数3.线程与共享3.1 线程共享全局变量4.线程退出4.1 pthread_exit 函数1.线程概…

Redis压缩列表原理与应用分析

摘要 Redis是一款著名的key-value内存数据库软件,同时也是一款卓越的数据结构服务软件。它支持字符串、列表、哈希表、集合、有序集合五种数据结构类型,同时每种数据结构类型针对不同的应用场景又支持不同的编码方式。这篇文章主要介绍压缩列表编码&…

Science公布2021年度十大科学突破,AI这项前所未有的突破上榜

来源: 学术头条撰文:朱哼哼编审:王哈哈排版:李雪薇2021 年 11 月 17 日,Science 杂志公布了 2021 年的年度科学突破榜单,AlphaFold 和 RoseTTA-fold 两种基于人工智能预测蛋白质结构的技术位列榜首。除此之…

OpenAI教GPT-3学会上网,「全知全能」的AI模型上线了

来源:机器学习研究组订阅它被命名为 WebGPT,OpenAI 认为浏览网页的方式提高了 AI 解答问题的准确性。如果 AI 学会上网,那么它就拥有了无限获取知识的方式,之后会发生什么就不太好预测了。于是著名 AI 研究机构 OpenAI 教那个开启…

Hadoop(2):常见的MapReduce[在Ubuntu中运行!]

1 以词频统计为例子介绍 mapreduce怎么写出来的 弄清楚MapReduce的各个过程&#xff1a; 将文件输入后&#xff0c;返回的<k1,v1>代表的含义是&#xff1a;k1表示偏移量&#xff0c;即v1的第一个字母在文件中的索引&#xff08;从0开始数的&#xff09;&#xff1b;v1表…

springboot学习笔记-01-springboot-helloworld的编写以及原理初步了解(自动装配)

文章目录原理初探主程序关于spring boot&#xff0c;谈谈你的理解&#xff1a;微服务阶段原理初探 pom.xml spring-boot-dependencies&#xff1a;核心依赖在父工程中&#xff01;我们在写或者引入一些springboot依赖的时候&#xff0c;不需要指定版本&#xff0c;就因为有这…

2022年:机器人技术的重大革命

来源&#xff1a;ScienceAI编辑&#xff1a;萝卜皮一段时间以来&#xff0c;跟踪机器人技术发展的人已经注意到该领域的一场无声革命。虽然自动驾驶汽车占据了所有的头条新闻&#xff0c;但人工智能、机器视觉和机器学习的交叉领域正在迅速成为下一阶段机器人技术的基础。通过将…

陈天奇高赞文章:新一代深度学习编译技术变革和展望

来源&#xff1a;机器之心作者&#xff1a;陈天奇陈天奇是机器学习领域著名的青年华人学者之一&#xff0c;本科毕业于上海交通大学ACM班&#xff0c;博士毕业于华盛顿大学计算机系&#xff0c;研究方向为大规模机器学习。在本文中&#xff0c;陈天奇回答了目前深度学习编译技术…

操作系统欢乐笔记-01-带你推开操作系统的大门(雾)

B站-操作系统-哈尔并工业大学-劝退警告223 文章目录1.什么是操作系统&#xff1f;什么是操作系统&#xff1f;小目标&#xff1f;2.揭开钢琴的盖子熟悉的win开机画面从白纸到图灵机冯-诺依曼一拍脑袋瓜&#xff0c;他说摁下开机键这段不是rap 223 劝退警告emmmmm1.什么是操作系…

2022年值得关注的22项新兴技术

来源&#xff1a;参考消息网英国《经济学人》网站11月8日发表题为《下一个是什么&#xff1f;2022年值得关注的22项新兴技术》的文章。在文章列举的22项新技术中&#xff0c;既有今年大热的“元宇宙”、太空旅游、脑机接口&#xff0c;也有备受期待的量子计算、艾滋病病毒疫苗……

分别安装搭建lamp服务环境

一、 分别安装搭建lamp服务环境 准备工作&#xff1a; 1、配置防火墙&#xff0c;开启80端口、3306端口vi /etc/sysconfig/iptables-A INPUT -m state –state NEW -m tcp -p tcp –dport 80 -j ACCEPT #允许80端口通过防火墙-A INPUT -m state –state NEW -m tcp -p tcp –dp…

springdata学习笔记-01-helloworld-(暂时不全223)

第一天 orm思想和hibernate以及jpa的概述和jpd的基本操作 传统jdbc操作 获取链接创建statement对象可以对占位符赋值发送查询 操作繁琐占位符赋值麻烦 orm思想 主要目的&#xff1a;操作实体类就相当于操作数据库表建立两个映射关系 实体类和表的映射关系实体类中属性和表中…

nginx学习笔记-01nginx入门,环境搭建,常见命令

nginx学习笔记-01nginx入门&#xff0c;环境搭建&#xff0c;常见命令 文章目录nginx学习笔记-01nginx入门&#xff0c;环境搭建&#xff0c;常见命令1.nginx的基本概念2.nginx的安装&#xff0c;常用命令和配置文件3.nginx配置实例1.nginx的基本概念 nginx是什么&#xff0c;做…

MIT博士用概率编程让AI和人类一样看三维|NeurIPS 2021

来源&#xff1a;机器学习研究组订阅人与AI之间最大的区别就是对常识的利用&#xff01;无论各种AI模型在各大排行榜以何种性能超越了人类&#xff0c;它们在常识的利用上仍然远远不及人类&#xff0c;而这也正是目前AI研究中需要面临的一个巨大的挑战。对于自然语言处理的研究…

Unity Shader 2D水流效果

水流的模拟主要运用了顶点变换和纹理动画的结合&#xff1b; 顶点变换中&#xff0c;利用正弦函数模拟河流的大致形态&#xff0c;例如波长&#xff0c;振幅等。 纹理动画中&#xff0c;将纹理坐标朝某一方向持续滚动以形成流动的效果。 脚本如下&#xff1a; 1 Shader "M…

2022年智能家居十大预测新鲜出炉:全屋智能驶入快车道?健身镜成新宠……

来源&#xff1a;物联网智库 2021年接近尾声&#xff0c;这一年&#xff0c;新冠病毒仍旧没有离开地球&#xff0c;而在疫情常态化、工作与生活回归正轨之余&#xff0c;人们对于网络与虚拟世界的依赖度也陡然骤增。这一转变无疑将极大拉动消费端的数字化产业发展&#xff0c;除…

数据结构与算法——动态规划

文章目录1.内容概述2.爬楼梯2.1 题目描述2.算法思想2.3 代码实现3.打家劫舍3.1 题目描述3.2 算法思路3.3 代码实现4.最大子序和4.1 题目描述4.2 算法思路4.3 代码思路5. 零钱兑换5.1 题目描述5.2 算法思路5.3 代码实现6.三角形最小路径和6.1 题目描述6.2 算法思路6.3 代码实现7…

vue学习笔记-01-前端的发展历史(从后端到前端,再到前后端分离,再到全栈)

vue学习笔记-01-前端的发展历史&#xff08;从后端到前端&#xff0c;再到前后端分离&#xff0c;再到全栈&#xff09; 这篇文章是博主在看vue-前端发展简史的时候做的笔记&#xff0c;以供后续学习复习 文章目录vue学习笔记-01-前端的发展历史&#xff08;从后端到前端&#…

黑客帝国「缸中之脑」有眉目了?培养皿中百万人脑细胞学会打乒乓球,仅用了5分钟...

来源&#xff1a;机器之心编辑&#xff1a;张倩、杜伟既然生物神经元如此高效&#xff0c;为什么不拿来用呢&#xff1f;最新版本的《黑客帝国》还有两天才会上映&#xff0c;但最近的一些科技进展总让我们觉得&#xff0c;导演描述的世界似乎离我们越来越近了。其中一个进展来…

《Science》基因组比对的革命性技术

来源&#xff1a;生物通加州大学圣克鲁斯基因组研究所(UC Santa Cruz Genomics Institute)的研究人员推出了一种名为“长颈鹿”(Giraffe)的新工具&#xff0c;可以有效地将新的基因组序列绘制到代表多种不同人类基因组序列的“泛基因组”(pangenome)上。使用泛基因组学方法而不…