杨强:人工智能在企业的落地是一门大学问

640?wx_fmt=jpeg

来源:图灵人工智能

摘要:人工智能到现在已经 60 多年,几起几落,它的兴衰也是围绕着 “AI是不是可以落地” 进行的。


杨强

香港科技大学计算机和工程学系主任

国际人工智能联合会IJCAI理事长

第四范式首席科学家


杨强:一个AI,两种模式


640?wx_fmt=png


杨强:今天的题目很应景,叫 “落地的人工智能”。这个题目是拿来跟大家探讨的,因为这是一个大题目。人工智能到现在已经 60 多年,几起几落,它的兴衰也是围绕着 “AI是不是可以落地” 进行的。


今天的讲座,第一部分是人工智能概述。


人工智能分为四个发展阶段。初级阶段是感知环境(Perception),我们知道单层的神经网络也叫 perceptron(感知器),是 60 年代就出现的可以简单学习的神经网络。这是 AI 必要的一步,因为要有感知智能,才能收集大量数据,这一阶段需要传感器、互联网、物联网等技术。


第二个阶段是机器学习(machine learning)阶段。能从数据里面学习。第三个阶段是自动推理(reasoning),需要搜索、逻辑、博弈论等技术。最后也是最高阶段是抽象迁移(abstraction),需要有新的理论和系统。


640?wx_fmt=png


一个AI,两种模式


  • 通用 vs 特殊:有很多人试图解决通用 AI,但现在绝大部分工作还是在特殊的、任务驱动的人工智能。


  • 辅助 vs 自动:比如计算机视觉是辅助型的,相当于给机器戴上了眼镜。无人车是自动型的,因为它的整个运作是自动的,也有自动的学习能力,人类只是为它提供一些必要的资源。


  • 交互 vs 核心:交互型的 AI 是为了跟人沟通,是闭环的。还有一种做法是把 AI 作为一个核心的系统,它的副产品是对人有用,但它可以完全按照自己的方式发展。AlphaGo 就是一个例子。


说到人工智能落地,第一个问题就是什么叫“落地”,谁来规范什么时候AI可以算作“落地了”? 这个标准是首先要建立的。在任何科学与工程领域,都要首先建立测试“成功”的准则,否则就会事倍功半。要知道,智能的测试是非常难以做到公正的,也经历了很多的考验,比如著名的“聪明的汉斯”,是对一匹叫做“汉斯”的马的智能测试,因为一开始没有注意到高维的特征空间,而得到了错误的结论。图灵测试是一种更合理的测试,但也不是唯一的测试。


我认为深度学习的成功主要来自两个方面:第一,层次之间的演化是一种非线性的转化,这种转化如果进行多次,就有可能产生高维空间的 pattern。第二,所有这些加起来,这个网络本身成为一个特征产生器,产生一个高维的空间,在这个空间里,世界上的任何东西(图像、语音等)都会有统一的表达,并且你可以计算它们的距离。


高维度的、统一的特征表达,这就是人工智能想达到的目标。所有的推理、类比、抽象等,都可以在这个空间里得到。但这个空间是通过在数据中学习获得的,这个手段在现阶段是通过大数据,但大数据不是唯一的手段。


AI为什么要有不断创新的能力?


AI 领域每年有上千甚至上万的 paper,是不是说我们就可以躺在 open source 上面,不用创新了?不是的,我们很有必要不断地创新。


一个例子是 GAN,它的一个作用是可以 “鱼目混珠”,生成器可以创造出一些虚假的图片。在金融界就发现有这样的人,他们对深度学习了如指掌,并且可以用AI深度学习的这些手段去欺诈金融的安全系统,因此我们必须要有不断提高的反击的能力。


第二,有些新的学科,比如迁移学习,非常依赖对数据的模拟。GAN 在这个方向是非常有用的工具。


640?wx_fmt=png


创新的能力也可以体现在跨界的AI应用上。一个例子是斯坦福大学的一个工作,他们的任务是帮助联合国通过卫星图像,让机器自动地给非洲大陆打标签,这些标签指代地区的“贫困程度。” 但是我们看到一个卫星图像,由于标签的缺乏,我们对图像上对应的贫困程度是一无所知的。传统的做法是派人到本地做经济调查,然后把数据收集起来。这样的做法既危险,又耗时,不准确,数据也非常少。


有没有办法自动地做这件事呢?他们想到了迁移学习,而且是多步的迁移学习。第一步是拿 ImageNet 这种图像来学一个切割模型,第二步是比对白天和晚上的卫星图像,以此获得一个初步的经济模型。因为一般认为晚上比较亮的地方是经济发展比较好的区域。由此得出一些 feature 对应经济发达或不发达的地区。最后的结果,用 survey 的方法的准确率是 75%,用迁移学习的方法准确率是 71%。虽然没有人工的那么好,但是非常省力。


我们现在已经有了不少“迁移学习”在产业应用中的实例。如果已经有了大数据产生的模型,那么在一个新的领域,可以用小数据把大模型迁移过来找到这个领域的要点就是找出两个领域的不变量。我们假设一个领域可以用上亿维的特征来描述,那么我们要找两个领域的特征空间共有的部分来做迁移。


AI落地


网约车识别


这里的一个例子是上海汽车的网约车识别


这个问题是:给定车辆的行驶轨迹,如何判断车辆是否网约车?


我们的策略是引入外部数据来进行迁移学习。外部数据有出租车、公交车的行车轨迹。分两步:首先我们有两个空间,左边是出租车的空间,右边是网约车的空间,我们的目的是把知识从左边搬到右边。但是很明显两边的知识是有差异的,要把这些差异剔除,我们用了半监督学习 + 迁移学习。


640?wx_fmt=png


这个例子告诉我们,AI 的落地首先要目标清晰,清晰到可以把优化函数用数学公式写下来。


第二,需要去找到合适的数据


第三,人才需要领域知识,同时也需要 AI 知识,这种跨界的人才才是 AI 真正需要的人才,否则谈不上落地。


然后,我们也来举一个反例。我们都知道,AI的头几个里程碑都是IBM创造的。但是在AI落地的过程中,IBM也遇到了难题。一个例子就是IBM WATSON在医疗领域的落地。 


我们先来看一下IBM WATSON的流程。 首先,当一个问题到来的时候,系统把输入的问题和知识库里的问题加以对比,再按照匹配的概率排序。 如果有匹配度高的问题,那就可以把对应的答案作为输出。


 在这个流程中,需要知识库的建立,和问题集的收集。当然,这个流程中又很多依靠机器学习的阶段,比如问题的特征抽取,特征空间的建立,匹配的相似度学习,等。但整个流程的建立还是要依靠专家来进行的。


比如,知识库的建立,知识的扩展,以及问答系统在整个医疗系统中的定位等。恰恰因为这些需要人工的地方成为瓶颈,以至于最终用户的定位错误,导致系统并没有完成既定的任务。最后,IBM只能从美国一个很大的医疗机构撤离,也导致了媒体大量的负面报道。


总结起来,这个例子说明,仅仅在一个游戏领域成功(问答的电视大赛),并不表示在开放的实际场景(医疗)就可以取得成功。 首先,IBM  Watson的目标客户群是医生,还是病人? 系统的角色是助手还是替代? 有没有既懂医疗又懂AI的专家在团队中? 系统有没有做到前端和知识库的维护的闭环?这些有关落地的问题,都有待回答。


总结:


第一,人工智能是走了很长的路,但是除了深度学习以外,还有很多的领域有待发掘。所以千万不要以为深度学习就是人工智能。


第二,人工智能在企业的落地是一门大学问,而且是一门艺术性的学问,因为还没有到科学的程度。所以一个问题是,AI 是产品,还是技术,还是解决方案?第二个问题是,AI 如果在一个领域落地成功,需要哪些基本条件?


最后,我觉得非常有趣的一个点,是 AI 出现了以后、会出现一个新的、以机器智能为主体的产业和社会。那么这个新的商业社会也可能会部分地颠覆我们已有的商学院的知识。现有的商学院的知识主要是针对人的管理和人的决策。那么 AI 对应的是机器的管理和机器的决策,这个学问现在还是空白。 


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495477.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安卓逆向_6 --- Dalvik 字节码、Smali 详解

CTF Wiki smali:https://ctf-wiki.org/android/basic_operating_mechanism/java_layer/smali/smali/ 深入理解 Dalvik 字节码指令及 Smali 文件:https://blog.csdn.net/dd864140130/article/details/52076515 安卓逆向入门教程(二&#xff09…

NASA宣布在火星上发现了3种有机分子

图来自美国国家航空航天局来源:海外网摘要:美国国家航空航天局(NASA)召开新闻发布会,公开了火星新发现——好奇号火星探测器在火星上发现了有机分子。当地时间周四(7日),美国国家航空…

Chrome 爬虫插件 Web Scraper

Web Scraper 官网:https://webscraper.io/ 有关webscraper的问题,看这个就够了(建议收藏): https://zhuanlan.zhihu.com/p/34104808https://blog.csdn.net/biggbang/article/details/86251526 web scraper 入门到精通…

AI新方向: 科学家们暂停模仿“人脑”,公布了新路线图

来源:华尔街新闻摘要:科学家们一直致力于创造一种像人类一样思考的机器,但经过一段时间的探索,这一进程遇到了阻碍,他们基本上已经暂停了模仿“人脑”,转而研究已有发现的应用。科学家们一直致力于创造一种…

Hack.Chat 在浏览器里快速建立简单、随用即丢线上聊天室,无须下载安装软体

From:http://www.luoxiao123.cn/1554-6.html 有时候想跟其他使用者线上文字对话,但又不想把自己的联络资料(例如 Facebook 或即时通讯帐号)泄漏给对方,有些人可能会选择申请一个临时使用的帐号,但这未免也太…

CCAI2018 | 韩家炜:大规模文本数据挖掘的新方向

来源:中国人工智能学会现实中的大数据常常表示为一种非结构化,交叉和动态变化的文本数据。如何从大规模文本数据中抽取结构化知识是一个非常值得研究的任务。很多研究工作依赖于劳动密集型的数据标注,用有监督的方法去抽取知识。但是&#xf…

关于面试宝典中的各个问题(一)

1、关于浮点数1.0f在内存中的表示:是3f800000. 各个类型所占的字节数(byte),1byte8bit char 1 short 2 bool 1 int 4 long 4 float 4 double 8 long double 8 char * 4 int * 4 float * 4 以上是对于我的电脑,在典型…

安卓手机 Python 自动化( uiautomation、uiautomation2、weditor )

其他自动化工具或者框架: Airtest:https://airtest.readthedocs.io/zh_CN/latest/autojs:Auto.js快速入门实战教程:https://zhuanlan.zhihu.com/p/90065914appium:https://blog.csdn.net/freeking101/article/details…

揭秘|多伦多大学反人脸识别,身份欺骗成功率达99.5%

来源 :机器人大讲堂摘要:在一些社交媒体平台,每次你上传照片或视频时,它的人脸识别系统会试图从这些照片和视频中得到更多信息。比如,这些算法会提取关于你是谁、你的位置以及你认识的其他人的数据,并且&am…

安卓逆向_8 --- Android 调试工具 DDMS 和 Monitor ( 去掉 车来了 app 的广告 )

From:https://www.e-learn.cn/topic/3527658 Android SDK 中的 ddms 使用详解:https://blog.csdn.net/x83853684/article/details/80643131 ADB、Android Monitor、DDMS、HierarchyViewer、MAT、SysTrace、TraceView 性能分析工具使用大全:…

杂谈 | 微软复兴,它与苹果竟有这么多相似之处!

来源:网易智能摘要:且不要谈CEO们是否会让他们公司的“重生”,仅仅是成为一个成功帝国的好管家就已经是一项了不起的成就了。上周,微软市值超过了谷歌母公司Alphabet,成为继苹果(Apple)和亚马逊…

全能终端神器 --- MobaXterm 、开启 linux 远程桌面

From:https://cloud.tencent.com/developer/news/244102 官网地址:https://mobaxterm.mobatek.net MobaXterm 20.2_Professional.7z 下载地址:https://download.csdn.net/download/freeking101/12363312 MobaXterm 又名 MobaXVT&#xff0c…

教机器遗忘或许比学习更重要:让AI健忘的三种方式

大数据文摘出品编译:臻臻、Shan LIU、龙牧雪大部分人不会喜欢遗忘的感觉。回到家顺手把钥匙丢在一个角落就再也想不起来放在哪儿了,街角偶遇一个同事却怎么拍脑袋也叫不出他的名字……我们害怕遗忘,讨厌遗忘。然而,生而为人&#…

一套价值十万的微信公众号采集解决方案

From:http://www.blog2019.net/post/138 原文地址 相关阅读: 一套价值十万的微信公众号采集解决方案(免费送) 数据采集采集架构中各模块详细分析 基于大数据平台的互联网数据采集平台基本架构 教你一种1分钟下载1万个网页的方法,你学吗&a…

2018 年全球人工智能与机器人峰会将在深圳举办

来源:雷锋网摘要:第三届 CCF-GAIR —— 2018 年全球人工智能与机器人峰会,深圳,2018 年 6 月 29 日至 7 月 1 日。2018 年,AI 学术界与工业界的核心议题已演变为“基础理论技术创新”和“行业解决方案落地”&#xff0…

Grafana 使用教程 --- 开源的度量分析与可视化套件

原文链接:https://blog.csdn.net/bbwangj/article/details/81109615 Linux下使用GrafanaInfluxDBMongoDB实现爬虫可视化动态监控【附代码及详细教程】 https://www.jianshu.com/p/9de223e05a5e Grafana是一个开源的度量分析与可视化套件。经常被用作基础设施的时间…

美国重夺超算“头把交椅”,专家建议中国加快E级超算研制

“顶点”超算 橡树岭国家实验室网站图来源:科技日报摘要:美国能源部下属橡树岭国家实验室6月8日正式宣布,已研发出被命名为“顶点”的超级计算机。美国能源部下属橡树岭国家实验室6月8日正式宣布,已研发出被命名为“顶点”的超级计…

安卓逆向_9 --- log 插桩、Toast 弹窗、smali代码编写和植入 ( 好搜小说 )

From:https://www.bilibili.com/video/BV1UE411A7rW?p36 如果仅仅用 Smali 来分析代码,效果其实不如用 dex2jar 和 jd-gui 更直观,毕竟看反编译的 java 代码要更容易一些。 但 Smali 强大之处就是可以随心所欲的进行插桩操作。何为插桩&…

智能哲学:“学习机器”与“机器学习” ——解读图灵思想中的人工智能

周剑铭,自由学者。研究方向为中西文化比较研究,智能哲学,算法、不确定性和不确定性问题(NP)理论。柳渝,法国儒勒凡尔纳公立综合大学计算机(Dpartement Informatique, UFR des Sciences, Universit de Picardie Jules V…

安卓逆向_10 --- Log 日志的插入和分析、toast方法、栈跟踪

From:https://blog.csdn.net/weixin_42680210/article/details/90384358 在安卓逆向中,常常用到 栈跟踪、toast方法、Log日志的插入 等,以便于我们更好的分析代码,下面就演示下这三个方法的使用及简单的分析。。。 1. 插入 Log 信…