人工智能下一阶段,为啥要看互联网巨头?

来源:财讯网

回顾过去的十余年,人工智能的进步可谓“耀眼”。尤其是从2015年“阿法狗”横空出世之后,人工智能行业的发展速度一骑绝尘。归根结底,是人类在人工智能领域探索50余年,最终才在半导体技术和软件技术的帮助下,找到了机器学习领域的突破口。

从2015年起,人工智能行业的发展主题就是把机器学习突破这条“小路”拓宽。安防监控、证券自动交易、文字翻译等一批领域,首先迎来了人工智能的“觉醒”,这与它们自身的数据属性有很大的关系:安防监控的数据都是图像画面;证券行业本身就是数字游戏;人类历史上翻译过的书籍不计其数。

可随着时间的推移,人们发生事情开始转变——在越来越多的应用场景下,数据反倒成为了阻碍人工智能的最大因素。一来越来越复杂的人工智能需要的数据量直线上升,二来现实中的数据孤岛、数据隐私问题难以解决。

对于人工智能行业、亟待人工智能帮助升级的各个产业而言,这都是一个避无可避的挑战,下一阶段的智慧产业必须找到在种种数据限制下继续前进的路径。

目前,“联邦学习”是目前行业内公认最靠谱的解决方法,通过将机器学习与其他数据技术结合,为多方数据特征合作构建一个完全由计算机掌控、高效进行数据价值挖掘的系统。

近日腾讯安全发布的联邦学习应用服务(FLAS),是国内“联邦学习”技术在应用领域的最新成果。通过低成本快速迭代的联合建模服务,FLAS能够在保护所有参与方隐私的同时,有效释放出各方大数据生产力,广泛适应于业务创新的应用场景。

数据,当下人工智能发展的“暗坎”

在机器学习这条路径当中,数据一直扮演着相当重要的角色。虽然各个应用场景存在很多差异,但有两点是一致的:数据越多越好;数据的维度越多越好。

数据量的需求可以参考AlphaGo,Google旗下的DeepMind总共花了两年时间,最终创造出最强大、全面超越人类的围棋人工智能Alpha Zero。相比最早期使用了16万盘人类棋局数据、能够战胜入门职业选手的AlphaGo,Alpha Zero使用了286亿盘、包含人类和机器生成的棋局数据,两者相差达到18000倍。

数据的维度也相当重要,围棋绝对算是一次艰巨的挑战,但棋局实际上都发生在半米见方、只有16行16列黑白子的棋盘之上。围棋相比现实中的问题,实在是太“简单”了,所以在解决现实问题的过程中,往往会用到数倍于简单场景的数据维度。

从数据需求的角度出发,人工智能的应用落地显然应该把所需要的一定量、一定维度的数据聚集到一起,然后用足够的计算力将它们变成可以执行的神经网络。很可惜,这样的操作是不现实的。

现实世界中,人工智能所需的数据,大多都会以“数据孤岛”的方式分布。行业与行业、企业与企业,甚至部门与部门之间,都会存在现实的“数据鸿沟”。对于自身数字经营过程中产生的新型资产,每个主体的数据都是宝贵的,更不要提其中涉及到的用户隐私问题。

近些年愈发严厉的数据法规也带来了很大的挑战,2018年欧盟带头建立新法案《通用数据保护条例》(GDPR),对企业使用用户数据进行了仔细而全面的规定。随之而来的,是对于企业的实际处罚。截止至2019年9月24日,22家欧洲数据监管机构对共87件案件作出了总计3.7亿欧元的行政处罚决定。

中国也在2017年起实施《中华人民共和国网络安全法》和《中华人民共和国民法总则》,明确了网络运营者不得泄露、篡改、毁坏其收集的个人信息。同时,新的《个人信息保护法》、《数据安全法》也在从草案落实成法案的过程中。这些新数据法规的落地实施,必然会对人工智能数据的收集与使用造成了直接的影响。

现实中的种种情况,让人工智能技术落地这一征程,从最早的核心技术驱动,转向了应用中现实问题的解决,也就是如何克服现有的人工智能数据问题。

人工智能行业其实早早地给出了解决方案——“联邦学习”,即在基础的人工智能机器学习核心能力,与一系列数据技术、系统逻辑架构结合,打造出一套系统化的解决方案。利用额外的计算力和网络资源,来实现多方数据价值的汇总,同时实现原始数据不出本地、实际的应用效果还能逼近于直接汇总数据的机器学习。

联邦学习应用服务,帮助银行业解决现实问题

在实际的应用中,金融行业成为联邦学习应用服务的重点落地领域。银行等金融机构长期以来都面对着数据难以融合的问题:作为提供资金往来、各种金融服务的商业机构,并不缺乏数据量。但这些数据大部分都是用户的交易数据,维度相对单一,导致数据的价值很难挖掘。

无论是识别信用卡使用中的违规现象、风险提示,抑或是为用户提供特定的营销推荐,促进业务发展,它们最终服务的对象都是真实的人类客户。后者在实际的生活中其实会源源不断产生各种数据:社交、消费、金融、空间。想要更好地挖掘银行客户的价值,就必须把这些不同类别的数据都加入分析,进而形成对客户的整体性认识。

跨多个行业、很有可能涉及用户隐私风险,这显然是联邦学习发挥自身能力最好的舞台。而腾讯安全最新推出的“腾讯安全联邦学习应用服务”就是联邦学习应用落地领域最新、最有潜力的“舞者”。

腾讯安全联邦学习应用服务是一套典型的纵向联邦学习解决方案,这一类方案通过融合多个机构对相同样本的不同观察进行AI联合建模,最终形成一套针对拥有异构数据的机构,如银行、电商等的联合建模服务。通过采用这套应用服务,最终的数据提供用户隐私得到保障,且各方的数据安全更加可靠,同时全面释放出大数据生产力。

作为一家覆盖众多用户应用领域的互联网巨头公司,以及“联邦学习”本身所具有的前沿技术特性,让腾讯安全联邦学习应用服务从一开始就具备了与目前各种联邦学习项目不同的特点。

首先是“经验”,得益于腾讯自身众多产品、服务,腾讯安全20余年来累积了大量的黑灰产库,形成了包含百亿点、千亿边的黑灰产知识图谱,安全服务已经覆盖中国99% 的网民。

其次是腾讯先进的云计算技术能力,整套腾讯安全联邦学习应用服务既可以基于公有云、也可以基于私有云部署,在具体的部署方式上还支持轻量、便捷、易拓展、易管理的容器技术。

最后是腾讯的互联网“内功”,在腾讯打造联邦学习应用服务的过程中,充分发挥了腾讯内部的互联网产品和工程能力,针对联合建模过程中的通信、稳定性进行了专门的优化:通过通信次数优化、中间结果压缩,减少了联合建模过程中需要传输的数据量,提高效率;另外对于网络环境造成的传输中断,专门打造了模型的断点备份功能,即便数据传输中断也能断点重启,而无需再从零开始。

目前,腾讯安全联邦学习应用服务在实际业务实践中,联合建模新模型的AUC值提升10%-15%,最大KS值提升50%左右。已经与江苏银行、济宁银行、湖北消金、玖富数科、嘉银金科等金融机构达成合作,实现了数据价值的双向赋能。

互联网巨头,下一阶段人工智能的领路人?

放眼人工智能的整体发展趋势,2000年后取得重大突破的机器学习,还将作为人工智能的主要“突破口”,数据也将扮演整个人工智能实现过程中的关键角色。

在人工智能持续的落地中,机器学习这把“大锤”的发展已经开始放缓,在解决了各行各业当中的许多“小钉子”之后,必然需要面对更加难解决的“大钉子”。在短时间内没有办法快速把“锤子”变大的前提下,要通过多人协作——让多个“锤子”劲往一处使的操作方法,来保持、甚至加速人工智能的发展。

但联邦学习终究只是一项技术,它需要面对一系列前提,应用方需要具备:基础的人工智能技术研究实力、多方共同联邦学习系统的工程能力、多方实际操作中的积极参与、相当的前期投入与失败风险。这些对于普通公司和组织不可能的前提条件,对于腾讯这样的互联网巨头就简单多了。

就像腾讯安全联邦学习应用服务一样,腾讯不仅为客户构建了实现联邦学习的通路,同时也将自己积累的宝贵安全黑灰产库加入到了产品服务当中,这种开放、共享合作的心态与行为,很可能会成为未来人工智能发展的重要推动力。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487992.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎样在dos窗口中启动mysql服务器_如何在dos命令中启动mysql或sql server 服务器的一些操作...

dos命令启动mysql或者sql srever 的步骤一.dos命令启动mysql1.进入dos命令窗口2.启动mysql服务器,net start mysql3.登录到mysql服务器中,mysql -hlocalhost -uroot -p123456()4.首先可以先显示所有的数据库,show databases;5.看到有哪些数据…

Python shutil.md

shutil shutil模块包括高级文件操作,例如复制和归档。 Copying Files shutil.copyfileobj(fsrc, fdst[, length]):将类似文件的对象fsrc的内容复制到类似文件的对象fdst。整数length(如果给出)是缓冲区大小。具体地,负…

日本科学家:可观测宇宙中,我们可能是唯一的生命

图片来源:Pixabay长期以来,人类一直渴望在宇宙中找到地外生命的痕迹,但一项于今年早些时候发表的研究,给持有此类想法的人泼了一盆冷水。基于“自然发生”学说以及其中的“RNA世界”假说,研究人员认为在可观测宇宙中&a…

go 接口 构造器_Go 中接口值的复制

我一直在思考 Go 语言它是如何工作的。直到最近我才发现 Go 中一切都是基于值的。当我们向函数传递参数、迭代切片、执行类型断言时我们都可以看到这一现象。在这些例子中,这些数据结构所存储的值的拷贝会被返回。当我刚开始学习 Go 的时候,我对于这种实…

2010年下半年软件评測师(下午)试题分析与解答

真题二(14分):阅读下列说明,回答问题1至问题4,将解答填入答题纸的相应栏内。 说明:某软件公司在研发一个城镇居民保险系统时,为了加快进度,測试工作在系统开发初步完毕之后開始并直接…

【人工智能】人工智能革命与机遇

来源 | 北大AI公开课编辑 | Vincent、Natalie课程导师:雷鸣,天使投资人,百度创始七剑客之一,酷我音乐创始人,北京大学信科人工智能创新中心主任,2000年获得北京大学计算机硕士学位,2005年获得斯…

laravel log 对象_swoole运行模式加速laravel应用的详细介绍(life)

本篇文章给大家带来的内容是关于swoole运行模式加速laravel应用的详细介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。我的官方群点击此处。一、SwooleSwoole号称重新定义了PHP,它是一个PHP扩展,使…

OVS+DPDK Datapath 包分类技术

本文主体内容译于[DPDK社区文档],但并没有逐字翻译,在原文的基础上进行了一些调整,增加了对TSS分类器的详细阐述。 1. 概览 本文描述了OVSDPDK中的包分类器(datapath classifier -- aka dpcls)的设计与实现思路。本文的内容主要牵涉到分类器对…

前端学习笔记

文章目录 1、学习路线2、token的安全储存方案3、跨域4、相关的学习链接 前言:最近在学习前端补齐我的软件技能树,最近简单总结一下 1、学习路线 基本:vue3、ts(js)、 vite、eslint、css(动画、布局) 依赖包:vue-router、vue-i18…

mysql第五章 在线测试_PHP+MySQL来实现在线测试quiz功能

在上一篇文章中,我们介绍了jQuery前端PHP在线测试题效果。这篇文章将结合实例给大家介绍如何使用jQueryPHPMySQL来实现在线测试题,包括动态读取题目,答题完毕后台评分,并返回答题结果。查看演示下载资源:1332次 下载资…

深度揭秘AI换脸原理,为啥最先进分类器也认不出?

文章来源:VentureBeat,arXiv智东西4月20日消息,AI换脸已不是新鲜事,手机应用市场中有多款换脸app,此前也曾曝出有网络IP用明星的面孔伪造色情影片、在大选期间用竞选者的脸制作虚假影像信息等。为了规避Deepfake滥用带…

ASP.NET MVC中在 @RenderBody() 或者 @Html.Partial()中需要使用引入外部js,css

今天想在后台封装一下bootstraptree这个插件,引入jquery.js bootstrap.js bootstrap.css bootstrap-tree.js后,我在页面查看脚本错误就连最简单的 $(function(){ alert("test"); }) 经过一番查看,原来mvc在生成_layout的时候默认先…

用ubuntu远程连接mysql_Ubuntu 安装 MySQL 和远程连接

#安装MySQLsudo apt install mysql-server#进入数据库sudo mysql#修改密码ALTER USER rootlocalhost IDENTIFIED WITH mysql_native_password BY 123;产生用户不能授权的原因是mysql 数据库中user 表中的特定用户(root) 的host 的属性值为localhost.#查看select host, user fro…

中美德工业互联网路径比较

转自丨无锡情报所作者丨王喜文,九三学社中央促进技术创新工作委员会委员、九三学社中央科技委委员过去20年,互联网是改变社会、改变商业最重要的技术;如今,随着5G、物联网以及云计算和大数据、区块链、人工智能技术的迅速发展&…

不同浏览器隐藏默认表单样式

各种appearance: none; 转载于:https://www.cnblogs.com/haimingpro/p/7168738.html

jmeter file upload 变量_通达OA上传漏洞之变量覆盖分析

作者:kw0ng开始通达OA上传到包含漏洞分析的文章已经有很多,本文重点分析,文件上传处决定路径信息是否回显的UPLOAD_MODE参数是怎么传递的。代码分析触发文件上传点位于/ispirit/im/upload.php中,服务端在接收文件信息的同时还需要…

如果卷积神经网络存在根本性的缺陷,你会怎么看?

来源:人工智能头条作者 | Ben Dickson译者 | 香槟超新星经过一段漫长时期的沉寂之后,人工智能正在进入一个蓬勃发展的新时期,这主要得益于深度学习和人工神经网络近年来取得的长足发展。更准确地说,人们对深度学习产生的新的兴趣在…

cacls查看文件权限

PS C:\> cacls .\099260b8-7e81-4d4c-8970-c637011399bf.txt C:\099260b8-7e81-4d4c-8970-c637011399bf.txt BUILTIN\Administrators:(ID)FNT AUTHORITY\SYSTEM:(ID)FBUILTIN\Users:(ID)R F 表示完全控制C 表示更改W 表示写入R 表示读取借钱享受 祸患无穷http://v.youku.…

python语法基础整理_Python基础

Python是一种计算机编程语言。计算机编程语言和我们日常使用的自然语言有所不同,最大的区别就是,自然语言在不同的语境下有不同的理解,而计算机要根据编程语言执行任务,就必须保证编程语言写出的程序决不能有歧义,所以…

产业|嵌入式传感器将是未来机器人等技术增长的核心

来源:EEWORLD移动即服务(MaaS)被认为是智能移动的一个关键要素,而机器人汽车技术将是智能移动的一个重要因素,它又高度依赖于嵌入式传感器。根据市场研究和战略咨询公司Yole development pement (Yole)的预测,在这种情况下&#x…