WAIC|高精准、低成本,九章云极DataCanvas突破AutoML难题

2021 年世界人工智能大会(WAIC)于 7 月 8 日 在上海世博中心拉开帷幕。九章云极DataCanvas董事长方磊受邀参加由世界人工智能大会组委会主办、机器之心承办的“2021 WAIC·AI开发者论坛”,并发表“Hypernets:自动化机器学习的基础框架”主题演讲。
在这里插入图片描述
本次论坛以「后深度学习的 AI 时代」为主题,作为本届 WAIC 开发者单元的主力军,WAIC· AI开发者论坛与 WAIC·开发者日一脉相承,连续三年始终专注 AI 技术人员与开发者。本次论坛邀请了15位学术界和产业界重磅嘉宾,覆盖多模态机器学习及大规模自动生成技术、AutoML框架、智能社区的多模态数据融合、智能制造中的算法平台以及下一代 AI 基础软件能力等话题,共同探讨AI前沿技术。九章云极DataCanvas董事长方磊围绕AutoML框架的重要性和基本抽象、Hypernets的概念模型和重要特性、Hypernets的具体示例三部分向广大开发者奉献了一场干货满满的技术福利。
在这里插入图片描述
AutoML框架的本质是空间搜索

AutoML技术的研发与应用是一个持之以恒的课题,随着对其研发的深入,很多AutoML工具的各部分高度耦合,只能针对特定问题,难以扩展。方磊表示,AutoML框架的本质就是空间搜索,在这里面很重要的思想就是抽象性和层级的必要。

AutoML框架是对AutoML领域面对的问题解构和抽象后形成的基础性支撑,无论是超参数优化、Full-Pipeline搜索还是神经网络架构搜索(NAS)问题,主要围绕3个基本部分:搜索空间(Search Space)、搜索策略(Search Strategy)和评估策略(EstimationStrategy)。AutoML框架应对各部分高度解耦以实现各部分自由扩展,开发者可以在此之上不断丰富搜索算法,设计多样搜索空间,避免共性问题重复开发,针对非共性问题实现灵活扩展,加速迭代效率,大幅低于降低自动机器学习的准入门槛,能够让开发者快速实现自动机器学习的搜索。
在这里插入图片描述
Hypernets——开发者的朋友

一款优秀的AutoML框架应当在上述三个部分具有:富有表现力的搜索空间描述语言、支持高维空间的高效搜索算法和高性能的评估策略。Hypernets作为一个自动机器学习的底层通用框架,满足单节点及分布式高性能的模型训练需求,可以在不同的空间进行搜索与训练,结合各种机器学习和深度学习框架开发专用自动机器学习工具,帮助用户快速开发专用领域的AutoML工具。同时,Hypernets支持最新的神经网络架构搜索(NAS)算法,可以实现深度学习的网络架构设计自动化。

方磊表示,Hypernets与目前众多的机器学习、深度学习框架相结合更快更好的生成自动机器学习工具。用5-10行代码完全可以搜索模型,因此Hyperents一个定位就非常清晰,不管开发一个训练框架还是开发应用模型,都是开发者的朋友。开发训练框架可以让框架使用Hypernets很容易结合出框架本身的自动机器学习能力;如果是开发应用模型,可以组合不同学习训练框架的同时,在上面使用Hypernets,端到端整个pipeline上进行自动机器学习的参数搜索,就会得到非常较好的模型。经过大量在行业上的应用,在特征丰富情况下,Hypernets在搜索能力包括分布式计算能力体现出来很多优势,搜索时间短,算力仅需普通训练的20-30倍,就能够得到一个性能大大提升的模型。

简单快速精准的自动机器学习开发过程

开发者通过Hypernets设计不同的模块空间(Module Space)和相应的参数空间(Parameter Space),通过不同的连接方式(Connection Space)将各个模块空间组合成为一个高维的丰富动态搜索空间(Search Space)。遗传算法作为搜索策略的一个例子,是一种非常有效的寻找局部最优的方法,也可以与其他各类算法组合使用,实现更为强大的策略,例如在空间切分搜索的时候,使用遗传算法加速子空间中的迭代。评估策略的核心在于高效:在评估不精确的情况下,通过指导搜索方向、节省预处理时间、防止过拟合三种方式,减少计算量,高效地利用自动机器学习找到更好的模型。作为Hypernets的一个具体实例,HyperGBM在多个公开数据集上和真实业务场景上,超过或达到了人类专家和其他AutoML工具的水平。
在这里插入图片描述
强大的自动机器学习开源框架:Hypernets家族

Gartner在2020年十大科技趋势中,将以AutoML为代表的AI普及化作为数据与分析领域的重要战略技术之一。作为帮助用户快速开发专用领域的AutoML工具,Hypernets于2019年在GitHub进行开源,结合各种机器学习和深度学习框架开发专用自动机器学习工具,率先突破了机器学习建模过程中不均衡数据、概念漂移、模型泛化能力和大规模数据等诸多挑战,提供开放的训练服务框架,降低了AutoML工具的开发门槛,实现深度学习的网络架构设计自动化。
在这里插入图片描述

方磊提到,AutoML的核心内容是降低门槛构建模型。基于Hypernets框架,九章云极DataCanvas自主研发的HyperGBM不仅能够解决生产化困扰,同时实现了数据预处理、特征衍生、特征筛选、模型超参数优化、模型选择、模型融合全过程的全自动机器学习,仅需5行代码就可以实现高质量的模型,拥有开箱即用、简单易用等特点,解决企业在结构化数据建模的需求。

为避免共性问题重复开发,其研发的HyperKeras支持神经网络架构搜索和超参数优,专注非共性问题,实现灵活高效扩展。此外,九章云极DataCanvas对AutoML技术不断探索,开源项目DeepTables荣获全球知名国际性竞赛第一名,全新定义了深度学习技术在结构化数据分析领域的价值。

Hypernets家族开源地址

Hypernets
https://github.com/DataCanvasIO/Hypernets
HyperGBM
https://github.com/DataCanvasIO/HyperGBM
HyperKeras
https://github.com/DataCanvasIO/HyperKeras

随着人工智能时代对于AutoML需求的增加,九章云极DataCanvas将运用Hypernets框架融合更多的深度学习框架,推动神经网络架构搜索的前沿发展,助力实际应用场景中的深度学习模型落地,并且通过在AutoML、AutoDL领域不断的技术创新,为金融、通信、政府等众多行业实现数智化升级提供新动能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/514640.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

matlab样条插值如何用,三次样条插值matlab实现

%三次样条差值-matlab通用程序 - zhangxiaolu2015的专栏 - CSDN博客 https://blog.csdn.net/zha%【图文】三次样条插值算法详解_百度文库 https://wenku.baidu.com/view/14423f2e1711cc7931b716clcclearxinput(请按照格式[x1,x2,x3...]格式输入yf(x)函数已知点的横坐标xi); %三…

在阿里淘系6个月能有哪些收获成长?

本文作者:刘博文(Berwin),花名“玖五”,畅销书《深入浅出Vue.js》作者、知名技术博主、讲师、阿里巴巴淘系技术部前端技术专家,现负责淘系618、双11等超大型营销活动主会场的终端渲染架构。 回想起年初刚来…

matlab 向前欧拉公式,向前欧拉公式在Matlab解微分方程初值解的问题

向前欧拉公式在Matlab解微分方程初值解的问题0fuqilin1202013.07.04浏览527次分享举报用向前欧拉公式(10.8)求解初值问题,dy/dx-3x8x-7,y(0)1,分别取n10,n100,并将计算结果与精确解作比较,写出在每个子区间[xk,xk1]上的局部截断误差公式&…

我在阿里巴巴做 Serverless 云研发平台

简介: Serverless 云研发平台经过这半年多的蜕变,已经从简单的解决工程链路的平台演进成一个面向研发、上线、运维的全生命周期研发平台,后续要解决的命题会集中在用户低门槛上。 作者 | 林昱(苏河) 技术的成熟度源自大规模的实践&#xff0…

从Gartner报告,看中国数据库崛起

简介: 阿里云,在Gartner公布2020年度全球数据库魔力象限评估结果,作为中国科技公司代表,首次挺进全球数据库第一阵营——领导者(LEADERS)象限,这也是中国数据库40年来首次进入全球顶级数据库行列…

一套存储承载全场景,XSKY星辰天合发布企业级SDS V5系列

编辑 | 宋慧 出品 | CSDN云计算 头图 | XSKY星辰天合V5发布会现场 2021年7月15日,国内数据基础设施技术平台提供商XSKY星辰天合正式发布了企业级软件定义存储V5(以下简称“XSKY SDS V5”)系列产品,通过DATA OS数据操作系统底座升…

首次揭秘云原生Hologres存储引擎

简介: 本文将会首次对外公开介绍Hologres的存储引擎,深度剖析其实现原理和核心技术优势。 概要:刚刚结束的2020天猫双11中,MaxCompute交互式分析(Hologres)实时计算Flink搭建的云原生实时数仓首次在核心数…

什么是 “原型模式” ?

作者:东风玖哥,小灰来源:程序员小灰————— 第二天 —————————————————假如有一天,小灰被外星人抓走了,外星人要拿小灰做实验,想了解小灰在吃得好、睡得好、玩得开心的场景下&#xf…

制造业全链数字化业务转型实践

近日,阿里云Lindorm与Intel、OSIsoft推出了面向工业物联网信息经济(Infonomics)的IT & OT超融合工业数据云解决方案。方案通过云端打通阿里云、Intel的IT技术积累和OSIsoft的OT经验能力,实现对传统技术供需关系的超越&#xf…

从搜索引擎到核心交易数据库,详解阿里云神龙如何支撑双11

简介: 订单峰值58.3万笔/秒,销售额4982亿,阿里云神龙再次成功扛住了全球流量洪峰 2020年的双11,天猫又创造了新的纪录:订单峰值达到创纪录的58.3万笔/秒,销售额达到历史新高4982亿,阿里云神龙再…

云网一体,“湘遇湘融 | 移动云TeaTalk·长沙站 启动倒计时

在企业数字化转型、云服务和国家政策等多重因素驱动下,越来越多的企业、行业和政府机关将业务迁移到云上,单一化的网络连接模式已经不能满足企业“多系统、多场景、多业务”的上云需求,而是要求云和多样化网能力高度协同。中国移动作为运营商…

matlab save txt 乱码,matlab代码或中文复制到word就变成乱码怎么办?

在matlab的edit中编辑的脚本程序复制到word时,注释里面的汉字变为乱码怎么办。下面教你两种解决办法。软件名称:Matlab 7.0.1 R14 SP1 (3CD带序列号)免费版软件大小:1.17GB更新时间:2012-11-03立即下载1、这是我在matlab的edit下面…

EMAS 移动 DevOps 解决方案 —— Mobile DevOps

简介: DevOps这一优秀的软件交付理念在服务端已经有很多相关的实践,那么是否也可以应用到移动端进行交付呢?基于移动端和服务端场景的差异,移动DevOps跟服务端DevOps又有哪些不同和挑战?本文分享阿里云云原生应用研发平…

MongoDB 5.0 来了,原生时序、版本化 API 新特性悉数登场

作者 | 伍杏玲出品 | CSDN云计算(ID:CSDNcloud)据 DB-Engines 数据库最新 7 月流行度排行榜显示,前五名十分稳定:Oracle、MySQL、Microsoft SQL Server、PostgreSQL、MongoDB,其中 MongoDB 是唯一的文档型数…

阿里云Lindorm与Intel、OSIsoft共建IT OT超融合工业数据云

近日,阿里云Lindorm与Intel、OSIsoft推出了面向工业物联网信息经济(Infonomics)的IT & OT超融合工业数据云解决方案。方案通过云端打通阿里云、Intel的IT技术积累和OSIsoft的OT经验能力,实现对传统技术供需关系的超越&#xf…

wamp php5.6 mysql5.6,WampServer 3.0.6 多语言版 集成apache2.4.23 mysql5.7.14 php5.6.25-7.0.10 穿墙书店...

WampServer是一款由法国人开发的Apache Web服务器、PHP解释器以及MySQL数据库的整合软件包,就是Windows Apache Mysql PHP集成安装环境,即在window下的apache、php和mysql的服务器软件。免去了开发人员将时间花费在繁琐的配置环境过程,从而腾出更多精力去…

阿里云数据中台助力零售耐消品新客获取与转化

天猫消电家装联合安永战略咨询基于阿里巴巴品牌数据银行AIPL的资产积累与流转情况,设计了数字化新客运营指标体系NEW。 这一体系以消费者资产作为品牌方经营的运营基石,基于消费者人群的评估、监测、驱动来带动品牌当下及未来商业的增长。关于NEW这一指…

字节大数据手册火了 ! 离线数据/实时数据/数据仓库ETL/实时交易系统/啥都有 !...

最近有幸在一位字节跳动大数据高级工程师手里扒到了这份学习笔记,将部分知识章节发布到了在B站上竟然获得了5000点赞!本来想将文件上传到github上,但由于文件太大有的都无法显示所以直接整理成多个文件夹,供大家学习,也…

专访阿里云 Serverless 负责人:无服务器不会让后端失业

2012 年,云基础设施服务提供商 Iron.io 的副总裁 Ken 谈到软件开发行业的未来,首次提出了 Serverless 的概念,为云中运行的应用程序描述了一种全新的系统体系架构。此后,以 AWS 为代表的云服务厂商将 Serverless 概念逐步落地&…

php模糊搜索慢怎么办,MySQL中文模糊检索问题的解决方法_php

mysql中文模糊检索问题的解决方法来源:林兴陆在 MySQL 下,在进行中文模糊检索时,经常会返回一些与之不相关的记录,如查找 "-0x1.ebea4bfbffaacp-4%" 时,返回的可能有中文字符,却没有 a 字符存在。…