【AI读论文】AutoML的8年回顾:分类、综述与趋势

论文标题:Eight years of AutoML: categorisation, review and trends

论文链接:https://link.springer.com/article/10.1007/s10115-023-01935-1

本文主要围绕自动机器学习(AutoML)展开了系统性的文献综述,总结了该领域的主要观点和发现。以下是对每个章节的主要观点的归纳总结:

  1. 摘要

  • AutoML的目的:解决机器学习方法在实际应用中所需的技术知识和背景,以及耗时和重复的步骤,使其更加实用。

  • AutoML的发展历程:自2014年出现以来,AutoML领域的发表数量显著增长。

  • 主要技术趋势:神经架构搜索(NAS)的增长明显,算法选择问题逐渐被工作流程组合所取代。

2. 理论背景

  • AutoML的目的:自动化机器学习过程中的各个阶段和任务,以及应用的技术。

  • AutoML的主要任务:超参数优化、神经架构搜索、算法选择和工作流程组合。

3. 综述方法

  • 研究问题:对AutoML领域的研究进行了四个主要问题的调查,包括术语的提取、定量发展趋势、自动化阶段和技术的覆盖范围,以及未来的趋势和开放性问题。

4. AutoML分类法

AutoML分类方法是根据文献综述中提出的三维分类法,对AutoML方法进行分类的一种方法。这个分类方法包括三个维度:自动化的知识发现过程阶段、执行的任务以及应用的技术。让我们对这三个维度进行更详细的介绍:

  • 自动化的知识发现过程阶段:这个维度涉及到AutoML方法所涉及的知识发现过程的不同阶段,例如数据预处理、数据挖掘和后处理等。文献综述发现,AutoML主要集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。这个维度的分类可以帮助研究人员了解不同AutoML方法在知识发现过程的不同阶段上的应用情况。

  • 执行的任务:这个维度涉及到AutoML方法所执行的具体任务,例如超参数优化、神经架构搜索、算法选择和工作流程组合等。文献综述发现,AutoML方法主要集中在超参数优化和神经架构搜索等任务上。这个维度的分类可以帮助研究人员了解不同AutoML方法在执行不同任务时所采用的方法和技术。

  • 应用的技术:这个维度涉及到AutoML方法所应用的具体技术和方法,例如进化算法、贝叶斯优化、梯度下降等。文献综述发现,不同的AutoML方法采用了不同的技术和方法来解决自动化问题。这个维度的分类可以帮助研究人员了解不同AutoML方法所采用的技术和方法的差异和特点。

这个三维分类法为AutoML方法的分类提供了一个全面的框架,帮助研究人员更好地理解和比较不同的AutoML方法。

5. 定量结果

  • 发现AutoML领域的研究数量自2014年以来呈现显著增长,2021年的发表数量几乎是2014年的五倍。

  • 发现AutoML主要集中在数据挖掘阶段,而其他阶段的自动化研究相对较少。

73f6ded6d9c85cd2b9a1b53e9f6d397a.png

AutoML历年相关论文数量

6. 质性结果

  • 发现AutoML领域的主要研究集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。

  • 发现AutoML方法倾向于将自动化过程视为黑匣子问题,限制了生成模型的可解释性或关于达到生成解决方案的过程的解释。

7. 阶段、任务和技术的交叉分析

对AutoML方法在不同维度之间的关系进行了分析。这个分析旨在揭示不同阶段、任务和技术之间的关联,以便更好地理解当前的AutoML研究趋势和存在的挑战。

  • 阶段和任务的关系:通过分析不同任务在自动化知识发现过程的不同阶段中的应用情况,研究人员发现了一些趋势和模式。例如,他们可能发现某些任务在特定阶段中的应用频率较高,而在其他阶段中较低。这有助于了解不同任务在知识发现过程中的角色和重要性。

  • 任务和技术的关系:通过分析不同任务所应用的技术和方法,研究人员可以揭示不同任务所采用的技术趋势。例如,他们可能发现某些任务更倾向于采用特定的技术或方法,而其他任务则更倾向于采用不同的技术。这有助于了解不同任务所涉及的技术和方法的差异和特点。

这种交叉分析有助于揭示AutoML研究中不同维度之间的关系,为研究人员提供了更深入的理解和见解。这种分析有助于发现当前的研究趋势、存在的挑战以及未来的研究方向。

8. 开放性问题、挑战和趋势

在挑战部分,研究人员指出了AutoML领域面临的一些挑战和问题,并对未来的发展趋势进行了推测和讨论。

  • 未覆盖的阶段:研究发现,AutoML主要集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。这意味着AutoML方法尚未涵盖整个知识发现过程,而是集中在部分阶段的自动化上。这表明未来的研究需要更多地关注知识发现过程中其他阶段的自动化,以实现更全面的自动化支持。

  • 缺乏互操作性:目前的AutoML方法通常只自动化知识发现过程的单个阶段,而缺乏不同方法之间的互操作性。这意味着不同的AutoML方法往往是孤立的,难以相互配合和复用。未来的研究需要考虑如何实现不同AutoML方法之间的互操作性,以便更好地支持整个知识发现过程的自动化。

  • 人类角色的作用:AutoML方法通常作为黑匣子方法,缺乏对生成模型的解释和人类参与的支持。未来的研究需要考虑如何将人类纳入AutoML系统的自动化过程中,以实现更好的交互和指导。此外,未来的研究还需要关注如何生成可解释的模型,以便更好地支持人类的理解和解释。

  • 实证验证和可复制性:研究发现,许多AutoML方法在实验验证方面存在一些不足。例如,一些方法只是与简单的机器学习基准进行比较,而缺乏与其他研究的比较。此外,一些方法也缺乏适当的统计框架支持。未来的研究需要更加重视实证验证和可复制性,以确保AutoML方法的有效性和可靠性。

这些挑战和问题为AutoML领域的未来发展提出了一些重要的方向和目标。未来的研究需要关注如何解决这些挑战,以实现更全面、有效和可靠的AutoML方法。

  1. 结论

  • AutoML仍然是一个新兴的领域,面临着许多有前途的挑战,尤其是在神经架构搜索方面的显著发展趋势。

  • 提出了一个AutoML分类法,将有助于未来研究的分类,并为对AutoML感兴趣的研究人员和从业者提供参考。

这些总结突出了AutoML领域的主要发现和趋势,为该领域的研究和实践提供了有价值的见解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/162360.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【文末送书】重磅!这本30w人都在看的Python数据分析畅销书:更新了!

欢迎关注博主 Mindtechnist 或加入【智能科技社区】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和技术。关…

div中添加el-loading(局部loading的使用)

效果&#xff1a;在div中实现el-loading <div class"content-main">{{ hotList }}</div>getHotList(columnType) {this.$nextTick(() > {var loading this.$loading({lock: true,text: "努力加载中...",spinner: "el-icon-loading&qu…

揭示卡尔曼滤波器的威力

一、说明 作为一名数据科学家&#xff0c;我们偶尔会遇到需要对趋势进行建模以预测未来值的情况。虽然人们倾向于关注基于统计或机器学习的算法&#xff0c;但我在这里提出一个不同的选择&#xff1a;卡尔曼滤波器&#xff08;KF&#xff09;。 1960 年代初期&#xff0c;Rudol…

开始通过 Amazon SageMaker JumpStart 在亚马逊云科技上使用生成式 AI

目前&#xff0c;生成式 AI 正受到公众的广泛关注&#xff0c;人们围绕着许多人工智能技术展开讨论。很多客户一直在询问有关亚马逊云科技生成式 AI 解决方案的更多信息&#xff0c;本文将为您进行解答。 这篇文章通过一个真实的客户使用案例概述了生成式 AI&#xff0c;提供了…

感恩节99句祝福语,感恩父母老师朋友亲人朋友们,永久快乐幸福

1、流星让夜空感动&#xff0c;生死让人生感动&#xff0c;爱情让生活感动&#xff0c;你让我感动&#xff0c;在感恩节真心祝福你比所有的人都开心快乐。 2、感恩节到了&#xff0c;想问候你一下&#xff0c;有太多的话语想要说&#xff0c;但是不知从何说起&#xff0c;还是用…

让SOLIDWORKS Composer动画在PPT中随意转换

SOLIDWORKS Composer作为一款易学易用的技术图解软件&#xff0c;非常适合用来给客户展示自己的产品。这里我们教大家如何将Composer文件插入大PPT中&#xff0c;并任意切换文件&#xff0c;用以给客户展示不用的方案和产品。 1.首先大家要安装SOLIDWORKS Composer Player 这个…

【2021集创赛】基于ARM-M3的双目立体视觉避障系统 SOC设计

本作品参与极术社区组织的有奖征集|秀出你的集创赛作品风采,免费电子产品等你拿~活动。 团队介绍 参赛单位&#xff1a;上海电力大学 队伍名称&#xff1a;骇行队 总决赛奖项&#xff1a;二等奖 1.摘要 随着信息技术的发展&#xff0c;AGV&#xff08;Automated Guided Vehic…

21款奔驰GLC260L升级HUD抬头显示 平视仪表信息

随着科技飞速地发展&#xff0c;从汽车领域就可以看出&#xff0c;尤其是汽车的抬头显示器&#xff0c;一经推出就吸引了很多的车主。 升级HUD抬头显示&#xff0c;HUD与汽车系统进行完整的数据信息连接&#xff0c;整合成大数据&#xff0c;然后将一些重要信息映射到车窗玻璃…

中低压MOSFET 2N7002W 60V 300mA 双N通道 SOT-323封装

2N7002W小电流双N通道MOSFET&#xff0c;电压60V电流300mA&#xff0c;采用SOT-323封装形式。超高密度电池设计&#xff0c;适用于极低的ros (on)&#xff0c;具有导通电阻和最大直流电流能力&#xff0c;ESD保护。可应用于笔记本中的电源管理&#xff0c;电池供电系统等产品应…

通过Everything 建立HTTP服务器时指定文件夹共享

在局域网传输文件&#xff0c;高效传输&#xff0c;不限文件大小 1、安装Everything 2、在Everything开启HTTP服务 【工具】—>>【选项】—>>【HTTP服务】启用HTTP服务器&#xff0c;设置HTTP服务器用户名和密码 3、查看网络信息 打开服务端电脑的【命令提示…

SpringCache使用详解

SpringCache 1.新建测试项目SpringCache2.SpringCache整合redis2.1.Cacheable2.2.CacheEvict2.3.Cacheput2.4.Caching2.5.CacheConfig 3.SpringCache问题4.SpringCache实现多级缓存 1.新建测试项目SpringCache 引入依赖 <dependencies><dependency><groupId&g…

内裤洗衣机有用吗?口碑最好的小型洗衣机

想必各位小伙伴都知道我们的贴身衣物&#xff0c;不可以与其他衣服一起在洗衣机中清洗&#xff0c;每次都需要把内衣裤挑选出来手洗&#xff0c;但是我们每天都要上厕所&#xff0c;难免会沾上污渍和细菌&#xff0c;我们在用手搓洗的过程中很难把细菌给清除掉&#xff0c;所以…

ios打包,证书获取

HBuilderX 打包ios界面&#xff1a; Bundle ID(AppID)&#xff1a; 又称应用ID&#xff0c;是每一个ios应用的唯一标识&#xff0c;就像一个人的身份证号码&#xff1b; 每开发一个新应用&#xff0c;首先都需要先去创建一个Bundle ID Bundle ID 格式&#xff1a; 一般为&…

用Python写了一个贪吃蛇大冒险小游戏

一、游戏简介 1.1 游戏操作及游戏规则 &#xff08;1&#xff09;游戏开始后&#xff0c;通过键盘上下左右键控制贪吃蛇移动寻找食物&#xff1b; &#xff08;2&#xff09;贪吃蛇每吃一个食物&#xff0c;身长会增加一个单位&#xff1b; &#xff08;3&#xff09;在正常模…

【HarmonyOS】 低代码平台组件拖拽使用技巧之登录组件

【关键字】 HarmonyOS、低代码平台、组件拖拽、登录组件、代码编辑器 1、写在前面 前面我们介绍了低代码中堆叠容器、滚动容器、网格布局、页签容器以及一些常用容器和组件的拖拽使用方法&#xff0c;本篇我们来介绍一个新的组件&#xff0c;这个组件是属于业务组件——登录组…

Modbus转Profinet网关:PLC与天信流量计通讯的经典案例

无论您是PLC或工业设备的制造商&#xff0c;还是工业自动化系统的维护人员&#xff0c;可能会遇到需要将不同协议的设备连接组合并通讯的情况&#xff0c;Modbus和Profinet是现代工业自动化中常见的两种通信协议&#xff0c;在工业控制领域中被广泛应用。 在这种情况绝大多数会…

快速上手Banana Pi BPI-M4 Zero 全志科技H618开源硬件开发开发板

Linux[编辑] 准备[编辑] 1. Linux镜像支持SD卡或EMMC启动&#xff0c;并且会优先从SD卡启动。 2. 建议使用A1级卡&#xff0c;至少8GB。 3. 如果您想从 SD 卡启动&#xff0c;请确保可启动 EMMC 已格式化。 4. 如果您想从 EMMC 启动并使用 Sdcard 作为存储&#xff0c;请确…

《微信小程序开发从入门到实战》学习二十六

3.4 开发参与投票页面 参与投票页面同样需要收集用户提交的信息&#xff0c;哪个用户在哪个投票选择了什么选项&#xff0c;因此它也是一个表单页面 3.4.1 如何获取投票信息 假设用户A在投票创建页面后填了表单&#xff08;1.创建投票&#xff09;&#xff0c;用户A 点了提交…

山西电力市场日前价格预测【2023-11-24】

日前价格预测 预测说明&#xff1a; 如上图所示&#xff0c;预测明日&#xff08;2023-11-24&#xff09;山西电力市场全天平均日前电价为415.13元/MWh。其中&#xff0c;最高日前电价为685.26元/MWh&#xff0c;预计出现在18:00。最低日前电价为296.84元/MWh&#xff0c;预计…

Web实战:基于Django与Bootstrap的在线计算器

文章目录 写在前面实验目标实验内容1. 创建项目2. 导入框架3. 配置项目前端代码后端代码 4. 运行项目 注意事项写在后面 写在前面 本期内容&#xff1a;基于Django与Bootstrap的在线计算器 实验环境&#xff1a; vscodepython(3.11.4)django(4.2.7)bootstrap(3.4.1)jquery(3…