ENAS和DARTs的比较

ENAS(Efficient Neural Architecture Search)和DARTS(Differentiable Architecture Search)都是神经架构搜索(NAS)的有效方法,目标是自动化地找到高性能的神经网络结构。尽管它们都旨在解决NAS的计算成本问题,但它们的思路和技术实现有所不同。下面我们详细探讨它们的主要区别。


1. 搜索空间的定义方式

ENAS:ENAS通过共享参数的方式,将架构搜索过程简化成一个单一的训练过程。在ENAS中,所有子网络共享相同的参数,因此在搜索阶段不需要为每个候选网络重新训练。具体来说,ENAS将整个搜索空间表示为一个大型图结构,每条边代表一个操作(如卷积、池化等),每个路径表示一个子网络。ENAS通过控制器(通常是一个RNN)来选择图中的路径,从而定义一个特定的子网络架构。

DARTS:DARTS使用一种连续松弛的策略,将架构搜索转化为一个可微分的优化问题。DARTS通过“混合操作”的方式,让每一条边都包含所有候选操作,并对这些操作分配一个权重。通过对这些权重进行微分优化,DARTS逐步确定最优的架构参数。最终架构是通过选取每条边上最优的操作来确定的,因此DARTS无需像ENAS一样训练控制器,而是直接通过梯度优化找到最佳架构。

2. 搜索与优化方法

ENAS:ENAS使用强化学习来搜索架构。它包含两个部分:一个控制器网络和一个共享的权重网络。控制器通过强化学习来选择子网络的架构,并基于子网络的性能来更新控制器。这样可以保证控制器在搜索时不断改进生成的架构质量。同时,由于权重共享,ENAS无需为每个子网络重新训练权重,这显著加快了搜索过程。

DARTS:DARTS的优化方法基于梯度下降,属于一种微分架构搜索方法。它将架构参数和模型权重都作为优化变量,通过双层优化(bilevel optimization)来联合优化架构和模型权重。DARTS的梯度优化过程使其不需要强化学习,从而大幅度减少了计算时间,并且相较于ENAS具有更稳定的优化效果。

3. 参数共享方式

ENAS:在ENAS中,所有候选子网络共享同一个参数集,因此在每次采样子网络时,它们的参数均是从同一个大网络中继承的。这种权重共享方式可以大大减少计算资源,因为只需训练一个大的网络而不需要单独训练每个候选架构。然而,这种权重共享可能会引入“架构权重干扰”问题,不同的子网络可能会相互干扰,影响最终的性能。

DARTS:DARTS并没有采用ENAS的完全权重共享方式,而是通过一种“混合操作”的方式进行优化。DARTS在每个节点的边上同时应用所有候选操作,并通过权重来控制每个操作的影响。这种连续松弛的方法使得DARTS能够在整个搜索过程中保留更多的架构信息,并且不同的操作不会像ENAS那样因为权重共享产生干扰。

4. 搜索效率和计算开销

ENAS:ENAS通过强化学习和权重共享显著降低了计算开销,使得NAS的搜索效率大大提高。相比于传统的NAS方法,ENAS在单一GPU上就可以在较短时间内完成搜索。它在复杂度和性能之间做了一定的折衷,通过共享权重来节省资源,但也因此可能导致架构性能不如独立训练。

DARTS:DARTS通过梯度优化实现了高效的架构搜索,避免了强化学习的计算成本。DARTS将搜索空间连续化,使得架构搜索可以通过微分操作完成,从而在资源开销上比传统的NAS方法低很多。DARTS还避免了ENAS中可能出现的权重干扰问题,但其双层优化带来的计算复杂度依然较高,尤其是当搜索空间较大时。

5. 搜索结果的确定性

ENAS:ENAS的搜索过程是基于强化学习的,由于随机性因素的影响,最终的架构不一定是唯一确定的,每次运行ENAS可能会产生不同的结果。

DARTS:DARTS通过梯度下降直接优化架构参数,其结果通常更具确定性。因为DARTS的架构参数优化是基于梯度的,具有相对稳定的收敛效果,因此多次运行DARTS往往会得到较为一致的架构结果。


总结

特性ENASDARTS
搜索方法强化学习微分优化
权重共享权重完全共享混合操作的权重分配
搜索效率较高(通过共享权重减少计算开销)较高(通过梯度优化减少计算开销)
计算开销低(适合在较少资源的条件下进行NAS)中等(双层优化仍有一定计算开销)
确定性低(强化学习中的随机性影响结果稳定性)高(梯度下降的稳定性带来一致性结果)
优势计算资源需求少,搜索速度快搜索结果稳定,不易受权重干扰影响
劣势共享权重可能导致架构权重干扰双层优化有一定复杂性,且对内存需求较高

总结来说,ENAS通过强化学习和权重共享大幅降低了NAS的计算需求,适合在资源有限的场景下快速进行架构搜索;而DARTS则通过连续松弛和梯度优化实现了稳定的架构搜索,更适合在对架构稳定性和性能要求较高的应用场景中使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/59783.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

题目:Wangzyy的卡牌游戏

登录 - XYOJ 思路: 使用动态规划,设dp[n]表示当前数字之和模三等于0的组合数。 状态转移方程:因为是模三,所以和的可能就只有0、1、2。等号右边的f和dp都表示当前一轮模三等于k的组合数。以第一行为例:等号右边表示 j转…

mysql数据库命令备份和同步

使用mysqldump备份192.168.1.198服务上的test_db数据库 mysqldump --column--statistics0 --set-gtid-purgedOFF -uroot -h 192.168.1.198 -p123456 test_db > /use/local/sql_bak/test_db.sql** 使用mysql再192.168.1.199服务上执行数据库备份文件 ** mysql -h 192.168…

ARM64的Mac Node.js前置工作,nvm在线安装

1,通过 终端 ping raw.githubusercontent.com 获取到ip地址185.199.110.133 2,终端输入sudo vi /etc/hosts,打开hosts文件 3,在最后添加 185.199.110.133 raw.githubusercontent.com 保存后退出 3.1,清除环境 完全…

【支付行业-支付系统架构及总结】

记得第一次看埃隆马斯克(Elon Musk)讲第一性原理的视频时,深受震撼,原来还可以这样处理复杂的事务。这篇文章也尝试化繁为简,探寻支付系统的本质,讲清楚在线支付系统最核心的一些概念和设计理念。 虽然支付…

模块化沙箱:深信达如何为数据安全提供全方位保护

在数字化时代,网络安全已经成为企业和个人不可忽视的重要议题。随着网络攻击手段的日益复杂和多样化,传统的安全防护措施已经难以应对日益严峻的安全挑战。在这样的背景下,模块化沙箱技术应运而生,成为网络安全领域的新宠。今天&a…

基于单片机的观赏类水草养殖智能控制系统的设计(论文+源码)

1总体设计 通过需求分析,本设计观赏类水草养殖智能控制系统的总体架构如图2.1所示,为系统总体设计框图。系统采用STM32单片机作为系统主控核心,利用DS18B20温度传感器、TDS传感器、CO2传感器、光敏传感器实现水草养殖环境中水温、CO2浓度、T…

基于Jeecgboot3.6.3vue3的flowable流程增加online表单的审批支持(四)online表单字段控制

更多技术支持与服务请加入我的知识星球或加我微信,名称:亿事达nbcio技术交流社区https://t.zsxq.com/iPi8F 1、首先需要配置操作规则,如下: 配置这个节点的一些字段属性,上面就是有两个隐藏了,一个可以编辑,上面的规则采用json格式保存到数据库里 2、取出这些规则 //根…

分享:文本转换工具:PDF转图片,WORD转PDF,WORD转图片

前言 鉴于网上大多数在线转换工具要么需要收费,要么免费后但转换质量极差的情况,本人开发并提供了PDF转图片,WORD转PDF,WORD转图片等的文本转换工具。 地址 http://8.134.236.93/entry/login 账号 账号:STAR001&a…

星环大数据平台--TDH部署

1.1 准备一台虚拟机 正常安装一台新的虚拟机, 内存16G,cpu8核,硬盘50G 1.2 安装前系统配置改动 修改/etc/hosts文件,确保hostname该文件包含节点的hostname和IP地址的映射关系列表。 hostname由数字、小写字母或“-”组成&am…

Visual Studio2022版本的下载与安装

1-首先打开微软的官网,下面就是链接 下载 Visual Studio Tools - 免费安装 Windows、Mac、Linux免费下载 Visual Studio IDE 或 VS Code。 在 Windows、Mac 上试用 Visual Studio Professional 或企业版。https://visualstudio.microsoft.com/zh-hans/downloads/?…

如何去除图片水印?快来试试这4种图片去水印方法!

去除图片水印是一项普遍存在的图像处理需求,它旨在消除水印对图片视觉效果的干扰,让我们能够更自由、更美观、更专业地使用图片资源。接下来,我们将介绍四种有效的去除图片水印的方法和工具,它们各自具有独特的优势和适用场景。 方…

A day a tweet(sixteen)——The better way of search of ChatGPT

Introducing ChatGPT search a/ad.及时的/及时地 ChatGPT can now search the web in a much better way than before so you get fast, timely a.有关的(relative n.亲戚,亲属;同类事物 a.比较的;相对的) answers with link…

selenium+chromedriver下载与安装

安装selenium 使用pip安装selenium: pip install selenium安装成功: 安装WebDriver 根据你使用的浏览器下载相应的 WebDriver。 Chrome:下载地址Firefox:下载地址Edge:下载地址Safari:下载地址 1、c…

网站模版PageAdmin网站建设模版

网站模版是搭建网站的基础,在当今数字化发达的年代,网站是各大单位在互联网上的门牌和桥梁。一个成功的官网不仅仅能够提升企业形象,还能将浏览用户转化为目标客户。为了达到这个网站的展示目的,那么选择网站模版就尤为重要。今天…

跨子网的WinCC客户机/服务器如何实现通讯?

为了更有效地利用有限的IP地址,为了减少广播对网络带宽的占用从而提高带宽,为了实现在不同子网中应用不同的安全策略从而提高网络安全性,现场通常要求划分子网,将安全等级要求不同的计算机安置在不同的子网中,分开管理…

openresty入门教程:ngx.print ngx.say ngx.log

在OpenResty(一个结合了Nginx和Lua的高性能Web平台)中,ngx.print、ngx.log和ngx.say是处理输出、日志记录和响应发送的常用函数。以下是这些函数的详细教程和使用方法: 1. ngx.print ngx.print用于向客户端发送响应内容。它可以…

Docker部署Oracle 11g

1,拉取镜像: sudo docker pull registry.cn-hangzhou.aliyuncs.com/helowin/oracle_11gsudo docker images 2,启动一个临时容器,用于拷贝数据库文件,挂载到宿主主机,使数据持久化: sudo docke…

中安OCR电子行驶证、驾驶证识别,助力便捷出行与智慧交通

随着数字化技术在各行各业的深入应用,交通管理领域也迈入了新的时代。OCR电子行驶证和电子驾驶证的推出,不仅提升了车辆及驾驶证件管理的效率,更大大方便了车主出行。电子证件的普及,使得交通管理从“实体化”逐渐走向“数字化”&…

[CKS] K8S ServiceAccount Set Up

最近准备花一周的时间准备CKS考试,在准备考试中发现有一个题目关于Rolebinding的题目。 Question 1 The buffy Pod in the sunnydale namespace has a buffy-sa ServiceAccount with permissions the Pod doesn’t need. Modify the attached Role so that it onl…

如何找到系统中bert-base-uncased默认安装位置

问题: 服务器中无法连接huggingface,故需要自己将模型文件上传 ubuntu 可以按照这个链接下载 Bert下载和使用(以bert-base-uncased为例) - 会自愈的哈士奇 - 博客园 里面提供了giehub里面的链接 GitHub - google-research/be…