AutoEncoder简介

1.介绍

  • 作为一种无监督或者自监督算法,自编码器本质上是一种数据压缩算法自编码器流程图
  1. 编码器: 输入图像(在这个例子中是一个28x28像素的数字“9”)首先被输入到编码器中。编码器的任务是将这个输入压缩成一个更小的、密集的表示形式,称为“code”。这个code通常具有比原始输入更少的维度。在这里,784个像素被编码成了一个维度小于784的code。
  2. 解码器: 解码器主要目的是接收编码器生成的code,然后尝试重构原始输入图像。输出的图像应该尽可能接近原始图像,虽然可能会有一些失真。

总结: 自编码器的编码器和解码器部分通常是同时训练的,目的是让解码器能够尽可能准确地重建编码器的输出。这种类型的网络通常用于特征学习、降维和在无监督学习环境中的数据压缩。

2.特点

  1. 数据相关性: 就是指自编码器只能压缩与自己此前训练数据类似的数据,比如说我们使用mnist训练出来的自编码器用来压缩人脸图片,效果肯定会很差。
  2. 数据有损性: 自编码器在解压时得到的输出与原始输入相比会有信息损失,所以自编码器是一种数据有损的压缩算法。
  3. 自动学习性: 自动编码器是从数据样本中自动学习的,这意味着很容易对指定类的输入训练出一种特定的编码器,而不需要完成任何新工作。

用数学的方式解释编码器和解码器:

  • 编码器将输入压缩为潜在空间表征,编码器会创建一个隐藏层(或多个隐藏层)包含了输入数据含义的低维向量。可以用函数 f(x) 来表示。
  • 解码器将潜在空间表征重构为输出,即通过隐藏层的低维向量重建输入数据。可以用函数 g(x) 来表示。

请添加图片描述

能否用作自然语言的降维:
自编码器的主要目的是进行数据压缩特征学习。通过一个编码器将数据压缩成一个低维的表示(code),然后通过一个解码器尝试重构原始数据。这种过程通常是有损的,目的是捕捉数据中最重要的特征。因此它不能用作自然语言的语句匹配和语义搜索。

学习数据的低维表示: 自动编码器设计的核心是学习输入数据的有效的低维表示。这种表示主要用于数据压缩、去噪、特征提取等,而不是为了理解或比较文本的语义内容。
缺乏语义理解能力: 自动编码器在其基本形式中,并不包括对数据的语义理解。它们通过最小化输入与输出之间的重建误差来学习,这主要关注于数据的表面特征,而非其语义意义。
句子匹配需要上下文理解: 句子匹配和语义搜索通常需要理解句子中的上下文和语义信息。自动编码器的结构并不适合捕获长距离的依赖关系和复杂的语言结构,这对于准确的句子匹配至关重要。
更合适的替代模型: 对于句子匹配任务,向量空间模型(如TF-IDF)、机器学习分类模型(如支持向量机),以及特别是基于变换器(Transformer)的深度学习模型(如BERT)等技术,能够更好地处理语义信息。这些模型通过学习词与词之间的关系和句子的结构,能够更有效地进行句子间的语义比较和匹配。

AutoEncoder(自编码器)与PCA(主成分分析)降维效果对比:

  1. AutoEncoder是一种神经网络,这种神经网络的目标输出就是其输入。自动编码器属于神经网络家族,但它们也和 PCA(主成分分析)紧密相关。【自编码器的目标是学习函数h(x)约等于x】
  2. AutoEncoder既能表征线性变换,也能表征非线性变换;而 PCA 只能执行线性变换。【因为自编码器的网络表示结构:非线性函数的叠加可以使其变成任意复杂的函数】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/35949.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker配置国内镜像加速器

1、搜索阿里云 2、搜索容器镜像服务 点击管理控制台 配置镜像加速器

跌幅高达10.2分!32本Top,Elsevier旗下在检SSCI期刊(2024年6月影响因子更新版)

本周投稿推荐 SSCI • 1区,4.0-5.0(无需返修,提交可录) EI • 各领域沾边均可(2天录用) CNKI • 7天录用-检索(急录友好) SCI&EI • 4区生物医学类,0.1-0.5&…

【单片机毕业设计选题24031】-基于STM32的智能手环设计

系统功能: 使用12864OLED液晶屏显示当前的步数,温度值,心率和报警值,单位是心率/分钟设置步长,测量里程;可以设置温度心率的上下限报警值,设置、加、减;用红外传感器XL01实现心率的测量&#x…

win10免安装配置MySQL8.4.0

注:此教程基于win10 22H2 版本 1、下载最新版本MySQL压缩包 下载链接:MySQL官网下载地址 点击第二行的 ZIP Archive 后面的Download(当前时间2024-06-19最新版本是8.4.0) 2、解压并添加配置文件 下载完毕后,解压缩…

新能源汽车电机分类及工作原理

一、直流电机与交流电机 电机是一种将电能转换为机械能的设备,常见的有直流电机和交流电机两种类型。下面简要介绍它们的原理: 直流电机(DC Motor): 原理: 直流电机的工作原理基于洛伦兹力定律,即电流通过导线时&…

ABAP隐藏选择屏幕F8执行按钮的两种方式

在选择屏幕上画PUSHBUTTON的时候,通常不需要左上角的执行按钮,所以需要隐藏掉,两种方式可以实现,都需要在INITIALZATION或者AT SELECTION-SCREEN OUTPUT事件中完成。 方式1: at selection-screen output.perform ins…

解决 Pyecharts 在 jupyter Lab 上运行图片空白问题!

文章目录 🏳️‍🌈 1 提前声明 JUPYTER_LAB🏳️‍🌈 2 load_javascript()🏳️‍🌈 3 render_notebook()🏳️‍🌈 4 图示🏳️‍🌈 5 可视化项目源码…

C++学习/复习20--继承的权限/向上转换/重定义/默认成员函数/友元/静态成员/菱形虚拟继承/组合

一、继承的概念 二、继承的权限 三、向上转换 四、重定义(隐藏) 五、派生类的默认成员函数 六、继承与友元 七、继承与静态成员 八、菱形继承 数据冗余与二义性 虚拟继承(virtual) 九、继承组合

如何提取mac app中的应用程序图标 x.app图标位置

在macos系统中安装的应用程序 .app的图标都是 以 .icns结尾的,默认位于 .app应用程序包中的Contents/Resources/目录下,只要是在这个目录下的 .icns文件就是这个应用的图标,如:mac版微信的图标就是 /Applications/WeChat.app/Co…

Stirling-PDF 安装和使用教程

PDF (便携式文档格式) 目前已经成为了文档交换和存储的标准。然而,找到一个功能全面、安全可靠、且完全本地化的 PDF 处理工具并不容易。很多在线 PDF 工具存在隐私和安全风险,而桌面软件往往价格昂贵或功能有限。那么,有没有一种解决方案能够…

Appium+python自动化(二十七)-让你在手机找到溜冰一样的感觉666,溜得飞起来 - 低级滑动(超详解)

简介 随着现在智能手机的普及和应用,小到五六岁或者更小的娃娃,老至七八十岁老头老太太都是智能手机的用户,基本上达到每个人都在用,每次在地铁或者公交上,就看看到这样的场面,手指不停地在手机屏幕上来来回…

游戏服务器研究三:bigworld 的 load balance 算法

1. 前言 bigworld 的 load balance 算法的大致思路是知道的,即 动态区域分割 动态边界调整。但具体是怎么实现的,不清楚,网上也不找到相关的文章介绍,所以只能自己看代码进行分析。 本文大致记录我所分析到的算法实现&#xff…

Appium+python自动化(二十八)- 滑呀滑,滑到奈何桥喝碗孟婆汤 - 高级滑动(超详解)

简介   奈何桥上叹奈何,三生石前憾三生,彼岸花下非彼岸,奈何三生彼岸人。 相传过了鬼门关便上一条路叫黄泉路,路上盛开着只见花,不见叶的彼岸花。花叶生生两不见,相念相惜永相失,路尽头有一条…

【JavaScript】流程控制和函数

目录 一、分支语句 1、if语句: 2、switch语句: 二、循环语句 1、while循环语句 2、for循环语句 三、函数声明 1、function 函数名(形参列表){ 函数体 } 2、var 函数名function(形参列表){函数体} 一、分支语句 1、if语句: if(表达式){ }else …

Vue-cli搭建项目----基础版

什么是Vue-cli 全称:Vue command line interface 是一个用于快速搭建Vue.js项目的标准工具,他简化了Vue.js应用的创建和管理过程,通过命令工具帮助开发者快速生成,配置和管理Vue项目. 主要功能 同一的目录结构本地调试热部署单元测试集成打包上线 具体操作 第一步创建项目:…

第三届人工智能、物联网与云计算技术国际会议(AIoTC 2024)

第三届人工智能、物联网与云计算技术国际会议(AIoTC 2024)将于2024年9月13日-15日在中国武汉举行。本次会议由华中师范大学伍伦贡联合研究院与南京大学联合主办、江苏省大数据区块链与智能信息专委会承办、江苏省概率统计学会、江苏省应用统计学会、Sir Forum、南京理工大学、南…

西门子智能电气阀门定位器在冶金生产控制的应用

西门子智能电气阀门定位器在冶金生产控制的应用 1 前 言 在自动化程度越来越高的冶金行业中 ,调节阀起着至关重要的作用,一旦其发生故障, 轻则出现生产事故,停机,停炉影响各级生产指标,生产任务,影响装置的安全运行。重则可能出现人身安全事故,将直接影响家庭的幸福和企…

Android SurfaceFlinger——动画进程销毁(十七)

在动画播放完成后,对动画相关资源释放的同时还需要销毁动画进程。这里我们就来分析一下动画进程的销毁流程。 一、动画进程销毁 动画进程的销毁一般是在桌面进程准备显示的时候,而桌面准备显示是在桌面 Activity 的 Resume 生命周期,我们来看…

美团校招机试 - 小美的平衡矩阵(20240309-T1)

题目来源 美团校招笔试真题_小美的平衡矩阵 题目描述 小美拿到了一个 n * n 的矩阵,其中每个元素是 0 或者 1。 小美认为一个矩形区域是完美的,当且仅当该区域内 0 的数量恰好等于 1 的数量。 现在,小美希望你回答有多少个 i * i 的完美…

redis哨兵模式(Redis Sentinel)

哨兵模式的背景 当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式。 为了解决单点故障和提高系统的可用性,需要一种自动化的监…