AutoEncoder简介

1.介绍

  • 作为一种无监督或者自监督算法,自编码器本质上是一种数据压缩算法自编码器流程图
  1. 编码器: 输入图像(在这个例子中是一个28x28像素的数字“9”)首先被输入到编码器中。编码器的任务是将这个输入压缩成一个更小的、密集的表示形式,称为“code”。这个code通常具有比原始输入更少的维度。在这里,784个像素被编码成了一个维度小于784的code。
  2. 解码器: 解码器主要目的是接收编码器生成的code,然后尝试重构原始输入图像。输出的图像应该尽可能接近原始图像,虽然可能会有一些失真。

总结: 自编码器的编码器和解码器部分通常是同时训练的,目的是让解码器能够尽可能准确地重建编码器的输出。这种类型的网络通常用于特征学习、降维和在无监督学习环境中的数据压缩。

2.特点

  1. 数据相关性: 就是指自编码器只能压缩与自己此前训练数据类似的数据,比如说我们使用mnist训练出来的自编码器用来压缩人脸图片,效果肯定会很差。
  2. 数据有损性: 自编码器在解压时得到的输出与原始输入相比会有信息损失,所以自编码器是一种数据有损的压缩算法。
  3. 自动学习性: 自动编码器是从数据样本中自动学习的,这意味着很容易对指定类的输入训练出一种特定的编码器,而不需要完成任何新工作。

用数学的方式解释编码器和解码器:

  • 编码器将输入压缩为潜在空间表征,编码器会创建一个隐藏层(或多个隐藏层)包含了输入数据含义的低维向量。可以用函数 f(x) 来表示。
  • 解码器将潜在空间表征重构为输出,即通过隐藏层的低维向量重建输入数据。可以用函数 g(x) 来表示。

请添加图片描述

能否用作自然语言的降维:
自编码器的主要目的是进行数据压缩特征学习。通过一个编码器将数据压缩成一个低维的表示(code),然后通过一个解码器尝试重构原始数据。这种过程通常是有损的,目的是捕捉数据中最重要的特征。因此它不能用作自然语言的语句匹配和语义搜索。

学习数据的低维表示: 自动编码器设计的核心是学习输入数据的有效的低维表示。这种表示主要用于数据压缩、去噪、特征提取等,而不是为了理解或比较文本的语义内容。
缺乏语义理解能力: 自动编码器在其基本形式中,并不包括对数据的语义理解。它们通过最小化输入与输出之间的重建误差来学习,这主要关注于数据的表面特征,而非其语义意义。
句子匹配需要上下文理解: 句子匹配和语义搜索通常需要理解句子中的上下文和语义信息。自动编码器的结构并不适合捕获长距离的依赖关系和复杂的语言结构,这对于准确的句子匹配至关重要。
更合适的替代模型: 对于句子匹配任务,向量空间模型(如TF-IDF)、机器学习分类模型(如支持向量机),以及特别是基于变换器(Transformer)的深度学习模型(如BERT)等技术,能够更好地处理语义信息。这些模型通过学习词与词之间的关系和句子的结构,能够更有效地进行句子间的语义比较和匹配。

AutoEncoder(自编码器)与PCA(主成分分析)降维效果对比:

  1. AutoEncoder是一种神经网络,这种神经网络的目标输出就是其输入。自动编码器属于神经网络家族,但它们也和 PCA(主成分分析)紧密相关。【自编码器的目标是学习函数h(x)约等于x】
  2. AutoEncoder既能表征线性变换,也能表征非线性变换;而 PCA 只能执行线性变换。【因为自编码器的网络表示结构:非线性函数的叠加可以使其变成任意复杂的函数】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/35949.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker配置国内镜像加速器

1、搜索阿里云 2、搜索容器镜像服务 点击管理控制台 配置镜像加速器

跌幅高达10.2分!32本Top,Elsevier旗下在检SSCI期刊(2024年6月影响因子更新版)

本周投稿推荐 SSCI • 1区,4.0-5.0(无需返修,提交可录) EI • 各领域沾边均可(2天录用) CNKI • 7天录用-检索(急录友好) SCI&EI • 4区生物医学类,0.1-0.5&…

【AI应用探讨】—朴素贝叶斯应用场景

目录 文本分类 推荐系统 信息检索 生物信息学 金融领域 医疗诊断 其他领域 文本分类 垃圾邮件过滤:朴素贝叶斯被广泛用于垃圾邮件过滤任务,通过邮件中的文本内容来识别是否为垃圾邮件。例如,它可以基于邮件中出现的单词或短语的概率来…

【单片机毕业设计选题24031】-基于STM32的智能手环设计

系统功能: 使用12864OLED液晶屏显示当前的步数,温度值,心率和报警值,单位是心率/分钟设置步长,测量里程;可以设置温度心率的上下限报警值,设置、加、减;用红外传感器XL01实现心率的测量&#x…

win10免安装配置MySQL8.4.0

注:此教程基于win10 22H2 版本 1、下载最新版本MySQL压缩包 下载链接:MySQL官网下载地址 点击第二行的 ZIP Archive 后面的Download(当前时间2024-06-19最新版本是8.4.0) 2、解压并添加配置文件 下载完毕后,解压缩…

新能源汽车电机分类及工作原理

一、直流电机与交流电机 电机是一种将电能转换为机械能的设备,常见的有直流电机和交流电机两种类型。下面简要介绍它们的原理: 直流电机(DC Motor): 原理: 直流电机的工作原理基于洛伦兹力定律,即电流通过导线时&…

ABAP隐藏选择屏幕F8执行按钮的两种方式

在选择屏幕上画PUSHBUTTON的时候,通常不需要左上角的执行按钮,所以需要隐藏掉,两种方式可以实现,都需要在INITIALZATION或者AT SELECTION-SCREEN OUTPUT事件中完成。 方式1: at selection-screen output.perform ins…

解决 Pyecharts 在 jupyter Lab 上运行图片空白问题!

文章目录 🏳️‍🌈 1 提前声明 JUPYTER_LAB🏳️‍🌈 2 load_javascript()🏳️‍🌈 3 render_notebook()🏳️‍🌈 4 图示🏳️‍🌈 5 可视化项目源码…

C++学习/复习20--继承的权限/向上转换/重定义/默认成员函数/友元/静态成员/菱形虚拟继承/组合

一、继承的概念 二、继承的权限 三、向上转换 四、重定义(隐藏) 五、派生类的默认成员函数 六、继承与友元 七、继承与静态成员 八、菱形继承 数据冗余与二义性 虚拟继承(virtual) 九、继承组合

从零开始精通Onvif之常见故障排查

💡 如果想阅读最新的文章,或者有技术问题需要交流和沟通,可搜索并关注微信公众号“希望睿智”。 概述 Onvif作为统一标准,在理论上应该能够解决网络视频监控产品之间的兼容性问题。但在实际使用中,仍然会出现各种各样的…

如何提取mac app中的应用程序图标 x.app图标位置

在macos系统中安装的应用程序 .app的图标都是 以 .icns结尾的,默认位于 .app应用程序包中的Contents/Resources/目录下,只要是在这个目录下的 .icns文件就是这个应用的图标,如:mac版微信的图标就是 /Applications/WeChat.app/Co…

Spring Boot集成findbug快速入门Demo

1.什么是findbug? FindBugs 是一个静态分析工具,它检查类或者 JAR 文件,将字节码与一组缺陷模式进行对比以发现可能的问题。有了静态分析工具,就可以在不实际运行程序的情况对软件进行分析。不是通过分析类文件的形式或结构来确定…

常见漏洞之XSS

一、XSS简介 XSS(Cross-Site Scripting,跨站脚本攻击)是一种常见的网络攻击方式,通过在网页中注入恶意脚本,当其他用户浏览这些网页时,这些嵌入的恶意脚本会在其浏览器上执行,从而进行各种恶意…

Eureka服务治理深度解析:服务下线与剔除机制揭秘

Eureka服务治理深度解析:服务下线与剔除机制揭秘 在微服务架构中,服务的动态注册与发现是保证系统高可用性的关键。Netflix开源的Eureka作为服务发现框架,其服务下线与剔除机制是确保服务列表准确性的重要手段。本文将深入探讨Eureka中的服务…

通过docker启动Jenkins容器报错

项目场景: 通过docker启动Jenkins容器 问题描述 Jenkins容器启动失败,通过sudo docker logs -f jenkins命令 查看日志如下: touch: cannot touch ‘/var/jenkins_home/copy_reference_file.log’: Permission denied Can not write to /var…

如何实现免交互

如何实现免交互 一、免交互 交互:我们发出指令控制程序的运行,程序在接收到指令之后按照指令的效果做出对应的反应 免交互:间接的通过第三方的方式把指令传送给程序,不用直接的下达指令 Here Document免交互:这是命…

Stirling-PDF 安装和使用教程

PDF (便携式文档格式) 目前已经成为了文档交换和存储的标准。然而,找到一个功能全面、安全可靠、且完全本地化的 PDF 处理工具并不容易。很多在线 PDF 工具存在隐私和安全风险,而桌面软件往往价格昂贵或功能有限。那么,有没有一种解决方案能够…

消防工程乙级资质申报办理所需标准

企业资质要求: 必须具备独立的法人资格。社会信誉良好,无不良记录。注册资本不少于100万元人民币。 技术条件: 专业技术人员配置:至少需要10名主要技术人员,具体包括电气专业2人、自动控制专业2人、给排水专业2人、暖通…

Appium+python自动化(二十七)-让你在手机找到溜冰一样的感觉666,溜得飞起来 - 低级滑动(超详解)

简介 随着现在智能手机的普及和应用,小到五六岁或者更小的娃娃,老至七八十岁老头老太太都是智能手机的用户,基本上达到每个人都在用,每次在地铁或者公交上,就看看到这样的场面,手指不停地在手机屏幕上来来回…

使用Spring Boot和Thymeleaf构建动态Web页面

使用Spring Boot和Thymeleaf构建动态Web页面 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天,我们将探讨如何利用Spring Boot和Thymeleaf构建动…