稀疏自编码器_自编码(AutoEncoder)模型及几种扩展之二

4. 稀疏自编码

假设我们只有一个没有类别标签的训练样本集合{x(1),x(2)...},一个自编码神经网络就是一种非监督学习算法,它使用BP算法,并将目标值设为: y(i)=x(i)。

c803a56fa26aa81859d5bc2c4e1287d1.png

我们的目标是希望得到hW,b(X)≈x。用aj(2)(x)表示输入向量x对隐藏层单元j的激活值。则j的平均激活值:

86296efc831c4000071cd39950784751.png

为了达到稀疏性,也即用最少(最稀疏)的隐藏单元来表示输入层的特征(也即,对每一个输入X, 其特征表示是稀疏的),我们希望所有隐藏层单元平均激活值接近于0.于是应用KL距离:

ae581b6910d8343cbc3e055fcf9715cd.png

其中为了方便书写:

be8942a2231c12d2119814b3820b86fc.png

其中,

是稀疏参数,一般来说选一个很小的数,如0.05。

这样,神经网络整体代价函数就可以表示为:

158b1dfa41e2a6ea66991bffd7151828.png

,其中J(W,b)是BP自身的损失函数,预测损失+参数L2正则(减小权重的幅度,防止过度拟合)

25474d05e10e915ad91d35d5fd8c63e0.png

这样,一个稀疏自编码器就完成了。

代码:

Sparse自编码 Autoencoder, 基本按照标准公式实现##### 设置网络参数 #####
p = 0.05  # 使大部分神经元的激活值(所有神经元的激活值的平均值)接近这个p值
beta = 3  # 控制KL散度所占的比重input_dim = 784
encoding_dim = 64
lambda_val = 0.001  # J(W,b)自带的对W进行的L2正则,weight decayepochs = 50
batch_size = 1024# 自定义正则项函数, 计算KL散度
def sparse_reg(activity_matrix):activity_matrix = K.softmax(activity_matrix, axis=0)  # 把激活值先用softmax归一化p_hat = K.mean(activity_matrix, axis=0)  # 将第j个神经元在batch_size个输入下所有的输出激活值取平均print('p_hat=', p_hat)KLD = p*(K.log(p/p_hat))+(1-p)*(K.log((1-p)/(1-p_hat)))  # 计算KL散度print('KLD=', KLD)return beta*K.sum(KLD)  # 所有神经元的KL散度相加并乘以betainput_img = Input(shape=(input_dim,))h = Dense(encoding_dim,activation='relu',kernel_regularizer=regularizers.l2(lambda_val/2),activity_regularizer=sparse_reg)(input_img)r = Dense(input_dim, activation='sigmoid',kernel_regularizer=regularizers.l2(lambda_val/2),activity_regularizer=sparse_reg)(h)# sparse AE模型
autoencoder = Model(inputs=input_img, outputs=r)
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')
#输出模型结构
print(autoencoder.summary())# 注意:输出是干净的X_train
history = autoencoder.fit(X_train, X_train, batch_size=batch_size, epochs=epochs, verbose=1, validation_data=(X_test, X_test))#编码过程: 取出编码部分
conv_encoder = Model(input_img, h)
#在测试集上进行编码输出,输出图形的编码形式(64维度)
encoded_imgs = conv_encoder.predict(X_test)n = 10
plt.figure(figsize=(20, 8))
for i in range(n):ax = plt.subplot(1, n, i+1)plt.imshow(encoded_imgs[i].reshape(4, 16).T)plt.gray()ax.get_xaxis().set_visible(False)ax.get_yaxis().set_visible(False)
plt.show()#解码过程:
#Predict on the test set
decoded_imgs = autoencoder.predict(X_test)

生成的编码图像(64维)

变稀疏了吗?

94de04147b61f345a23a6948ce6c7bff.png

f5002215ebf07866ff7dd4744c8813e2.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/534769.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux x86 关机 过程,linux在x86上的中断处理过程(详细)

Linux在x86上的中断处理过程一:引言在Intel的文档中,把中断分为两种。一种是异常,也叫同步同断。一种称之为中断,也叫异常中断。同步中断指的是由CPU控制单元产生,之所以称之为同步,是因为只有一条指令执行完毕后才会发出中断。例如除法运算中,除数为零的时候,就会产…

thymealf 高级用法_Thymeleaf

JSP 已经存在很长时间了,很多公司还在用,它看起来像 HTML,但其实并不是,它有一些缺陷。比如,每个页面顶部都需要有如下声明与 Servlet 规范紧密耦合的,依赖 Servlet 容器(意味着无法直接浏览效果)。工作过的…

linux 显卡转码,ffmpeg用GPU转码

8种机械键盘轴体对比本人程序员,要买一个写代码的键盘,请问红轴和茶轴怎么选?有些视频编码太屌,播放起来对CPU消耗巨大,而在电视上或者电视盒子上看视频,编码就需要合适,楼主用的FireTV Stick&a…

ant实例 jmeter_Jmeter+ant搭建环境

1.将jmeter3.3和ant1.9.6放在一个文件夹下2.配置环境a、安装jdk,配置环境变量变量名: JAVA_HOME变量值: C:\Program Files\Java\jdk1.8.0_91 (即jdk安装的位置)变量名: Path (这个变量名已在系统变量中存在,现只需在这…

c语言课程设计作业五子棋,C语言课程设计报告五子棋游戏课程设计

C语言课程设计报告五子棋游戏课程设计 C语言课程设计报告_五子棋游戏-课程设计C语言课程设计报告_五子棋游戏|c语言程序代码编程小程序设计|c语言课程设计报告课程案例**********************************************************//* 本程序在Turbo C或Borland C下编译通过 */…

sqlmap图形化_Web安全:SQL注入工具

原标题:Web安全:SQL注入工具SQL注入工具主要是针对Web服务器后台数据库的注入,其主要目的是获取数据库中的数据。以前常用的SQL注入工具有啊D注入工具及Domain(明小子注入工具),现在常用的SQL注入工具有HackBar、SQLMap、Pangolin…

在c语言程序中 对文件进行操作首先要,《C语言程序设计》试题八及答案

版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如果有侵权请立即联系:55525090qq.com,我们立即下架或…

vue中多行文本标签_vue控制多行文字展开收起的实现示例

这里讲一下,如何使用vue控制多行文字展开收起(也叫控制文字展开隐藏)。效果:这里设置了控制三行,如果超过三行会展示,“显示更多” 超出文字显示省略号。点击“显示更多”会展开所有文案,按钮变成“收起”(未超出三行的…

c语言什么时候需要加分号,归纳一下html中什么时候需要分号什么时候需要冒

公告: 为响应国家净网行动,部分内容已经删除,感谢读者理解。话题:归纳一下html中什么时候需要分号什么时候需要冒号什么时候问题详情:最近初学html和php,弄晕了回答:一般情况下,HTML…

python wheel使用_【转载】Python,使用Wheel打包

转载自: http://blog.sina.com.cn/s/blog_1318255b00102wbtz.htmlPython的第一个主流打包格式是.egg文件,现在大家庭中又有了一个叫做Wheel(*.whl)的新成员。wheel“被设计成包含PEP 376兼容安装(一种非常接近于磁盘上的格式)的所有文件”。在本文中&…

c语言提取七位数讲解,C语言-体育彩票7位数,感受身中500万的fell

//体育彩票7位数,感受身中500万的fell#include #include #include #include //用到随机数函数#include int main(){int iUser[7]; //保存我们购买彩票的号码int iSys[7];//保存开奖的号码int i, j;int count 0;//保存我们中奖号码的个数//srand((unsigned)time(0…

cuda linux编译器_linux下如何编译CUDA+QT(qtcreator下)

具体操作,修改qt项目配置文件pro,在配置后面加入如下代码,我们就实现了qtcuda的交叉编译。# 让你的项目可以看到后缀cu的cuda代码文件OTHER_FILES ./Bll/ImageReconstruction/Cuda/CudaFDK.cu \./Bll/ImageReconstruction/Cuda/CudaFDK_ker…

linux的sonar安装,Linux安装sonar

前置依赖​ mysql 5.6 or 5.7​ jdk 1.81.下载2.安装unzip并解压sonarqube并移动到/usr/localyum install unzipunzip sonarqube-6.7.4.zipmv sonarqube-6.7.4 /usr/local/3.mysql里新增数据库CREATE DATABASE sonar DEFAULT CHARACTER SET utf8;4.修改sonarqube相应的配置vim …

redis内存淘汰和持久化_redis 持久化

一、RDB持久化(一)、RDB介绍可以在指定的时间间隔内生成数据集的 时间点快照(point-in-time snapshot),新快照会覆盖老快照(二)、优点压缩格式,恢复速度快,适合于用做备份…

android实现后台静默安装,Android 静默安装实现方法

Android静默安装的方法,静默安装就是绕过安装程序时的提示窗口,直接在后台安装。注意:静默安装的前提是设备有ROOT权限。代码如下:/*** 静默安装* param file* return*/public boolean slientInstall(File file) {boolean result …

pythonwrite连续写入_python文件写入write()的操作

本文实例为大家分享了python文件写入write()的操作的具体代码,供大家参考,具体内容如下filename pragramming.txtwith open(filename,w) as fileobject: #使用‘w来提醒python用写入的方式打开fileobject.write(i love your name!\ni love your cloth!\…

最新变态传奇android,新开变态传奇单职业

新开变态传奇单职业这款传奇手游中拥有这极为丰富的游戏玩法,玩家既可以进入各种副本中,挑战那些强大的副本boss,也可以和自己的兄弟好友们一起组队,前往各种跨服战场,和全服的高手玩家们一起进行最激烈的战斗。游戏中…

spark sql读取hive底层_[大数据]spark sql读写Hive数据不一致

在大数据公司中,任何一家公司都不会只使用一个框架吧?!skr,skr~~那我们今天就来聊一段 Hive 与 Spark的爱恨情仇就像在一些场景中,需要将外部的数据导入到Hive表中,然后再对这些数据进行额外的处理&#xf…

android手机微信收藏功能实现,Android模仿微信收藏文件的标签处理功能

最近需要用到微信的标签功能(如下图所示)。该功能可以添加已有标签,也可以自定义标签。也可以删除已编辑菜单。研究了一番。发现还是挺有意思的,模拟实现相关功能。该功能使用类似FlowLayout的功能。Flowlayout为一个开源软件(https://github.com/ApmeM/…

strocli64 源码_storcli 简易使用介绍

MegaCli 是LSI公司官方提供的SCSI卡管理工具,由于LSI被收购变成了现在的Broadcom,所以现在想下载MegaCli,需要去Broadcom官网查找Legacy产品支持,搜索MegaRAID即可。关于MegaCli 的使用可以看我的另一篇博文,这里就不再…