Boltzmann Machine 入门(2)

Boltzmann Machine 入门(2)

news/2025/7/6 19:19:06/文章来源:https://blog.csdn.net/jyl1999xxxx/article/details/51173724

发现RBM 中的能量函数概念需要从Hopfield网络的角度理解，于是找到

http://blog.csdn.net/roger__wong/article/details/43374343

和关于BM的最经典论文

http://www.cs.toronto.edu/~hinton/papers.html#1983-1976

一、限制玻尔兹曼机的感性认识

要回答这个问题大概还要从神经网络说起。

（1）人工神经网络（artificial neural network）

一言以蔽之，人工神经网络用于学习一个输入到输出的映射，通常由三层组成，输入层，隐层和输出层。

各层之间的每个连接都有一个权值，人工神经网络的训练过程就是学习这个权值。典型的，可以使用随机梯度下降法。

（2）递归人工神经网络（recurrent neural network）

递归人工神经网络的关键在于“递归”二字，其表现为各节点可以形成一个有向环。

可以看到，递归神经网络和普通的人工神经网络最大不同为各隐层节点之间也可以相互联系了，并组成有向环的形式。

递归神经网络的种类有很多，上图所示为"simple recurrent networks" (SRN)。

Hopfield网络也是一种递归神经网络。

（3）玻尔兹曼机

A graphical representation of an example Boltzmann machine.

如图所示为一个玻尔兹曼机，其蓝色节点为隐层，白色节点为输入层。

玻尔兹曼机和递归神经网络相比，区别体现在以下几点：

1、递归神经网络本质是学习一个函数，因此有输入和输出层的概念，而玻尔兹曼机的用处在于学习一组数据的“内在表示”，因此其没有输出层的概念。

2、递归神经网络各节点链接为有向环，而玻尔兹曼机各节点连接成无向完全图。

（4）限制玻尔兹曼机

限制玻尔兹曼机和玻尔兹曼机相比，主要是加入了“限制”（这不是废话么）。

所谓的限制就是，将完全图变成了二分图。如图所示，限制玻尔兹曼机由三个显层节点和四个隐层节点组成。

限制玻尔兹曼机可以用于降维（隐层少一点），学习特征（隐层输出就是特征），深度信念网络（多个RBM堆叠而成）等。

二、Hopfield网络及能量函数

再谈RBM之前，必须说一下Hopfield网络。

Hopfield网络是一种循环型神经网络，如下图：

对于Hopfield神经网络来说，当信号输入后，各神经元的状态会不断变化，最后趋于稳定，或呈现周期性震荡。

假设神经元i连接其它神经元j的权重为w(i,j)，则在Hopfield中，有W(i,i)=0，即神经元不与自己连接，W(i,j)=W(j,i)，即权重矩阵对称。

以上图所示，假设输入的变量为（a1,a2,a3,a4)，而在每一轮t神经元i的状态用y(i,t)来表示，再假设神经元激发函数为sigmod，其中激发界用t(i)表示，则容易得到以下递推式

y(i,0)=sigmod(ai-t(i))

Hopfield模型

（公式1）

这个公式什么意思呢？简而言之就是这个神经元在下一轮是否激发，依赖原始的输入和其它神经元的反馈输入，这样整个神经元的状态就呈现一个随着时间进行变化的过程，而如果权值给定、输入给定，这个变化过程是确定的。

假设对于任意输入，对于任意节点i我们在有限的时刻内能得到y(i,t+1)=y(i,t)，我们就说这个神经网络是稳定的，可以证明，当神经元激发函数是有界连续的，且神经网络各节点连接权重对阵，则Hopfield网络一定是稳定的。

对于一个稳定的神经网络。

我们定义“能量”的增量为以下式子：

Hopfield模型

则根据公式1可以推导出来，节点j的能量增量是小于0的。（如何证明？考虑y取值只能是0或1，再考虑sigmod函数特性很容易得到）

所以我们就能把能量的增量再时间域上进行积分，得到每个节点的能量，再把所有节点的能量加起来，看得到这个神经网络的能量。

推导出来的结果是这样子的：

$E = -\frac12\sum_{i,j}{w_{ij}{s_i}{s_j}}+\sum_i{\theta_i\ s_i}$

可以看到，神经网络的变化过程，实质是一个能量不断减少的过程，最终达到能量的极小值点，也就是稳态。

总结一下就是：递归神经网络由于其结构特性，神经元状态可随时间而变化，将此过程可以抽象成能量递减过程，变化最终会导致稳态，此稳态为能量极小值点

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/313376.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

针对深度学习的GPU芯片选择

针对深度学习的GPU芯片选择

转自：http://timdettmers.com/2014/08/14/which-gpu-for-deep-learning/ It is again and again amazing to see how much speedup you get when you use GPUs for deep learning: Compared to CPUs 10x speedups are typical, but on larger problems one can achi…

阅读更多...

C# 8 - Range 和 Index（范围和索引）

C# 8 - Range 和 Index（范围和索引）

C# 7 的 Span C# 7 里面出现了Span这个数据类型，它可以表示另一个数据结构里连续相邻的一串数据，并且它是内存安全的。例子： 这个图的输出是3，4，5，6。 C# 8 的Range类型而C# 8里面我们可以从一个序列里面…

阅读更多...

第k个排列

第k个排列

1、问题描述给出集合 [1,2,3,…,n]，其所有元素共有 n! 种排列。按大小顺序列出所有排列情况，并一一标记，当 n 3 时, 所有排列如下： “123”“132”“213”“231”“312”“321” 给定 n 和 k，返回第 k 个排列。…

阅读更多...

DCT变换学习

DCT变换学习

http://blog.csdn.net/timebomb/article/details/5960624 timebomb的博客 DCT变换的基本思路是将图像分解为88的子块或1616的子块，并对每一个子块进行单独的DCT变换，然后对变换结果进行量化、编码。随着子块尺寸的增加，算法的复杂度急剧上升…

阅读更多...

敏捷回顾会议的套路与实践分享

敏捷回顾会议的套路与实践分享

01—关于敏捷回顾会议实践过敏捷的人都知道，在敏捷中会有很多的会议要开，比如计划会议（Planning）、站立会议（Daily Scrum）、评审会议（Review）以及回顾会议（Retrospective…

阅读更多...

光栅化坐标映射公式

光栅化坐标映射公式

Direct3D中投影空间内的点坐标与屏幕上（或视口内）点的对应关系， 设屏幕大小为wh，屏幕左上角像素的中心被定义为(0,0)，整个屏幕是从(-0.5,-0.5)-(w-0.5,h-0.5)， 像素将投影空间内的x轴上区间(-1.0-1/w, 1.0…

阅读更多...

朋友圈

朋友圈

1、题目描述班上有 N 名学生。其中有些人是朋友，有些则不是。他们的友谊具有是传递性。如果已知 A 是 B 的朋友，B 是 C 的朋友，那么我们可以认为 A 也是 C 的朋友。所谓的朋友圈，是指所有朋友的集合。给定一个 N * N 的矩阵 M…

阅读更多...

.Net Core AA.FrameWork应用框架介绍

.Net Core AA.FrameWork应用框架介绍

开发多年，一直在从社区获取开源的便利，也深感社区力量的重要性，今天开源一个应用基础框架AA.FrameWork,也算是回馈社区，做出一点点贡献，希望能够帮助类似当年入行的我。AA.FrameWork 是基于.NET core流行的开源类库创建…

阅读更多...

RBM/DBN训练中的explaining away概念

RBM/DBN训练中的explaining away概念

可以参照 Stanford大神DaphneKoller的概率图模型，里面贝叶斯网络一节讲到了explaining away。我看过之后试着谈谈自己的理解。 explainingaway指的是这样一种情况：对于一个多因一果的问题，假设各种“因”之间都是相互独立的，如果…

阅读更多...

.NET Core使用gRPC打造服务间通信基础设施

.NET Core使用gRPC打造服务间通信基础设施

一、什么是RPCrpc（远程过程调用）是一个古老而新颖的名词，他几乎与http协议同时或更早诞生，也是互联网数据传输过程中非常重要的传输机制。利用这种传输机制，不同进程（或服务）间像调用本地进程中…

阅读更多...

排序链表

排序链表

题目描述在 O(n log n) 时间复杂度和常数级空间复杂度下，对链表进行排序。示例 1: 输入: 4->2->1->3 输出: 1->2->3->4示例 2: 输入: -1->5->3->4->0 输出: -1->0->3->4->5解法思路1，归并排序 publi…

阅读更多...

DBN训练学习-A fast Learning algorithm for deep belief nets

DBN训练学习-A fast Learning algorithm for deep belief nets

转载自：http://blog.sciencenet.cn/blog-110554-889016.html DBN的学习一般都是从Hinton的论文A Fast Learning Algorithm for Deep Belief Nets开始。如果没有相关的背景知识，不知道问题的来由，这篇论文读起来是相当费劲的。学习过程中主…

阅读更多...

程序员家的大闸蟹：青壳、白底、肉多、爆黄，现在是吃大闸蟹的最佳时期

程序员家的大闸蟹：青壳、白底、肉多、爆黄，现在是吃大闸蟹的最佳时期

其实，我跟大家一样，也是dotNET跨平台和张队长的忠实粉丝，也是一名程序员。上上周，我在dotNET跨平台的优选商城买了队长推荐人生果，也是第一次吃这个人生果，味道鲜甜、汁水也特别多，但由于快递的…

阅读更多...

环形链表II

环形链表II

1、题目描述给定一个链表，返回链表开始入环的第一个节点。如果链表无环，则返回 null。为了表示给定链表中的环，我们使用整数 pos 来表示链表尾连接到链表中的位置（索引从 0 开始）。如果 pos 是 -1，则…

阅读更多...

YUV常用的两种保存方式_YUY2和YV12

YUV常用的两种保存方式_YUY2和YV12

转自：http://blog.csdn.net/yiheng_l/article/details/3784874 简单的说，YUV的格式在存储上有两类布局: Packed和Plannar。Packed的方式就是把相邻几个象素打包起来。比如把水平方向2个象素打包到一个DWORD里。Planner方式则相反。Y分量和UV分量完全分…

阅读更多...

.NET Core Love gRPC

.NET Core Love gRPC

这篇内容主要来自Microsoft .NET团队程序经理Sourabh Shirhatti的博客文章：https://grpc.io/blog/grpc-on-dotnetcore/， .NET Core 3.0现已提供grpc的.NET 托管实现 grpc-dotnet， gRpc 取代WCF成为 .NET的一等公民。自2018年11月以来&#xf…

阅读更多...

使用两个队列实现一个栈

使用两个队列实现一个栈

栈：先进后出队列：先进先出思路：利用一个队列做主队列，另一个队列作为辅助队列，把元素翻转过来即可。 public class Test {class QueueStack {private Queue<Integer> queueA new LinkedList<Integer>…

阅读更多...

Magicodes.IE已支持通过模板导出票据

Magicodes.IE已支持通过模板导出票据

本次更新如下：【重构】重构HTML、PDF导出等逻辑，并修改IExporterByTemplate为：Task ExportListByTemplate(IList dataItems, string htmlTemplate null) where T : class;Task ExportByTemplate(T data, string htmlTemplate null) where T…

阅读更多...

complementary prior

complementary prior

Complementary Prior 解决了多层网络中层间参数W无法计算的问题。多层有向网络如下图，如果计算 W，我们需要知道第一个隐层的后验概率，那么会遇到几个问题：多层sigmoid网络1）后验概率几乎不可计算，因为所谓…

阅读更多...

Memcached

Memcached

本文来自 58沈剑：https://mp.weixin.qq.com/s/zh9fq_e2BgdIeR8RKtY6Sg memcache是互联网分层架构中，使用最多的的KV缓存。面试的过程中，memcache相关的问题几乎是必问的，关于memcache的面试提问，你能回答到哪一个层次…

阅读更多...

最新文章