马尔可夫链笔记

1 引言

之前学习了伯努利过程和泊松过程,它们是无记忆性,不依赖于过去的状态,今天学习了马尔可夫链,它会依赖于过去的过程,更准确的说是依赖于过去的某种状态。

2 离散时间的马尔可夫链(Markov Chain, MC)

在这里插入图片描述

另一种是转移概率图(transition probability graph),类似:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3 状态分类

一些状态被访问一次后,一定还会被继续访问,而对于另一些状态来说却不是这样的。我们来给我们的状态的可访问性提供一些严格的定义。
在这里插入图片描述
  如果i是常返的,A(i)可以称作常返类,A(i)中的所有状态都是相互可达的,A(i)之外的状态不是从这些状态可达的。用数学语言表达就是对任意的j∈A(i),有A(i)=A(j)。上图状态3和4可以是一个常返类,状态1自身形成一个常返类。
  我们还可以发现一个直观的事实,从任何一个非常返状态出发,至少有一个常返状态是从它可达的,对于一个马尔可夫链至少存在一个常返状态、从而也就至少存在一个常返类.所以,我们可以得到以下结论:

  • 一个马尔可夫链的状态集合可以分解成一个或多个常返类,加上可能的一些非常返状态。
  • 一个常返态从它所属的类里任何一个状态出发是可达的。
  • 从任何一个常返状态出发都不可到达非常返状态。
  • 从一个非常返状态出发,至少有一个常返状态是可达的。

下图我们举了一些例子:
在这里插入图片描述
  我们可以总结出这些规律:

  • 一旦一个状态进入(或开始于)一个常返类,它将停留在这个类里,因为在这个类里的所有状态都是相互可达的,类里所有状态将被无限次的回访。
  • 如果初始状态是非常返的,那么状态转移的路径开始部分包含非常返状态,最后一定是由来自同一个类的常返状态组成的。
    在这里插入图片描述

所以,在一个有周期的常返类中,我们从子集的一个状态出发,一次通过每一个子集,经过d步后又重新回到原来的子集。
  我们还有一个更简单的办法来判断一个常返类是非周期的。给定一个有周期的常返类,对于链中任意一个正时刻n,以及类中的状态i,则必存在一个或多个状态j使得rij(n)=0。原因是从状态i出发,时刻n只可能到达其中一个集合Sk。所以要证明一个给定的常返类R是非周期的,只需验证是否存在一个特定的时刻n≥1和特定的状态i∈R,使得经过n步以后,可以到达R中所有的状态,也就是说,对于所有的j∈R有rij(n)>0。反过来说也是对的,即类R如果是非周期的,当且仅当存在时刻n使得对于任何i,j∈R满足rij(n)>0。

4 稳定性质

我们之前说过,当n非常大时,rij(n)有渐进行为。如果有两个或者更多个常返状态类,很显然rij(n)的极限值一定依赖于初始状态(未来访问j的概率依赖于状态j是否和初始状态i处于相同的类),所以我们将链限定于只有一个常返类,再加上一些可能存在的非常返状态。对于单个常返类的情况研究清楚以后,多个常返类的情况也就变得简单明白了。因为我们知道,一旦状态进入一个特定的常返类,它将一直处于这个类中。所以,可以利用单一类链的渐近行为去理解具有多个常返类的马尔可夫链的渐近行为。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

长期频率概率

考虑一个与机器相关的马尔可夫链,每天工作结束的时候机器有两种状态,正常工作或出现故障,每次出现故障时,就立即花1美元进行维修。我们应该如何建立模型,计算长期的每天平均修理费?

  • 一种可能是将它看成未来任意一天的修理费的均值,这就需要计算故障状态的稳态概率。
  • 另一种方法是首先可以计算n天内的总期望花费,当n很大时再除以n。
    在这里插入图片描述

生灭过程(birth and death process)

我们来谈谈生灭过程,一个生灭过程也是马尔可夫链,它的状态是线性排列的,生灭过程的状态空间为{0,1,⋯,m},且转移只发生在相邻状态之间,或者状态保持不变。实际生活中的排队论就是一个例子。下表示了一个生灭过程的一般结构,也介绍了转移概率的一般情况:

在这里插入图片描述

5 吸收概率(absorption probability)

前面我们考虑的是马尔可夫链的长期行为,下面我们将学习马尔可夫链的短期行为。
  考虑开始于非常返状态的情形,我们感兴趣的是首次访问常返态的分布以及对应的到达时间的分布。在这种情况下,马尔可夫链的后续行为(到达常返态之后)是不重要的,所以我们重点讨论每一个常返态k为吸收的,即:
在这里插入图片描述
在这里插入图片描述

关于吸收概率方程组的解的唯一性这里就不单独证明了。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6 连续的马尔可夫链

我们之前讨论的都是离散时间的马尔可夫链,假设状态都是在单位时间内发生的。接下来我们要考虑连续时间的马尔可夫链,它被用于很多按照连续时间到达的过程,例如通信网络中的分布中心,其中新信号的到达是按照泊松过程到达的。
  
  我们将考虑一个过程,它按照一定的转移概率从一个状态转移到下一个状态,但是我们令两次转移之间的时间是一个连续随机变量,假设状态的个数是有限的,状态空间是集合S={1,⋯,m},记Xn为第n次转移后的概率,Yn为第n次转移的时间,Tn为第n−1次转移和第n次转移的间隔时间。
  
  假设X0表示初始状态,令Y0=0,我们给出假设:

  • 如果当前状态是i,到下一个转移的时间服从已给参数vi的指数分布,且独立于之前的历史过程和下一个状态。
  • 如果当前状态是i,按照给定的概率pij到达下一个状态j,而且独立于之前的历史过程和转移到下一个状态的时间间隔。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

7 Conclusion

马尔可夫链区别于一般随机过程的核心性质是转移概率pij的性质,在当前状态为i的条件下,下一个时刻为状态j的转移概率为pij,这与i所在的时刻是无关的,且独立于时刻以前的状态。所以,给定当前一个状态,未来的状态与过程的过去状态是相互独立的。
  马尔可夫链模型通常涉及到这几个问题:

有关有限时间上过程的统计量的问题。(C-K方程)
有关马尔可夫链的稳态概率的问题。(常返的,周期的,平衡方程组,归一化方程)
有关马尔可夫链的状态转移性质的问题。(吸收概率,平均首访和回访时间)
  最后我们也考虑连续时间的马尔可夫链在这类模型中,给定当前状态下,下一个状态由类似于离散时间的马尔可夫链的相同机制所决定。但是,直到下个转移发生的时间是指数型随机变量,参数只依赖于当前状态连续时间的马尔可夫链在许多方面可以类比离散时间的马尔可夫链,它们具有相同的马尔可夫性质(在给定当前情况下,未来与过去独立)。事实上,人们可以将连续时间的马尔可夫链看成 时间轴上进行细分离散化的离散时间的马尔可夫链。建立这个联系后,连续时间的马尔可夫链与离散时间的马尔可夫链的稳态特性是相似的:假设只有一个常返类,那么处于任何状态的概率,当时间趋于无穷的时候都收敛于一个稳态概率,而且该概率不依赖于初始状态稳态概率可以通过求解平衡方程组和归一化方程得到。

8 Refer

  • 概率导论https://book.douban.com/subject/26694188/

原文: http://chengfeng96.com/blog/2019/04/28/马尔可夫链笔记/  作者: Hazza Cheng

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/345500.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「协方差」与「相关系数」的概念

一、协方差: 可以通俗的理解为:两个变量在变化过程中是同方向变化?还是反方向变化?同向或反向程度如何? 你变大,同时我也变大,说明两个变量是同向变化的,这时协方差就是正的。 你…

垃圾收集 java_关于Java垃圾收集

垃圾收集 java本文讨论的是使用的最流行的框架之一带来的开销–我敢打赌,几乎没有应用程序不使用java.util.Collections。 本文基于以下事实:框架为例如集合的初始大小提供了默认值。 因此,我们有一个假设,即大多数人不会费心地自…

Latex \bibliographystyle+修改字体字号的大小

1. bibliography style LaTeX 标准选项及其样式共有以下8种: plain ,按字母的顺序排列,比较次序为作者、年度和标题. unsrt ,样式同plain,只是按照引用的先后排序. alpha ,用作者名首字母年份后两位作标号…

boxplot

1. 简介 箱形图,又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。箱形图于1977年由美国著名统计学家约翰图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、上下四分位数及…

Java 11的期望

过去的几年对Java世界一直是动荡不安的,在相当多的发行版中添加了各种各样的功能。 在开发人员社区中,人们逐渐意识到Java的开发速度不够快。 在最初的20年中,Java平台和Java开发工具包(JDK)经历了庞大,不…

martingale与Markov Process的关系

鞅过程与马尔科夫过程是什么关系? 1.鞅代表的是公平游戏,马尔可夫过程侧重过程无记忆性 总而言之:鞅和马尔可夫过程没有包含的关系。因为鞅代表的是公平游戏,而马尔可夫过程侧重过程无记忆性。两者没有内在联系。 注&#xff1…

LaTeX双栏模板插入通栏公式(跨栏插图)

1. 利用带星号的浮动体环境 带星号的浮动体figure和table环境可以在双栏模板中使用,例如我们以IEEEtran为例,插入通栏公式 \documentclass{IEEEtran} \usepackage{amsmath,lipsum} \begin{document} \lipsum[1] \begin{figure*} \begin{ali…

renew process 更新过程

一个泊松过程可以分解成一系列 i.i.di.i.di.i.d 的指数分布随机变量相加,如果把指数分布换成其他 i.i.di.i.di.i.d 的分布就得到了更新过程。 更新过程本身是泊松过程的一种扩长,同时更新过程也可以发展出一套更新理论,包括更新方程等。 htt…

离散时间信号,连续时间信号,模拟信号,数字信号区别

连续时间信号 : 在时间t 上是连续的值 时间连续, 幅值连续。 定义为模拟信号。时间连续, 幅值离散。 比如脉冲信号。 离散时间信号 : 在时间t上 是离散的值 时间离散, 幅值连续。 (在任意两个离散时间点…

java8 javafx_Java8中的外观(JavaFX8)

java8 javafxJavaFX8在外观方面进行了一些更改 ,其中最相关的是新CSS API ,它允许您为控件以及已公开的Skin类创建新CSS属性和伪类。 使用CSS可以更改控件的很多外观,但是CSS可以实现很多功能,这就是Skin类的用处。从“ UI控件体…

如何通俗易懂地解释卷积?

马同学 从数学上讲,卷积就是一种运算。 某种运算,能被定义出来,至少有以下特征: 首先是抽象的、符号化的 其次,在生活、科研中,有着广泛的作用 比如加法: [公式] ,是抽象的&…

具有中央异常处理和VO验证的Spring Data JPA –框架

1.简介 一段时间以来,Spring框架已成为事实上的标准,可以创建任何基于REST API的应用程序。 Spring提供了各种现成的组件,以避免编写重复而繁琐的样板代码。 另外,关于Spring的美丽之处在于,如果有现成的解决方案&…

初识斯蒂尔杰斯积分(Stieltjes integral)

https://blog.csdn.net/Northernland/article/details/83051415

drools6.5_使用Drools 6.0进行部署

drools6.5KieScanner 6.0 KieScanner取代了5.x KnowledgeAgent。 它使用嵌入式Maven允许在运行时解析和检索jar。 6.0应用程序现在可以轻松支持依赖关系和可传递依赖关系; 使用众所周知的Maven语义进行版本控制。 它允许在类路径上部署,也可以在运行时动…

双子(Dioid)

双子代数是若其对任意无限多元的 “和”封闭且乘法对此无限和具分配律。 https://baike.baidu.com/item/%E5%8F%8C%E5%AD%90%E4%BB%A3%E6%95%B0

具有外部Zookeeper集成并使用SOLRJ API访问数据的SOLR cloud 7.4集群配置

SOLR是最流行且高度可扩展的搜索引擎之一,它基于分布式索引技术运行。 Solr索引几乎可以基于任何类型的数据源(CSV数据或XML数据或从RDBMS数据库或标准文件系统中提取的数据)构建。 对于以RDBMS数据库作为后端构建的任何Web应用程序&#xf…

随机过程及其稳态stability

1. 为什么要研究随机过程? 人类认识世界的历史,就是一认识和描绘各种运动的历史,从宏观的天体运动到分子的运动,到人心理的运动-我们通称为变化,就是一个东西随时间的改变。 人们最成功的描绘运动的模型是牛顿的天体…

求离散马尔科夫链的平稳分布+按照一定概率分布生成想要的样本

1. 求离散马尔科夫链的平稳分布的两种解法 假设离散马尔科夫链的转移矩阵为P PP,平稳分布为π \piπ,则平稳分布满足: PππP \pi \piPππ 1.1 迭代法 求平稳分布的一种简单方法是迭代法,即随机初始化初始分布π 0 \pi_0π 0 …

MCMC 和 Gibbs采样

0. MCMC 从名字我们可以看出,MCMC由两个MC组成,即蒙特卡罗方法(Monte Carlo Simulation,简称MC)和马尔科夫链(Markov Chain ,也简称MC)。 Monte Carlo (蒙特卡罗&#x…

使用Java流和In-JVM-Memory的超低延迟查询

自然界的基本规则(例如光速和通用信息论)对我们可以从传统系统体系结构中获得的最大性能设置了明显的限制。 了解您作为Java开发人员如何使用JVM技术和Java流将性能提高几个数量级。 例如,如果应用程序服务器和数据库服务器相距100 m&#…