Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。
文章梗概
马尔科夫是何人?
马尔科夫性质是什么?
马尔科夫模型是什么?
是什么让马尔科夫模型成为隐性的?
一种能够用于条件检测的马尔科夫模型
结论
参考文献
马尔科夫是何人?
马尔科夫是一位俄国的数学家,他最为人所知的是他在随机过程方面的研究。他早期研究的重点是数论而在1900年之后他所研究的重点转向了概率论。他研究的成果颇丰以至于在他1905年正式退休之后他仍然在教授课程直至去世。在他的研究中,马尔科夫成功地拓展了大数定理以及中心极限定理,并将其应用于由独立随机变量组成的特定序列中,如今这也被称为马尔可夫链。马尔可夫链被广泛的运用于物理学,经济学,统计学,生物学等方面。两个最著名的应用是布朗运动以及随机漫步。
什么是马尔科夫性质?
一类随机过程:在给定当前状态的条件下,将来的状态独立于过去的状态。
假定我们用一枚正反面概率一样的硬币玩一个简单的抛硬币的游戏。抛去质疑,假设马尔科夫性质不是已知的,并且我们希望去预测在十次抛掷以后,第11次正面朝上的概率。在条件依赖的假设之下(硬币对于过去的状态有记忆特性并且未来的状态也依赖于过去状态的序列),我们必须记录导致第11次结果的前十次结果的特定序列,并计算它们的联合概率。这个序列的联合概率就是0.5^10 = 0.0009765625。在条件依赖下,第十一次抛掷正面朝上的概率就是0.0009765625 * 0.5 = 0.00048828125。
这真的是第十一次抛掷正面朝上的概率吗?当然不是!
我们知道硬币抛掷这一事件并不依赖于先前抛掷的结果。这枚硬币并没有记忆特性。这个连续抛掷的过程并没有编码先前的结果。每个抛掷都是独立事件并且是正反面概率一致的,又叫做与过去状态的条件独立。这就是马尔科夫性质。
什么是马尔科夫模型?
马尔科夫链(模型)描述了一类随机过程,假定未来状态的概率仅仅依赖于当前状态,不依赖于先前的状态。
让我们以一个简单的例子开始。假设你的小狗处于三类状态之一,在给定当前状态的条件下,你想要模拟出未来状态的可能性。为此我们需要去指定状态空间,初始概率和转移概率。
想象一下你有一只非常懒的胖狗,所以我们定义了状态空间为:睡觉,吃饭,赖皮。我们设置对应的初始概率为 35%, 35%,和 30% 。
下一步就是定义转移概率。在给定当前状态的条件下,他们就是保持相同状态的概率或者转移到不同状态的概率。
既然我们有了初始概率和转移概率,我们就能用Networkx包来创建马尔科夫图表了。
要做到这一点需要一点点灵活思考。Networkx创造了包含很多节点和边的图形。
在我们这个小例子中,小狗可能的状态是这些节点,而边则是连接各个节点的连线。而转移概率则是权重。它们代表了在当前状态已知的情况下转移至下一状态的概率。
有一点需要指出的是networkx主要是用来处理字典对象的。也就是说,我们需要去创建一个包含边以及对应权重的字典对象。
现在我们能够创建这个图表。为了能够使得马尔科夫模型可视化需要使用nx.MultiDiGraph()。一个多有向图简单来说就是有方向的图表,能够拥有多条弧,同时单个节点既可以是起始点也可以是终点。
在接下来的代码中,我们将创建图标对象,添加我们的节点,边和标签,接着画一个大致的netwokx图线,并且将其输出为dot文件。
现在让我们看看这个dot文件。
还可以吧。如果你想从任意节点开始沿着某一条边,他会告诉你这条小狗从一个状态转化为另一个状态的概率。举个例子来说吧,如果这条狗正在睡觉,我们能够发现有40%几率这条狗会继续睡觉,40%的几率狗会醒来并且耍赖皮,还有20%的概率狗会醒过来吃饭。
什么使得马尔科夫模型成为隐性的?
假设这样一种情况:你的狗突然举止怪异,你想要去模拟出狗是由于生病而有怪异行为的概率或者是在健康状态下纯粹地搞怪的概率。
在这一情形下,狗的真正状态是未知的,并且你也是不知晓的。一条可行的方法就是假设狗有一些可被观察的行为,这些行为能够代表正确而隐性的状态。让我们通过一个例子来了解。
首先我们创建状态空间,健康或生病。我们假设它们是等概的。
现在我们为隐藏状态创建转移矩阵。
这就让它变得更有趣一点了。现在我们创建发射或者观察概率矩阵。这个矩阵的大小是M x O 的,并且M是隐藏状态的个数,而O则是可能观察到的状态的个数。
这个发射矩阵告诉我们,在可能当前以及可观察的状态条件下,狗处于其中一个隐藏状态的概率。
让我们保留前一个例子中的可观察状态。这条狗能够睡觉,吃饭或者耍赖皮。这样我们就能根据这些概率做出最准确的猜测。
现在我们创建图表的边和图表对象。
这个隐性的马尔科夫的图表有一些复杂但其原理是一样。举个例子来说,你能够预测到,如果你的小狗在吃饭,那它有极高的可能是健康的(60%),而有非常低的可能是生病的(10%)。
现在,给定一组你的小狗的行为序列,如果你需要识别出小狗随着时间变化的健康状态又该怎么办呢?
使用维特比算法我们可以在给定行为序列的条件下,求出其最可能的对应的隐藏状态的序列。
高水平下,这个维特比算法增量随着每个时间的步进,找到所有路径中能够以最大可能性到达时间t下的状态i的路径,这条路径也是到达时间t的正确观察行为序列。
这个算法也能够保存在每一个阶段下有最高概率的状态的踪迹。在序列的结尾,这一算法将会向后迭代计算出在每一个时间步长中“胜利”的状态,并建立最有可能的路径,或者最有可能的隐藏状态的序列,这些都与已知的行为序列相对应。
让我们看一下结果吧。
一种可用于条件检测的隐性马尔科夫模型
到现在,你可能想知道我们怎么样去将我们所学的马尔科夫模型应用在定量金融中。
但考虑到当我们想要尝试在资产收益率中应用预测技术时,所面临最大的困难就是资产收益率是非平稳时间序列。简单来说,这就是意味着资产收益率的预期均值以及波动性都会随着时间而变化。
大多数时间序列的模型都是假设数据是平稳的。这就是这些模型主要的缺陷。
但是,让我们从问题的另外一面思考。我们知道这个时间序列其实表明了当前的时间点下预期均值以及波动性是固定不变的。而这些时间点或者说是条件就可以比喻为隐性状态。
如果是这样的话,我们就只需要得到这些拥有与隐性状态对应特征的观察变量就可以了。如果我们能够更好地预估出资产所处在的最可能的环境,包括它的联合均值和方差,那么我们的预测模型就能变得更加灵活,并且能够提高准确度。当然如果给定的这些条件预估参数能够组成更有利于情景分析的框架,我们也能够成为更优秀的风险管理人员。
在这个例子中,我使用的观测变量有:潜在的资产回报,泰德价差,10年- 2年连续成熟的范围,和10年-3个月的连续成熟的范围。
我们能从雅虎财经上采集这些数据。
下面我们将会用到sklearn的高斯混合模型来组成一个能够预测这些条件的模型。我们将会在这个系列的第二部分深度探讨混合模型这个版块。而最重要的特点是,混合模型应用一种密度估算中无人监测的形式来进行实现。他利用最大化均值算法来估算隐性状态的的均值和协方差。现在,就可以按下这个按钮,来猜猜转移和发射概率以及最可能的路径。
我们必须选定混合模型中组件的数量来和时间序列相拟合。在这个例子中这些组件就被当作隐性状态。我们将这些状态任意划分为高,中和低波动性并且将组件部分设置为3。
在上面的图片中,我圈出了每个条件下所对应的每日收入的预期均值和方差。我们的低波动性环境就是我们序号为1的隐性状态。我们也能发现序号为1的隐性状态下有最高额的收入均值和最小的方差。而序号为0的隐性状态即为中性的波动性环境,对应的是第二高的回报和方差。最后的序号为2的隐性状态即为高的波动性环境,对应的是负的回报以及最大的方差。
下面的图是用颜色代表各个隐性状态的美容价格走势。
总结:
这篇文章中我们讨论了马尔科夫性质的概念,马尔可夫模型和隐性的马尔可夫模型。我们使用NetworkX包创建马尔科夫链图,并用sklearn的高斯混合模型预测以往各个节点的状态。在第2部分,我们将深入讨论混合模型。为了了解更详细的信息,我建议你多看看参考文献中的内容。特别是Setosa.io这个网站由于其有极好的交互式的视觉体验,有助于你更好地理解这篇文章。
参考文献:
1. https://en.wikipedia.org/wiki/Andrey_Markov
2. https://www.britannica.com/biography/Andrey-Andreyevich-Markov
3. https://www.reddit.com/r/explainlikeimfive/comments/vbxfk/eli5_brownian_motion_and_what_it_has_to_do_with/
4. http://www.math.uah.edu/stat/markov/Introduction.html
5. http://setosa.io/ev/markov-chains/
6. http://www.cs.jhu.edu/~langmea/resources/lecture_notes/hidden_markov_models.pdf
7. https://github.com/alexsosn/MarslandMLAlgo/blob/master/Ch16/HMM.py
8. http://hmmlearn.readthedocs.io
英文原文:http://www.blackarbs.com/blog/introduction-hidden-markov-models-python-networkx-sklearn/2/9/2017
译者:铁柱哥爱33