
在几个月以前,曾经有一位知乎好友邀请我回答一个问题:“如何证明马尔可夫矩阵至少存在一个所有分量均不小于零的特征向量。”当时我思考了大概半个小时,给出了严谨的证明。事后由该问题引发我至少三度思考,对于此问题,我提出了几个猜想,并最终证明、证伪了这些结论。本文章内容均是作者自己的研究成果,如有与其他人暗合之处,纯属巧合。如果有人通知到我,我也会及时作出响应。
在阐述马尔可夫矩阵之前,我们先要清楚什么是马尔可夫矩阵。
定义:若矩阵的任意一个列向量,所有分量均为非负数,并且所有分量的和为1,亦即所有列向量均满足分量和为1,则称该矩阵为马尔可夫矩阵。
学过概率论的朋友应该都知道,马尔可夫矩阵
即某一个状态转移到各个状态的总概率为1,且概率永远不能小于零,这便是马尔可夫矩阵定义的由来,在概率论与数理统计中有着重要的意义。
现将马尔可夫矩阵的若干研究成果罗列如下,随后给出证明(限于篇幅问题,证明的过程不一定是100%公式化的,但是思想和过程绝对是严谨的。)
- 对于马尔可夫矩阵的任意一个特征值
, 均有
- 马尔可夫矩阵所对应的变换不改变向量的分量之和
- 马尔可夫矩阵的所有分量和不为零的向量的特征值必然为
- 马尔可夫矩阵至少存在一个所有分量均不小于零的特征向量,并且由上一条立即可知它的特征值为
,将该向量的分量和归一化以后得到的向量记为
- 马尔可夫矩阵的全体分量和为零的向量构成马尔可夫变换的不变子空间,我们将该子空间记为
, 将空间记为
- 向量空间可以写成第4条中所述向量
与
的直和,即
- 对于任意一个矩阵
为马尔可夫矩阵的充分必要条件是将集合
依旧映射到该集合上。
- 定义
,
为马尔可夫矩阵的充分必要条件是
存在一个特征值为
且各个分量均不小于
的特征向量,并且
将
上的元素依旧映射到
上。
- 马尔可夫变换在
上可能存在亏损现象,因此马尔可夫矩阵存在不能对角化的情况(后面会构造反例,并陈述反例的构造思路)
下面我们来证明这些结论:
1.我们先将马尔可夫矩阵
而
2.设
因此马尔可夫矩阵不改变向量的分量和。其实道理很简单,因为矩阵的每一列和均为1,用向量
3.对于特征向量
其中
4.此条就是当初知友提问的问题,即如何证明马尔可夫矩阵存在各分量均不小于零的特征向量。我们知道马尔可夫矩阵所有元素均为非负,且马尔可夫变换保证向量的分量和不变,因此在马尔可夫变换下向量集
的像集依然在该集合内部,因此必然存在不动点,该不动点就是我们要找的特征向量。证明该映射存在不动点,如果严格用数学语言论述篇幅不小。限于篇幅问题,我在这里只详细阐述思路,细节由感兴趣的读者自行思考或补充。显然对于二维空间该集合就是一个线段,由线段到线段上的连续映射,显然存在不动点;对于三维空间,该集合是一个三角形,三角形的拓扑结构与矩形是相同的,因此只需要证明矩形到矩形的连续映射存在不动点即可。而证明矩形存在映射不动点,显然可先证明存在一条经过映射以后纵坐标不变的曲线,而这条曲线经过映射的像又全部在该曲线上,因此必然存在不动点。对于
5.首先,分量和为零的全部向量关于加法和数乘封闭,因此它是一个子空间;其次,马尔可夫变换不改变向量的分量和,因此该子空间是不变子空间。
6.因为不变子空间
7.首先,必要性显然,此结论我们在证明第4条时已经用过。现在证明充分性,只需证明所有元素均不小于零并且所有列向量的分量和为
这与假设产生矛盾。假定
也与假设产生矛盾。
8. 由于第6条,任意一个向量
其中,
显然
9.本条结论是困扰我时间较长的结论,此问题经过三度思考,最终在某一天回家的路上产生灵感,悟出第7条结论,从而成功构造出不能对角化的反例。有了第7条结论,我们只需要构造出一个在集合上
并假定
在基矢
则特征向量构成的矩阵为
其逆矩阵为
因此有
如此我们便构造出了不可对角化的马尔可夫矩阵。
我们讨论一下向量
其中
其中
当
其中
最后,希望感兴趣的朋友关注我的知乎专栏数学妙谈,高等代数精深简明讲义,以及公众号丞申通汇文化平台,私人电话:18612313613(微信同)