(采用维特根斯坦的表述方式)
1.达成目的过程可以由不同阶段组成
2.阶段由达成目的的条件确定
(注:规定每一次走一步,第一步就是一个阶段)
3.每个阶段由不同的状态组成
4.状态是阶段中可能面临的所有情况
(注:第一步落脚点可能有多个,每个落脚点都是一个状态)
5.在本阶段状态中选择下阶段中某一个状态,这叫决策
(注:选择下一步落在哪)
6.通过决策可以确定下阶段状态。
7.本阶段状态可以由上阶段状态和上阶段决策推出
8.状态转移有三要素,本阶段状态,下阶段状态,决策
9.状态转移可以通过方程的形式表示
f(i+1)=T(f(i),u(i))f(i+1)=T(f(i),u(i)) f(i+1)=T(f(i),u(i))
(注:其中f为状态,u为决策,T为根据题意产生的转移函数,通过这个函数可以在最优的条件下得到题目想要的下阶段状态)
10.阶段的存在先于状态和决策的存在
11.状态和决策决定阶段的个数
12.所有能达成目的的过程可能有多种
13.能达成目的的状态和决策总体上称为策略
14.过程可以通过策略展示出来
15.达成目的有最优过程,因此有最优策略。
16.从某个阶段开始直到最后阶段的过程称为子过程
17.动态规划最优策略的子策略也是最优的
18.动态规划未来与过去无关,这其实等价于上一条。