启发式路径算法(Pohl,1977)是一种最佳优先搜索,它的评估函数是:
f(n)=(2−w)⋅g(n)+w⋅h(n)f(n)=(2−w)⋅g(n)+w⋅h(n) 假设 hh 是可采纳的。
- ww 取什么值能保证算法是最优的?
- 当 w=0w=0,w=1w=1,w=2w=2 时,分别是什么搜索算法?
本题以并字棋(圈与十字游戏)为例练习博弈中的基本概念。定义:
- XnXn 为恰好有 nn 个 X 而没有 O 的行、列或者对角线的数目。
- OnOn 为恰好有 nn 个 O 的行、列或者对角线的数目。
效用函数定义为:
给 X1=1X1=1 的棋局 +1,
给 O1=1O1=1 的棋局 -1
所有其他终止状态效用值为0。
对于非终止状态,使用线性的评估函数定义为:
Eval(s)=3X2(s)+X1(s)−(3O2(s)+O1(s))Eval(s)=3X2(s)+X1(s)−(3O2(s)+O1(s))
任务: a. 估算可能的并字棋局数。 b. 考虑对称性,给出从空棋盘开始的深度为2的完整博弈树
(即,在棋盘上一个X一个O的棋局)。 c. 标出深度为2的棋局的评估函数值。 d. 使用极小极大算
法标出深度为1和0的棋局的倒推值,并根据这些值选出最佳的起始行棋。 e. 假设结点按对α-β剪枝
的最优顺序生成,圈出使用α-β剪枝将被剪