人工智能α-β剪枝实现的一字棋实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验5:α-β剪枝实现一字棋
一、实验目的
学习极大极小搜索及α-β剪枝算法实现一字棋。
二、实验原理
1.游戏规则
"一字棋"游戏(又叫"三子棋"或"井字棋"),是一款十分经典的益智小游戏。"井字棋" 的棋盘很简单,是一个3×3 的格子,很像中国文字中的"井"字,所以得名"井字棋"。"井字棋"游戏的规则与"五子棋"十分类似,"五子棋"的规则是一方首先五子连成一线就胜利;"井字棋"是一方首先三子连成一线就胜利。
2.极小极大分析法
设有九个空格,由MAX,MIN 二人对弈,轮到谁走棋谁就往空格上放一只自己的棋子,谁先使自己的棋子构成"三子成一线"(同一行或列或对角线全是
用圆圈表示MAX,用叉号代表MIN
比如左图中就是MAX 取胜的棋局。
估价函数定义如下设棋局为P,估价函数为e(P)。
(1) 若P 对任何一方来说都不是获胜的位置,则e(P)=e(那些仍为MAX 空着的完全的行、列或对角线的总数)-e(那些仍为MIN 空着的完全的行、列或对角线的总数)
(2) 若P 是MAX 必胜的棋局,则e(P)=+∞(实际上赋了60)。
(3) 若P 是B 必胜的棋局,则e(P)=-∞(实际上赋了-20)。
e(P)=5-4=1
需要说明的是,+∞赋60,-∞赋-20的原因是机器
若赢了,则不论玩家下一步是否会赢,都会走这步必
赢棋。
3. α -β剪枝算法
上述的极小极大分析法,实际是先生成一棵博弈树,然后再计算其倒推值,至使极小极大分析法效率较低。于是在极小极大分析法的基础上提出了α-β剪枝技术。
α-β剪枝技术的基本思想或算法是,边生成博弈树边计算评估各节点的倒推值,并且根据评估出的倒推值范围,及时停止扩展那些已无必要再扩展的子节点,即相当于剪去了博弈树上的一些分枝,从而节约了机器开销,提高了搜索效率。
具体的剪枝方法如下:
(1) 对于一个与节点MIN,若能估计出其倒推值的上确界β,并且这个β值不大于MIN 的父节点(一定是或节点)的估计倒推值的下确界α,即α≥β,则就不必再扩展该MIN 节点的其余子节点了(因为这些节点的估值对MIN 父节点的倒推值已无任何影响了)。这一过程称为α剪枝。
(2) 对于一个或节点MAX,若能估计出其倒推值的下确界α,并且这个α值不小于MAX 的父节点(一定是与节点)的估计倒推值的上确界β,即α≥β,则就不必再扩展该MAX 节点的其余子节点了(因为这些节点的估值对MAX 父节点的倒推值已无任何影响了)。这一过程称为β剪枝。
从算法中看到:
(1) MAX 节点(包括起始节点)的α值永不减少;
(2) MIN 节点(包括起始节点)的β值永不增加。
在搜索期间,α和β值的计算如下:
(1) 一个MAX 节点的α值等于其后继节点当前最大的最终倒推值。
(2) 一个MIN 节点的β值等于其后继节点当前最小的最终倒推值。4.输赢判断算法设计
因为每次导致输赢的只会是当前放置的棋子,输赢算法中只需从当前点开始扫描判断是否已经形成三子。对于这个子的八个方向判断是否已经形成三子。如果有,则说明有一方胜利,如果没有则继续搜索,直到有一方胜利或者搜索完整个棋盘。
三、实验代码
#include
using namespace std;
int num=0; //记录棋盘上棋子的个数
int p,q; //判断是否平局
int tmpQP[3][3]; //表示棋盘数据的临时数组,其中的元素0表示该格为空,
int now[3][3]; //存储当前棋盘的状态
const int depth=3; //搜索树的最大深度
void Init() { //初始化棋盘状态
for(int i=0;i<3;i++)
for(int j=0;j<3;j++)
now[i][j]=0; //将初值均置为0
}
void PrintQP(){ //打印棋盘当前状态
for(int i=0;i<3;i++){
for(int j=0;j<3;j++)
cout< cout< } } void playerinput(){ //用户通过此函数来输入落子的位置,比如:用户输入3 1,则表示用户在第3行第1列落子。 int x,y; L1: cout<<"请输入您的棋子位置(x y):"< cin>>x>>y; if(x>0&&x<4&&y>0&&y<4&&now[x-1][y-1]==0) now[x-1][y-1]=-1; //站在电脑一方,玩家落子置为-1 else{ cout<<"非法输入!"< goto L1; } } int Checkwin() //检查是否有一方赢棋(返回0:没有任何一方赢;1:计算机赢;-1:人赢) { //该方法没有判断平局for(int i=0;i<3;i++){ if((now[i][0]==1&&now[i][1]==1&&now[i][2]==1)||(now[0][i]==1&&now[1][i]==1&&now [2][i]==1) ||(now[0][0]==1&&now[1][1]==1&&now[2][2]==1)||(now[2][0]==1&&now[1][1]==1&&n ow[0][2]==1)) //正方行连成线 return 1; if((now[i][0]==-1&&now[i][1]==-1&&now[i][2]==-1)||(now[0][i]==-1&&now[1][i]==-1&& now[2][i]==-1)||(now[0][0]==-1&&now[1][1]==-1&&now[2][2]==-1)||(now[2][0]==-1&& now[1][1]==-1&&now[0][2]==-1)) //反方行连成线 return -1; } return 0; } int value() { //评估当前棋盘状态的值(同时可以用p或q判断是否平局) p=0; q=0; for(int i=0;i<3;i++){ //计算机一方将棋盘中的空格填满自己的棋子,既将棋盘数组中的0变为1 for(int j=0;j<3;j++){