今天刚刚验收CSAPP实验3,趁着余温,记录一下这个实验,顺便回顾下CSAPP课程的相关知识。
实验目的
1.使用gdb工具反汇编出汇编代码,结合c语言文件找到每个关卡的入口函数。然后分析汇编代码,分析得到每一关的通关密码。
2.熟悉linux指令,学会如何使用gdb对程序进行调试
实验环境
个人电脑PC,32位ubuntu系统环境
实验内容及操作步骤
实验内容
“二进制炸弹”是Linux可执行C程序,包含六个“阶段”和一个秘密“阶段”。 每个阶段都要求输入特定的字符串在stdin上。 如果输入了预期的字符串,则该阶段通过,进入下一阶段。 否则,炸弹会通过打印“ BOOM !!!”而“爆炸”。
操作步骤
拆弹前准备
(1).进入Ubuntu系统,将自己的程序包复制到虚拟机中,并使用tar xvf bomb201808010515.tar进行解压。
(2).输入objdump –d bomb >my_bomb.txt,将反汇编代码输入到my_bomb.txt的文件中,便于拆弹时的查看和注释。
(3).打开反汇编文件,发现phase_i系列的函数,结合实验题目,可以知道这是每一个关卡对应的函数。
开始拆炸弹
PS:每个关卡汇编代码下面有相应的文字分析。
phase_1:确定输入字符串
查看汇编代码
08048b50 :
8048b50:83 ec 1c sub $0x1c,%esp
8048b53:c7 44 24 04 84 a1 04 movl $0x804a184,0x4(%esp) //传入一个立即数
8048b5a:08
8048b5b:8b 44 24 20 mov 0x20(%esp),%eax
8048b5f:89 04 24 mov %eax,(%esp)
8048b62:e8 3d 04 00 00 call 8048fa4 //输入字符串进入函数进行比较
8048b67:85 c0 test %eax,%eax
8048b69:74 05 je 8048b70 //返回值为0,结束,否则爆炸
8048b6b:e8 46 05 00 00 call 80490b6
8048b70:83 c4 1c add $0x1c,%esp
8048b73:c3 ret
分析:
(1).可以看到在%eax!=0的时候就会调用,所以在调用 函数之后的返回值%eax必须为0。往前看,发现代码movl $0x804a184,0x4(%esp)有立即数,是将此处地址的值拿来用,输入gdb –q bomb进入调试状态,用x/s 0x804a184查看内容。
(2).下面一步 mov 0x20(%esp),%eax就是把我们输入的参数放进%eax中,然后放进(%esp) ,再调用函数。所以猜测要输入的就是0x804a184中的字符。开始第一关的尝试,重新打开一个终端,用来测试。测试结果如下,输出"Phase 1 defused. How about the next one?",成功通关。
phase_2: 确定一个有规律的数列
分析:
08048b74 :
8048b74:56 push %esi
8048b75:53 push %ebx
8048b76:83 ec 34 sub $0x34,%esp //开辟栈帧
8048b79:8d 44 24 18 lea 0x18(%esp),%eax
8048b7d:89 44 24 04 mov %eax,0x4(%esp)
8048b81:8b 44 24 40 mov 0x40(%esp),%eax
8048b85:89 04 24 mov %eax,(%esp)
8048b88:e8 5e 06 00 00 call 80491eb
8048b8d:83 7c 24 18 01 cmpl $0x1,0x18(%esp) //esp+0x18-1
8048b92:74 05 je 8048b99 //esp+0x18==1
8048b94:e8 1d 05 00 00 call 80490b6 //esp+0x18!=1,爆炸
8048b99:8d 5c 24 1c lea 0x1c(%esp),%ebx //ebx=esp+0x1c
8048b9d:8d 74 24 30 lea 0x30(%esp),%esi //esi=esp+0x30
(1). 首先注意到这个函数,这里应该是读取6个数字。接下来看到esp+0x18中存放的值和1进行比较,不相等则爆炸,由此猜测第1个数为1。连续的两条lea语句是将esp+0x1c,esp+0x30的值存放入对应寄存器。从esp+0x18到esp+0x30刚好存放6个int 类型的数据,故esp+0x30是最后一个数据,esp+0x1c是第2个数据。
8048ba1:8b 43 fc mov -0x4(%ebx),%eax //eax=esp+0x1c-0x4=esp+0x18
8048ba4:01 c0 add %eax,%eax //eax=eax*2=2*(esp+0x18)
8048ba6:39 03 cmp %eax,(%ebx) //(ebx)-eax
8048ba8:74 05 je 8048baf //(ebx)==2
8048baa:e8 07 05 00 00 call 80490b6 //(ebx)!=2,爆炸
8048baf:83 c3 04 add $0x4,%ebx //ebx=ebx+4=esp+0x20,地址+4,下一个数字
8048bb2:39 f3 cmp %esi,%ebx //ebx-esi=esp+0x20-(esp+0x30)
8048bb4:75 eb jne 8048ba1 //不相等,继续循环
8048bb6:83 c4 34 add $0x34,%esp //结束
8048bb9:5b pop %ebx
8048bba:5e pop %esi
8048bbb:c3 ret
(2). 接下来将ebx-0x4的中存放的值传给eax,执行add %eax,%eax操作,即eax中存放的数乘以2,再将这个值与第2个数据进行比较,如果不相等就爆炸,说明第2个数就是在第1个数的基础上乘以2。继续往下看,执行add $0x4,%ebx,将ebx中的地址加0x4,即下一个数字,接着的判断语句是和最后一个数字比较,不相等就跳转到对应位置继续循环。由此可知,这6个数字对应的递推关系为a[i+1]=2*a[i],其中a[0]=1,i=0,1,…,4。
(3). 切换到之前测试用的终端,输入1 2 4 8 16 32,终端显示“That’s number 2. Keep going!”,第二关顺利通过。结果如下图所示:
phase_3 :switch语句
分析
08048bbc :
8048bbc:83 ec 2c sub $0x2c,%esp //开辟栈帧
8048bbf:8d 44 24 1c lea 0x1c(%esp),%eax
8048bc3:89 44 24 0c mov %eax,0xc(%esp) //参数y esp+0x1c
8048bc7:8d 44 24 18 lea 0x18(%esp),%eax
8048bcb:89 44 24 08 mov %eax,0x8(%esp) //参数x esp+0x18
8048bcf:c7 44 24 04 a3 a3 04 movl $0x804a3a3,0x4(%esp) //查看汇编后知道需要输入两个数(%d %d)
8048bd6:08
8048bd7:8b 44 24 30 mov 0x30(%esp),%eax
8048bdb:89 04 24 mov %eax,(%esp)
8048bde:e8 8d fc ff ff call 8048870 <__isoc99_sscanf>
(1).看到上面这段汇编代码,注意到函数_isoc99_sscanf@plt,说明这部分存在输入信息,往前看,发现movl $804a3a3,0x4(%esp)。进入GDB调试,设置断点 b phase_3,尝试使用x/s查看内容,发现是“%d %d”(如下图),说明需要输入两个数据。结合前面传入两个参数,这两个参数就是输入的数据,设为x,y。
8048be3:83 f8 01 cmp $0x1,%eax //eax-1
8048be6:7f 05 jg 8048bed //eax>1
8048be8:e8 c9 04 00 00 call 80490b6 //eax<1,爆炸
8048bed:83 7c 24 18 07 cmpl $0x7,0x18(%esp) //x-7
8048bf2:77 3c ja 8048c30 //x>7或者x<0,引爆炸弹
8048bf4:8b 44 24 18 mov 0x18(%esp),%eax //eax=x
8048bf8:ff 24 85 e0 a1 04 08 jmp *0x804a1e0(,%eax,4) //switch语句,gdb查看*0x804a1e0
(2). 接下来看到cmpl $0x7,%eax,进行无符号数比较,如果大于7或者小于0就爆炸,故可以知道eax中存放的值(参数1)的取值范围为0-7的整数。往下发现很多跳转指令,结合jmp *0x804a1e0(,%eax,4)知道,这是一个跳转表结构。
8048bf8:ff 24 85 e0 a1 04 08 jmp *0x804a1e0(,%eax,4) //switch语句,gdb查看*0x804a1e0
8048bff:b8 cc 01 00 00 mov $0x1cc,%eax //eax=0x1cc,x=0 对应查看*0x804a1e0
8048c04:eb 3b jmp 8048c41
8048c06:b8 b6 03 00 00 mov $0x3b6,%eax //eax=0x3b6,x=2 对应查看*0x804a1e8
8048c0b:eb 34 jmp 8048c41
8048c0d:b8 03 03 00 00 mov $0x303,%eax //eax=0x303,x=3
8048c12:eb 2d jmp 8048c41
8048c14:b8 1d 01 00 00 mov $0x11d,%eax //eax=0x11d,x=4
8048c19:eb 26 jmp 8048c41
8048c1b:b8 a0 01 00 00 mov $0x1a0,%eax //eax=0x1a0,x=5
8048c20:eb 1f jmp 8048c41
8048c22:b8 60 03 00 00 mov $0x360,%eax //eax=0x360,x=6
8048c27:eb 18 jmp 8048c41
8048c29:b8 6f 02 00 00 mov $0x26f,%eax //eax=0x26f,x=7
8048c2e:eb 11 jmp 8048c41
8048c30:e8 81 04 00 00 call 80490b6 //爆炸
8048c35:b8 00 00 00 00 mov $0x0,%eax //eax=0
8048c3a:eb 05 jmp 8048c41
8048c3c:b8 7a 00 00 00 mov $0x7a,%eax //eax=0x7a,x=1
(3).分析这个跳转表
假设x为0,则得到地址0x804a1e0+4*0=0x804a1e0,使用x/8bx 0x804a1e0查看信息,为0x8048bff,即case 0的入口地址。
根据case 0的入口地址0x8048bff找到执行执行mov $0x1cc,%eax。
假设x为1,则得到地址0x804a1e0+4*1=0x804a1e4,使用x/8bx 0x804a1e4查看信息,为0x804c3c,即case 1的入口地址。
根据case 1的入口地址0x8048c3c找到执行执行mov $0x7a,%eax。同理可以确定其他几组数据。
8048c41:3b 44 24 1c cmp 0x1c(%esp),%eax //eax-y
8048c45:74 05 je 8048c4c //eax==y
8048c47:e8 6a 04 00 00 call 80490b6 //eax!=y,爆炸
8048c4c:83 c4 2c add $0x2c,%esp //结束
8048c4f:c3 ret
(4).最后一部分将eax的值和输入的参数y进行比较,不相等则爆炸,说明输入的第2个数字y为case语句中传给eax的值。由此可以确定这个关卡有8组不同的通关答案,分别是0 460,1 122,2 950, 3 771, 4 285, 5 416,6 864, 7 623。下面对2组数据进行验证:
phase_4 :函数过程调用
分析
08048cb9 :
8048cb9:83 ec 2c sub $0x2c,%esp //开辟栈帧
8048cbc:8d 44 24 1c lea 0x1c(%esp),%eax
8048cc0:89 44 24 0c mov %eax,0xc(%esp) //参数y
8048cc4:8d 44 24 18 lea 0x18(%esp),%eax
8048cc8:89 44 24 08 mov %eax,0x8(%esp) //参数x
8048ccc:c7 44 24 04 a3 a3 04 movl $0x804a3a3,0x4(%esp) 查看汇编后知道需要输入两个数(%d %d)
8048cd3:08
(1).查看上面这一段代码,分析得出输入两个数字(和关卡3一样,用gdb调试看0x804a3a3中存放的内容)。结合前面传入两个参数,这两个参数就是输入的数据,设为x,y。
8048cd4:8b 44 24 30 mov 0x30(%esp),%eax
8048cd8:89 04 24 mov %eax,(%esp)
8048cdb:e8 90 fb ff ff call 8048870 <__isoc99_sscanf> //调用某个函数
8048ce0:83 f8 02 cmp $0x2,%eax //eax-2 判断传入参数的个数是否满足条件
8048ce3:75 0d jne 8048cf2 //eax!=2 引爆
8048ce5:8b 44 24 18 mov 0x18(%esp),%eax //eax=x
8048ce9:85 c0 test %eax,%eax //判断x
8048ceb:78 05 js 8048cf2 //x<0 引爆
8048ced:83 f8 0e cmp $0xe,%eax //x-0xe
8048cf0:7e 05 jle 8048cf7 //x<=0xe
8048cf2:e8 bf 03 00 00 call 80490b6
(2).分析这一部分代码,test判断x是否小于0,cmp判断x是否大于0xe,故要是炸弹不爆炸,则参数x的取值范围为0-0xe的整数。
8048cf7:c7 44 24 08 0e 00 00 movl $0xe,0x8(%esp) //esp+0x8=0xe
8048cfe:00
8048cff:c7 44 24 04 00 00 00 movl $0x0,0x4(%esp) //esp+0x4=0
8048d06:00
8048d07:8b 44 24 18 mov 0x18(%esp),%eax //eax=x
8048d0b:89 04 24 mov %eax,(%esp) //esp=x
8048d0e:e8 3d ff ff ff call 8048c50 //调用func4
(3). 在调用func4之前将参数压入栈帧.
8048d13:83 f8 07 cmp $0x7,%eax //eax-7,eax里面存放的是func4的返回值
8048d16:75 07 jne 8048d1f //eax!=7,引爆
8048d18:83 7c 24 1c 07 cmpl $0x7,0x1c(%esp) //y-7
8048d1d:74 05 je 8048d24 //y==7,结束
8048d1f:e8 92 03 00 00 call 80490b6
8048d24:83 c4 2c add $0x2c,%esp
8048d27:c3 ret
(4). 继续分析发现下面对func4的返回值和参数y分别对7进行比较,如果不为7,则引爆炸弹,分析到此,可以知道对于x属于[0,0xe]使得func4(x,0,0xe)返回值为0x7的x即为所求。
08048c50 :
8048c50:83 ec 1c sub $0x1c,%esp //开辟栈帧
8048c53:89 5c 24 14 mov %ebx,0x14(%esp)
8048c57:89 74 24 18 mov %esi,0x18(%esp)
8048c5b:8b 44 24 20 mov 0x20(%esp),%eax //设esp+0x20存储x=>eax=x
8048c5f:8b 54 24 24 mov 0x24(%esp),%edx //设esp+0x24存储y=>edx=y
8048c63:8b 74 24 28 mov 0x28(%esp),%esi //设esp+0x28存储z=>esi=z
8048c67:89 f1 mov %esi,%ecx //ecx=z
8048c69:29 d1 sub %edx,%ecx //ecx=z-y
8048c6b:89 cb mov %ecx,%ebx //ebx=z-y
8048c6d:c1 eb 1f shr $0x1f,%ebx //逻辑右移,ebx=(z-y)>>31,得到符号位s
8048c70:01 d9 add %ebx,%ecx //ecx=ebx+ecx=s+z-y
8048c72:d1 f9 sar %ecx //算术右移,ecx=(s+z-y)>>1
8048c74:8d 1c 11 lea (%ecx,%edx,1),%ebx //ebx=edx*1+ecx=y+ecx=y+(s+z-y)>>1
8048c77:39 c3 cmp %eax,%ebx //ebx-x,比较计算结果y+(s+z-y)>>1和x
8048c79:7e 17 jle 8048c92 //ebx<=eax
8048c7b:8d 4b ff lea -0x1(%ebx),%ecx //ecx=ebx-1
8048c7e:89 4c 24 08 mov %ecx,0x8(%esp) //esp+0x8=ecx=ebx-1
8048c82:89 54 24 04 mov %edx,0x4(%esp) //esp+0x4=edx=y
8048c86:89 04 24 mov %eax,(%esp) //esp=x
8048c89:e8 c2 ff ff ff call 8048c50 //递归调用函数func4
8048c8e:01 c3 add %eax,%ebx //ebx=ebx+eax
8048c90:eb 19 jmp 8048cab
8048c92:39 c3 cmp %eax,%ebx //ebx-eax
8048c94:7d 15 jge 8048cab //ebx>=eax
8048c96:89 74 24 08 mov %esi,0x8(%esp) //esp+0x8=esi=z
8048c9a:8d 53 01 lea 0x1(%ebx),%edx //edx=ebx+1
8048c9d:89 54 24 04 mov %edx,0x4(%esp) //esp+0x4=ebx+1
8048ca1:89 04 24 mov %eax,(%esp) //esp=eax=x
8048ca4:e8 a7 ff ff ff call 8048c50 //递归调用函数func4
8048ca9:01 c3 add %eax,%ebx //ebx=eax+ebx
8048cab:89 d8 mov %ebx,%eax //eax=ebx
8048cad:8b 5c 24 14 mov 0x14(%esp),%ebx
8048cb1:8b 74 24 18 mov 0x18(%esp),%esi
8048cb5:83 c4 1c add $0x1c,%esp
8048cb8:c3 ret
(5).现在重点就是分析func4函数,看到汇编代码可以发现这是一个递归函数,关键在于找到递归的条件和退出函数的条件,以及递归之前函数的参数压栈准备。根据这段汇编代码写出C语言代码如下:
int func4(int x,int y,int z)
{
int t=(((z-y)+((z-y)>>31))>>1)+y;
if(t<=x)
{
if(t==x)
{
return t;
}
else return func4(x,t+1,z)+x;
}
else
{
return func4(x,y,t-1)+x;
}
}
(6).编写测试函数如下
int main()
{
int i=0;
for(i=0;i<=14;i++)//每一种取值都进行测试
{
printf("func4(%d,0,14)=%d ",i,func4(i,0,14));
if((i+1)%5==0) printf("\n");
}
return 0;
}
运行代码结果如下,可以发现返回值为0x7对应的x只有0x7一种值,故第4关通关输入为7 7。
切换到之前测试用的终端,输入7 7,终端显示“So you got that one. Try this one.”,第四关顺利通过。
phase_5: 序列的构造和数组寻址
分析
08048d28 :
8048d28:53 push %ebx
8048d29:83 ec 18 sub $0x18,%esp //开辟栈帧
8048d2c:8b 5c 24 20 mov 0x20(%esp),%ebx //参数1 x存储在ebx
8048d30:89 1c 24 mov %ebx,(%esp)
8048d33:e8 53 02 00 00 call 8048f8b
8048d38:83 f8 06 cmp $0x6,%eax //eax-6(猜测eax是字符串的长度)
8048d3b:74 05 je 8048d42 //eax==6
8048d3d:e8 74 03 00 00 call 80490b6 //eax不是6,引爆
(1).注意到函数,结合后面eax和0x6比较,可知这一关输入的参数是一个长度为6的字符串,需要我们去匹配出这个字符串。
8048d42:ba 00 00 00 00 mov $0x0,%edx //edx=0
8048d47:b8 00 00 00 00 mov $0x0,%eax //eax=0
//movsbl指令负责拷贝一个字节,并用源操作数的最高位填充其目的操作数中的其余各位,这种扩展方式叫“符号扩展”
8048d4c:0f be 0c 03 movsbl (%ebx,%eax,1),%ecx //ecx=(eax+ebx) 长度为6的字符串的第eax个字符
8048d50:83 e1 0f and $0xf,%ecx //f=00001111 取ecx的低4位
8048d53:03 14 8d 00 a2 04 08 add 0x804a200(,%ecx,4),%edx //edx=edx+4*ecx+0x804a200
8048d5a:83 c0 01 add $0x1,%eax //eax+1
8048d5d:83 f8 06 cmp $0x6,%eax //eax-6
8048d60:75 ea jne 8048d4c //eax!=6
8048d62:83 fa 2b cmp $0x2b,%edx //edx-0x2b
8048d65:74 05 je 8048d6c //相等
8048d67:e8 4a 03 00 00 call 80490b6 //爆炸
8048d6c:83 c4 18 add $0x18,%esp //结束
8048d6f:5b pop %ebx
8048d70:c3 ret
(2).接着edx,eax寄存器的值初始化为0,movsbl (%ebx,%eax,1),%ecx,这一句是表示将长度为6的字符串的第eax个字符存入ecx中。取ecx中的低4位,利用基址比例变址寻址的方式,到数组中找值,并累和在寄存器edx中。往下看,可以看到cmp $0x2b,%edx,如果不相等则爆炸,说明累和得到的值必须为0x2b。
(3).分析到此,关键在于找到数组中的值,由汇编我们知道数组首地址为0x804a200,进入GDB调试,设置断点b phase_5,运行后查看其内容,从里边找出一组和为0x2b的数字,这里取出一组 {2,a,6,1,c,c}。
对应下标为0,1,2,3,4,4,去ascii表中找低四位为0,1,2,3,4,4的字符,故得到其中一组解为pabcdd。
(4). 切换到之前测试用的终端,输入pabcdd,终端显示“Good work! On to the next…!”,第五关顺利通过。
phase_6: 链表
分析
08048d71 :
8048d71:56 push %esi
8048d72:53 push %ebx
8048d73:83 ec 44 sub $0x44,%esp //开辟栈帧
8048d76:8d 44 24 10 lea 0x10(%esp),%eax
8048d7a:89 44 24 04 mov %eax,0x4(%esp) //参数2 y
8048d7e:8b 44 24 50 mov 0x50(%esp),%eax
8048d82:89 04 24 mov %eax,(%esp) //参数1 x
8048d85:e8 61 04 00 00 call 80491eb
(1).首先看到函数,根据之前的经验,猜测这里也是读取6个数字。
8048d8a:be 00 00 00 00 mov $0x0,%esi //esi=0
8048d8f:8b 44 b4 10 mov 0x10(%esp,%esi,4),%eax //eax=(4*esi+y)
8048d93:83 e8 01 sub $0x1,%eax //eax--
8048d96:83 f8 05 cmp $0x5,%eax //eax-5
8048d99:76 05 jbe 8048da0 //无符号数<=
8048d9b:e8 16 03 00 00 call 80490b6 //引爆
8048da0:83 c6 01 add $0x1,%esi //esi+=1,,esi=1
8048da3:83 fe 06 cmp $0x6,%esi //esi-6
8048da6:74 33 je 8048ddb //等于跳转
//以上代码是确定6个数字的范围。
8048da8:89 f3 mov %esi,%ebx //ebx=esi
8048daa:8b 44 9c 10 mov 0x10(%esp,%ebx,4),%eax //eax=(4*ebx+y)
8048dae:39 44 b4 0c cmp %eax,0xc(%esp,%esi,4) //(4*esi+esp+0xc)-eax
8048db2:75 05 jne 8048db9 //不相等
8048db4:e8 fd 02 00 00 call 80490b6 //相等,引爆
8048db9:83 c3 01 add $0x1,%ebx //ebx++
8048dbc:83 fb 05 cmp $0x5,%ebx //ebx-5
8048dbf:7e e9 jle 8048daa //小于等于跳转
8048dc1:eb cc jmp 8048d8f
8048dc3:8b 52 08 mov 0x8(%edx),%edx //edx=(edx+0x8)=(0x804c13c+0x8)
8048dc6:83 c0 01 add $0x1,%eax //eax++
8048dc9:39 c8 cmp %ecx,%eax //eax-ecx
8048dcb:75 f6 jne 8048dc3 //不相等,继续执行
8048dcd:89 54 b4 28 mov %edx,0x28(%esp,%esi,4) //4*esi+esp+0x28=edx
8048dd1:83 c3 01 add $0x1,%ebx //ebx++
8048dd4:83 fb 06 cmp $0x6,%ebx //ebx-6
8048dd7:75 07 jne 8048de0 //不相等
8048dd9:eb 1c jmp 8048df7
//以上代码是判断数字之间是否互不相等。
(2).这里的汇编代码包括两个循环,用来给出数字的取值范围是属于1-6,并且数字之间彼此两两不相等。
//链表初始化
8048df7:8b 5c 24 28 mov 0x28(%esp),%ebx /ebx=x1
8048dfb:8b 44 24 2c mov 0x2c(%esp),%eax //eax=x2
8048dff:89 43 08 mov %eax,0x8(%ebx) //x1->x2
8048e02:8b 54 24 30 mov 0x30(%esp),%edx //edx=x3
8048e06:89 50 08 mov %edx,0x8(%eax) //x1->x2->x3
8048e09:8b 44 24 34 mov 0x34(%esp),%eax //eax=x4
8048e0d:89 42 08 mov %eax,0x8(%edx) //x1->x2->x3->x4
8048e10:8b 54 24 38 mov 0x38(%esp),%edx //edx=x5
8048e14:89 50 08 mov %edx,0x8(%eax) //x1->x2->x3->x4->x5
8048e17:8b 44 24 3c mov 0x3c(%esp),%eax //eax=x6
8048e1b:89 42 08 mov %eax,0x8(%edx) //x1->x2->x3->x4->x5->x6
8048e1e:c7 40 08 00 00 00 00 movl $0x0,0x8(%eax) //链表尾
(3). 接下来对链表的结点进行了连接
(4).进入GDB调试,设置断点b phase_6,往下分析代码过程中看到一个立即数,查看其值,出现一个node1,猜测这是一个链表的数据结构。于是多查看几个值,发现了其中的规律,每三个数为一组,第1个是数据域中的值,第2个是下标,第3个比较大,类似于地址,是指针域,然后对猜想进行验证。调试后验证猜测正确。根据之前对链表进行连接,顺序为322->370->1c1->24b->0a1->192。
//递增序列
8048e25:be 05 00 00 00 mov $0x5,%esi //esi=5
8048e2a:8b 43 08 mov 0x8(%ebx),%eax //eax=x2的地址
8048e2d:8b 10 mov (%eax),%edx //edx=x2
8048e2f:39 13 cmp %edx,(%ebx) //x1-x2
8048e31:7e 05 jle 8048e38 //x1<=x2
8048e33:e8 7e 02 00 00 call 80490b6
8048e38:8b 5b 08 mov 0x8(%ebx),%ebx //ebx=ebx+0x8,下一个数
8048e3b:83 ee 01 sub $0x1,%esi //esi--
8048e3e:75 ea jne 8048e2a
8048e40:83 c4 44 add $0x44,%esp
8048e43:5b pop %ebx
8048e44:5e pop %esi
8048e45:c3 ret
(5).ebx+0x8存储的是第2个数字的地址,取出第2个数字x2,和edx存储的第1个数字x1进行比较,需要满足x1<=x2,接下来ebx地址加0x8,对下一个进行约束。由此可以看出这个序列是一个递增序列。
(6).结合之前输入的6个数字在1-6之间,且互不相同,这里应该是排序后递增链表序列的下标。故得到下标为5 6 3 4 1 2。切换到之前测试用的终端,输入5 6 3 4 1 2,终端显示“Congratulations! You’ve defused the bomb!”,第六关顺利通过。
secret_phase:二叉树
做完前6关,看到提示信息的那一刻,我以为就这样结束,但是听说还有秘密关卡,仔细一看汇编代码,果然有serect_phase的汇编代码片段。起初没有思路,不知道该从何入手,在网上参考了一些资料,结合bomb.c的代码,发现每个阶段函数结束后都调用了phase_defused()函数,猜测秘密关卡可能隐藏在某一关中。
分析如何找到秘密关卡
查看汇编代码如下
0804923b :
804923b:81 ec 8c 00 00 00 sub $0x8c,%esp
8049241:65 a1 14 00 00 00 mov %gs:0x14,%eax
8049247:89 44 24 7c mov %eax,0x7c(%esp)
804924b:31 c0 xor %eax,%eax
804924d:83 3d cc c3 04 08 06 cmpl $0x6,0x804c3cc
8049254:75 72 jne 80492c8
8049256:8d 44 24 2c lea 0x2c(%esp),%eax
804925a:89 44 24 10 mov %eax,0x10(%esp)
804925e:8d 44 24 28 lea 0x28(%esp),%eax
8049262:89 44 24 0c mov %eax,0xc(%esp)
8049266:8d 44 24 24 lea 0x24(%esp),%eax
804926a:89 44 24 08 mov %eax,0x8(%esp)
804926e:c7 44 24 04 a9 a3 04 movl $0x804a3a9,0x4(%esp)
8049275:08
8049276:c7 04 24 d0 c4 04 08 movl $0x804c4d0,(%esp)
804927d:e8 ee f5 ff ff call 8048870 <__isoc99_sscanf>
8049282:83 f8 03 cmp $0x3,%eax
8049285:75 35 jne 80492bc
8049287:c7 44 24 04 b2 a3 04 movl $0x804a3b2,0x4(%esp)
804928e:08
804928f:8d 44 24 2c lea 0x2c(%esp),%eax
8049293:89 04 24 mov %eax,(%esp)
8049296:e8 09 fd ff ff call 8048fa4
804929b:85 c0 test %eax,%eax
804929d:75 1d jne 80492bc
804929f:c7 04 24 78 a2 04 08 movl $0x804a278,(%esp)
80492a6:e8 55 f5 ff ff call 8048800
80492ab:c7 04 24 a0 a2 04 08 movl $0x804a2a0,(%esp)
80492b2:e8 49 f5 ff ff call 8048800
80492b7:e8 db fb ff ff call 8048e97
80492bc:c7 04 24 d8 a2 04 08 movl $0x804a2d8,(%esp)
80492c3:e8 38 f5 ff ff call 8048800
80492c8:8b 44 24 7c mov 0x7c(%esp),%eax
80492cc:65 33 05 14 00 00 00 xor %gs:0x14,%eax
80492d3:74 05 je 80492da
80492d5:e8 f6 f4 ff ff call 80487d0 <__stack_chk_fail>
80492da:81 c4 8c 00 00 00 add $0x8c,%esp
80492e0:c3 ret
80492e1:90 nop
80492e2:90 nop
80492e3:90 nop
80492e4:90 nop
80492e5:90 nop
80492e6:90 nop
80492e7:90 nop
80492e8:90 nop
80492e9:90 nop
80492ea:90 nop
80492eb:90 nop
80492ec:90 nop
80492ed:90 nop
80492ee:90 nop
80492ef:90 nop
(1).结合前面关卡,发现这里有2个立即数,使用gdb调试查看其内容
发现提示输入两个数字和一个字符串,以及第4关的输入。于是猜测秘密关卡藏在第4关,而这个字符串就是打开秘密关卡的“钥匙”。
(2). 可以看到这里将0x804a3b2中存放的内容传入函数strings_not_equal中进行比较,如果返回值不为0,就跳转到0x80492bc,输出0x804a2d8中的内容,否则就一次往下输出0x804a278,0x804a2a0的信息,最后输出0x804a2d8的信息。猜测:0x804a3b2就是进入秘密关卡的“钥匙”,当“钥匙”输入错误就直接结束。
添加断点,用gdb调试查看上述提到的4个地址中的内容,验证了猜测的正确性。
分析如何通关
08048e97 :
8048e97:53 push %ebx
8048e98:83 ec 18 sub $0x18,%esp //开辟栈帧
8048e9b:e8 3d 02 00 00 call 80490dd
8048ea0:c7 44 24 08 0a 00 00 movl $0xa,0x8(%esp) //参数3 z=a
8048ea7:00
8048ea8:c7 44 24 04 00 00 00 movl $0x0,0x4(%esp) //参数2 y=0
8048eaf:00
8048eb0:89 04 24 mov %eax,(%esp) //参数1 x
8048eb3:e8 28 fa ff ff call 80488e0
8048eb8:89 c3 mov %eax,%ebx //ebx=x
8048eba:8d 40 ff lea -0x1(%eax),%eax //eax=x-1
8048ebd:3d e8 03 00 00 cmp $0x3e8,%eax //eax-0x3e8
8048ec2:76 05 jbe 8048ec9 无符号数比较,小于等于
8048ec4:e8 ed 01 00 00 call 80490b6
(1).这段代码首先将三个参数放入栈帧中,接下来调用了strtol函数。mov %eax,%ebx;lea -0x1(%eax),%eax;cmp $0x3e8,%eax;jbe 8048ec9 ;这4句对参数x的范围进行了限定,x的取值是1-0x3e9。
8048ec9:89 5c 24 04 mov %ebx,0x4(%esp) //fun7参数2 n=x
8048ecd:c7 04 24 88 c0 04 08 movl $0x804c088,(%esp) //fun7参数1 m=0x804c088
8048ed4:e8 6d ff ff ff call 8048e46 //调用fun7
8048ed9:85 c0 test %eax,%eax //eax and eax
8048edb:74 05 je 8048ee2 //等于0,不是0就爆炸
8048edd:e8 d4 01 00 00 call 80490b6
8048ee2:c7 04 24 b8 a1 04 08 movl $0x804a1b8,(%esp)
8048ee9:e8 12 f9 ff ff call 8048800
8048eee:e8 48 03 00 00 call 804923b
8048ef3:83 c4 18 add $0x18,%esp
8048ef6:5b pop %ebx
8048ef7:c3 ret
8048ef8:90 nop
8048ef9:90 nop
8048efa:90 nop
8048efb:90 nop
8048efc:90 nop
8048efd:90 nop
8048efe:90 nop
8048eff:90 nop
(2).这段代码中主要调用了函数fun7,调用之前可以分析出参数,即fun7(地址,n),第1个参数为某个数组或者链表的首地址,第2个参数为1-1001之间的整数。通关的条件是fun7()的返回值为0。分析fun7中代码,并结合返回值为0,故可以知道保证传入fun7中两个参数相等即可。
08048e46 :
8048e46:53 push %ebx
8048e47:83 ec 18 sub $0x18,%esp //开辟栈帧
8048e4a:8b 54 24 20 mov 0x20(%esp),%edx //参数1,edx=&x
8048e4e:8b 4c 24 24 mov 0x24(%esp),%ecx //参数2,ecx=y
8048e52:85 d2 test %edx,%edx //判断edx是否为0
8048e54:74 37 je 8048e8d //等于0
8048e56:8b 1a mov (%edx),%ebx //取出地址中的值,给ebx,即ebx=x
8048e58:39 cb cmp %ecx,%ebx //x-y
8048e5a:7e 13 jle 8048e6f //x<=y
8048e5c:89 4c 24 04 mov %ecx,0x4(%esp) //esp+0x4=y
8048e60:8b 42 04 mov 0x4(%edx),%eax
8048e63:89 04 24 mov %eax,(%esp) //esp=edx+0x4
8048e66:e8 db ff ff ff call 8048e46 //调用函数fun7
8048e6b:01 c0 add %eax,%eax //eax=eax*2
8048e6d:eb 23 jmp 8048e92
8048e6f:b8 00 00 00 00 mov $0x0,%eax //eax=0
8048e74:39 cb cmp %ecx,%ebx //x-y
8048e76:74 1a je 8048e92 //如果x==y
8048e78:89 4c 24 04 mov %ecx,0x4(%esp) //esp+0x4=y
8048e7c:8b 42 08 mov 0x8(%edx),%eax
8048e7f:89 04 24 mov %eax,(%esp) //esp=edx+0x8
8048e82:e8 bf ff ff ff call 8048e46 //调用函数fun7
8048e87:8d 44 00 01 lea 0x1(%eax,%eax,1),%eax eax=2*eax+1
8048e8b:eb 05 jmp 8048e92
8048e8d:b8 ff ff ff ff mov $0xffffffff,%eax
8048e92:83 c4 18 add $0x18,%esp
8048e95:5b pop %ebx
8048e96:c3 ret
(3).根据fun7的汇编代码写出对应的C语言代码
int fun7(int *x,int y)
{
if(x==0)
return 0xffffffff;
if(*x<=y)
{
if(*x==y) return 0;
x+=8;
return 2*fun7(x,y)+1;
}
else
{
x+=4;
return 2*fun7(x,y);
}
}
(4).根据前面的分析,要使炸弹不爆炸需要fun7返回值为0,从函数中可以看出,返回值为0,只需*x=y即可,于是查看传入fun7中x中的内容即可。
8048ecd:c7 04 24 88 c0 04 08 movl $0x804c088,(%esp) //fun7参数1 m=0x804c088
8048ed4:e8 6d ff ff ff call 8048e46 //调用fun7
(5).切换到之前测试用的终端,运行./bomb,从第一关开始输入,在第四关时,加上字符串“DrEvil”,最终输入秘密关卡的36,终端显示“Wow! You’ve defused the secret stage!Congratulations! You’ve defused the bomb!”。
(6).秘密关卡到这里就结束了,而对于这个关卡涉及到的结构可以进行进一步探索。查看0x804c088中内容发现有3个值,第1个是数值,第2,3个值比较大,是两个地址,联系所学,这两个地址就是左,右子结点的地址。将整个结构用图表示如下,可以看出这是一个典型的二叉树结构。
实验结果及分析
所有关卡通关密码均已找出,执行结果如上。
对每一关进行简单分析:第1关是确定输入字符串;第2关是确定一个有规律的数列;第3关是switch语句的考察;第4关是函数过程调用的检测;第5关是序列的构造和数组寻址方式;第6关是考察链表的相关知识;秘密关卡的寻找考察了考查Linux Canary绕过技术及ROP(Return-Oriented-Programming)攻击负载的构造(如何找到秘密和关卡的入口),秘密关卡则考察了二叉树。
收获与体会
1.本次实验进一步熟悉了GDB调试工具,调试能力得到了一定的提高。
2.熟悉了linux中一些之前没有见过的指令,如movsbl指令movsbl指令负责拷贝一个字节,并用源操作数的最高位填充其目的操作数中的其余各位,这种扩展方式叫符号扩展,对linux指令更加熟悉。
3.对过程调用和参数准备工作得到了进一步的理解。
4.学到了一些更为复杂的数据表示,比如链表,二叉树的在计算机中的具体存储,以及在底层的使用。
5.实验中每个人的实验的可执行文件都是不同,实验过程中,也帮其他同学看过一些代码,对于不同的反汇编代码更加熟悉,也间接复习了之前计算机系统关于汇编语言的相关知识。
6.结合之前缓冲区溢出攻击的学习,在实验做完后,尝试了用hexedit去直接修改可执行文件的某些执行,使得无论输入什么,都不会跳转到爆炸函数处,进一步理解了缓冲区溢出攻击的原理。
标签:24,计算机系统,00,esp,bomblab,mov,eax,实验,ebx
来源: https://blog.csdn.net/weixin_44595362/article/details/106723509