windows逆向基础-PE文件结构详解（上）

2024年5月19日03:11:06评论31 views字数 18737阅读62分27秒阅读模式

在进行反病毒、反调试以及免杀制作时，加壳和脱壳技术是必不可少的。这些技术涉及到对可执行文件的PE结构进行操作和修改。PE结构是Windows操作系统中可执行文件的一种标准格式，包含了程序的代码、数据、资源和其他相关信息。

所以，对于进行加壳和脱壳操作的安全研究人员和安全工程师来说，熟悉PE结构是必要的，因为它提供了深入理解和操作可执行文件的基础。这样才能更好地进行反病毒、反调试，以及免杀应对等工作，确保软件和系统的安全。

0x00 前置基础

拥有NASM/C++基础
了解数据类型和字节序
掌握动/静态逆向分析工具

小复习：
BYTE类型占2个位置， 1字节
WORD类型占4个位置， 2字节
DOWRD类型占8个位置， 4个字节

内存中的小端序:
人类读取顺序：12345678

机器读取顺序：78563412

0x01 什么是PE结构？

PE结构是计算机编程中的一种数据结构，它代表了可执行文件（例如Windows操作系统中的.exe文件）的内存布局。PE是“可执行文件”（Portable Executable）的缩写。

常见拥有PE结构的程序有exe、dll、 sys(驱动程序的文件扩展名)等。

PE结构大体分为以下几个部分：

windows逆向基础-PE文件结构详解（上）

以下为010 Editor中打开的所有PE结构截图：

windows逆向基础-PE文件结构详解（上）

一、DOS头(IMAGE_DOS_HEADER):

存储了早期的MS-DOS可执行文件的信息，用于向后兼容

二、NT头(IMAGE_NT_HEADERS):  

包含WINDOWS PE的主要信息内有三个部分构成：

1.是 PE.. 字样的签名，PE文件头

2.文件头(IMAGE_FILE_HEADER)：

包含了PE文件的基本属性，如文件类型、机器类型、节表的数量和位置等。

3.可选头(IMAGE_OPTIONAL_HEADER)：

    包含了可选属性的信息，如映像基址、内存对齐、代码基址等。

三、节表(SECTION TABLE):

定义了PE文件在内存中各个节的位置和大小，每个节都包含了其相关数据的位置和大小信息。

四、节数据(SECTION DATA):

每个节实际上是一个容器，可以包含代码、数据等等，每个节可以有独立的内存权限，比如代码节默认有读/执行权限。

0x02 PE格式详解

一、DOS头

咱们可以从C++中的winnt.h库中找到具体的DOS头信息，跟进去搜_IMAGE_DOS_HEADER即可看到DOS的参数

typedef struct _IMAGE_DOS_HEADER {      // DOS .EXE header   WORD   e_magic;                     // Magic number   WORD   e_cblp;                      // Bytes on last page of file   WORD   e_cp;                        // Pages in file   WORD   e_crlc;                      // Relocations   WORD   e_cparhdr;                   // Size of header in paragraphs   WORD   e_minalloc;                  // Minimum extra paragraphs needed   WORD   e_maxalloc;                  // Maximum extra paragraphs needed   WORD   e_ss;                        // Initial (relative) SS value   WORD   e_sp;                        // Initial SP value   WORD   e_csum;                      // Checksum   WORD   e_ip;                        // Initial IP value   WORD   e_cs;                        // Initial (relative) CS value   WORD   e_lfarlc;                    // File address of relocation table   WORD   e_ovno;                      // Overlay number   WORD   e_res[4];                    // Reserved words   WORD   e_oemid;                     // OEM identifier (for e_oeminfo)   WORD   e_oeminfo;                   // OEM information; e_oemid specific   WORD   e_res2[10];                  // Reserved words   LONG   e_lfanew;                    // File address of new exe header} IMAGE_DOS_HEADER, *PIMAGE_DOS_HEADER;

以下为010Editor中解析DOS头的截图：

windows逆向基础-PE文件结构详解（上）

DOS头重点字段

WORD e_magic: 用于标识该文件是否为合法的可执行文件。其值是一个常数为4D 5A，在010Editor中打开查看ASCII字符为MZ。

MZ标志用于表示可执行文件的起始位置。当时的可执行文件格式以此标志开头，以标识它是可执行文件，并来，随着Windows操作系统的发展，微软引入了新的PE文件格式作为替代，但保留了MZ标志作为文件的有效性验证。在Windows中，MZ标志成为PE文件的前两个信息。

Tips: MZ标志的确是来自Mark Zbikowski的名字的前两个字母，但并不是纪念他，而是作为标识DOS可执行文件格式的一种方式。

LONG e_lfanew：指示PE文件头（PE header）的偏移量。（用于寻找NT头相对文件起始地址的偏移，那么00 E0就是NT头的起始位置）

二、NT头

咱们可以从C++中的winnt.h库中找到具体的DOS头信息，跟进去搜索_IMAGE_NT_HEADER即可看到NT 头的参数

typedef struct _IMAGE_NT_HEADERS {   DWORD Signature;                         //PE签名   IMAGE_FILE_HEADER FileHeader;            //文件头   IMAGE_OPTIONAL_HEADER32 OptionalHeader;  // 可选头} IMAGE_NT_HEADERS32, *PIMAGE_NT_HEADERS32;

以下为010Editor中解析NT头的截图：

windows逆向基础-PE文件结构详解（上）

1.PE签名

DWORD Signature：其值是一个常数为50 45，在010Editor中打开查看ASCII字符为PE..

2.文件头

跟进IMAGE_FILE_HEADER便可看到文件头参数

windows逆向基础-PE文件结构详解（上）

typedef struct _IMAGE_FILE_HEADER {
   WORD    Machine;
   WORD    NumberOfSections;
   DWORD   TimeDateStamp;
   DWORD   PointerToSymbolTable;
   DWORD   NumberOfSymbols;
   WORD    SizeOfOptionalHeader;
   WORD    Characteristics;
} IMAGE_FILE_HEADER, *PIMAGE_FILE_HEADER;

以下为010Editor中打开的文件头截图：

windows逆向基础-PE文件结构详解（上）

文件头重点字段

WORD Machine：用于识别当前程序支持的CPU架构，我们以上010Editor中解析文件头的截图中看到值为014c,那么我们从以下对应表中寻找014c为Intel 386.，386对应的是x86指令集架构的微处理器，那么我们可以得出该程序为32位的。

#define IMAGE_SIZEOF_FILE_HEADER             20#define IMAGE_FILE_RELOCS_STRIPPED           0x0001  // Relocation info stripped from file.#define IMAGE_FILE_EXECUTABLE_IMAGE         0x0002  // File is executable (i.e. no unresolved external references).#define IMAGE_FILE_LINE_NUMS_STRIPPED       0x0004  // Line nunbers stripped from file.#define IMAGE_FILE_LOCAL_SYMS_STRIPPED       0x0008  // Local symbols stripped from file.#define IMAGE_FILE_AGGRESIVE_WS_TRIM         0x0010  // Aggressively trim working set#define IMAGE_FILE_LARGE_ADDRESS_AWARE       0x0020  // App can handle >2gb addresses#define IMAGE_FILE_BYTES_REVERSED_LO         0x0080  // Bytes of machine word are reversed.#define IMAGE_FILE_32BIT_MACHINE             0x0100  // 32 bit word machine.#define IMAGE_FILE_DEBUG_STRIPPED           0x0200  // Debugging info stripped from file in .DBG file#define IMAGE_FILE_REMOVABLE_RUN_FROM_SWAP   0x0400  // If Image is on removable media, copy and run from the swap file.#define IMAGE_FILE_NET_RUN_FROM_SWAP         0x0800  // If Image is on Net, copy and run from the swap file.#define IMAGE_FILE_SYSTEM                   0x1000  // System File.#define IMAGE_FILE_DLL                       0x2000  // File is a DLL.#define IMAGE_FILE_UP_SYSTEM_ONLY           0x4000  // File should only be run on a UP machine#define IMAGE_FILE_BYTES_REVERSED_HI         0x8000  // Bytes of machine word are reversed.
#define IMAGE_FILE_MACHINE_UNKNOWN           0#define IMAGE_FILE_MACHINE_TARGET_HOST       0x0001  // Useful for indicating we want to interact with the host and not a WoW guest.#define IMAGE_FILE_MACHINE_I386             0x014c  // Intel 386.#define IMAGE_FILE_MACHINE_R3000             0x0162  // MIPS little-endian, 0x160 big-endian#define IMAGE_FILE_MACHINE_R4000             0x0166  // MIPS little-endian#define IMAGE_FILE_MACHINE_R10000           0x0168  // MIPS little-endian#define IMAGE_FILE_MACHINE_WCEMIPSV2         0x0169  // MIPS little-endian WCE v2#define IMAGE_FILE_MACHINE_ALPHA             0x0184  // Alpha_AXP#define IMAGE_FILE_MACHINE_SH3               0x01a2  // SH3 little-endian#define IMAGE_FILE_MACHINE_SH3DSP           0x01a3#define IMAGE_FILE_MACHINE_SH3E             0x01a4  // SH3E little-endian#define IMAGE_FILE_MACHINE_SH4               0x01a6  // SH4 little-endian#define IMAGE_FILE_MACHINE_SH5               0x01a8  // SH5#define IMAGE_FILE_MACHINE_ARM               0x01c0  // ARM Little-Endian#define IMAGE_FILE_MACHINE_THUMB             0x01c2  // ARM Thumb/Thumb-2 Little-Endian#define IMAGE_FILE_MACHINE_ARMNT             0x01c4  // ARM Thumb-2 Little-Endian#define IMAGE_FILE_MACHINE_AM33             0x01d3#define IMAGE_FILE_MACHINE_POWERPC           0x01F0  // IBM PowerPC Little-Endian#define IMAGE_FILE_MACHINE_POWERPCFP         0x01f1#define IMAGE_FILE_MACHINE_IA64             0x0200  // Intel 64#define IMAGE_FILE_MACHINE_MIPS16           0x0266  // MIPS#define IMAGE_FILE_MACHINE_ALPHA64           0x0284  // ALPHA64#define IMAGE_FILE_MACHINE_MIPSFPU           0x0366  // MIPS#define IMAGE_FILE_MACHINE_MIPSFPU16         0x0466  // MIPS#define IMAGE_FILE_MACHINE_AXP64             IMAGE_FILE_MACHINE_ALPHA64#define IMAGE_FILE_MACHINE_TRICORE           0x0520  // Infineon#define IMAGE_FILE_MACHINE_CEF               0x0CEF#define IMAGE_FILE_MACHINE_EBC               0x0EBC  // EFI Byte Code#define IMAGE_FILE_MACHINE_AMD64             0x8664  // AMD64 (K8)#define IMAGE_FILE_MACHINE_M32R             0x9041  // M32R little-endian#define IMAGE_FILE_MACHINE_ARM64             0xAA64  // ARM64 Little-Endian#define IMAGE_FILE_MACHINE_CEE               0xC0EE

WORD NumberOfSections：文件头中的这个字段记录了文件中的节表（Section Table）的数量。节数（最大支持96）查看以上010Editor中解析文件头的截图中看到值为00 05， 那么就是5个区节段。

DWORD TimeDateStamp：该字段记录的是一个32位的时间戳，表示文件的编译或链接时间。它的格式是从1970年1月1日UTC时间起计算的秒数。可用于确定PE文件的创建时间，因此在文件分发、版本控制和调试等方面具有一定的重要性。通过对时间戳的比较，可以判断文件是否需要重新生成或重新发布。

Tips: TimeDateStamp字段不仅受到编译器或链接器的影响，还受到其他因素
（如构建系统或源代码管理工具的设置）的影响。
因此，它可能不一定准确反映文件的实际创建时间

WORD SizeOfOptionalHeader：一个WORD类型2字节的字段，告诉操作系统或程序解析器，可选头的大小是多少，方便后续读取和解析可选头的内容。

WORD Characteristics：一个WORD类型2字节的字段， 记录了文件的特征，查看以上010Editor中解析文件头的截图中看到值为01 02 那么去文件特征详细表中寻找01对应0x0100代表32位，02对应0x0002代表是可执行文件。

#define IMAGE_SIZEOF_FILE_HEADER             20#define IMAGE_FILE_RELOCS_STRIPPED           0x0001  // Relocation info stripped from file.#define IMAGE_FILE_EXECUTABLE_IMAGE         0x0002  // File is executable (i.e. no unresolved external references).#define IMAGE_FILE_LINE_NUMS_STRIPPED       0x0004  // Line nunbers stripped from file.#define IMAGE_FILE_LOCAL_SYMS_STRIPPED       0x0008  // Local symbols stripped from file.#define IMAGE_FILE_AGGRESIVE_WS_TRIM         0x0010  // Aggressively trim working set#define IMAGE_FILE_LARGE_ADDRESS_AWARE       0x0020  // App can handle >2gb addresses#define IMAGE_FILE_BYTES_REVERSED_LO         0x0080  // Bytes of machine word are reversed.#define IMAGE_FILE_32BIT_MACHINE             0x0100  // 32 bit word machine.#define IMAGE_FILE_DEBUG_STRIPPED           0x0200  // Debugging info stripped from file in .DBG file#define IMAGE_FILE_REMOVABLE_RUN_FROM_SWAP   0x0400  // If Image is on removable media, copy and run from the swap file.#define IMAGE_FILE_NET_RUN_FROM_SWAP         0x0800  // If Image is on Net, copy and run from the swap file.#define IMAGE_FILE_SYSTEM                   0x1000  // System File.#define IMAGE_FILE_DLL                       0x2000  // File is a DLL.#define IMAGE_FILE_UP_SYSTEM_ONLY           0x4000  // File should only be run on a UP machine#define IMAGE_FILE_BYTES_REVERSED_HI         0x8000  // Bytes of machine word are reversed.

3.可选头

跟进IMAGE_OPTIONAL_HEADER便可看到文件头参数(这里我跟进的是32位的)

windows逆向基础-PE文件结构详解（上）

以下是在010Editor中打开的可选头：

windows逆向基础-PE文件结构详解（上）

// Optional header format.//
typedef struct _IMAGE_OPTIONAL_HEADER {   //   // Standard fields.   //
   WORD    Magic;   BYTE    MajorLinkerVersion;   BYTE    MinorLinkerVersion;   DWORD   SizeOfCode;   DWORD   SizeOfInitializedData;   DWORD   SizeOfUninitializedData;   DWORD   AddressOfEntryPoint;   DWORD   BaseOfCode;   DWORD   BaseOfData;
   //   // NT additional fields.   //
   DWORD   ImageBase;   DWORD   SectionAlignment;   DWORD   FileAlignment;   WORD    MajorOperatingSystemVersion;   WORD    MinorOperatingSystemVersion;   WORD    MajorImageVersion;   WORD    MinorImageVersion;   WORD    MajorSubsystemVersion;   WORD    MinorSubsystemVersion;   DWORD   Win32VersionValue;   DWORD   SizeOfImage;   DWORD   SizeOfHeaders;   DWORD   CheckSum;   WORD    Subsystem;   WORD    DllCharacteristics;   DWORD   SizeOfStackReserve;   DWORD   SizeOfStackCommit;   DWORD   SizeOfHeapReserve;   DWORD   SizeOfHeapCommit;   DWORD   LoaderFlags;   DWORD   NumberOfRvaAndSizes;   IMAGE_DATA_DIRECTORY DataDirectory[IMAGE_NUMBEROF_DIRECTORY_ENTRIES];} IMAGE_OPTIONAL_HEADER32, *PIMAGE_OPTIONAL_HEADER32;

可选头重点字段

WORD Magic：一个WORD类型2字节的字段，表示镜像的状态。如010Editor中解析可选头的截图中值为01 0B, 那么0x10B意味这个是一个32位镜像文件。

0x10B: 32位镜像文件
0x107: ROM镜像文件
0x20B: 64位镜像文件

DWORD SizeOfCode：【代码段的大小】一般表示.text段的总大小（实际的有功能的代码占的大小）。

DWORD SizeOfInitializedData：【已初始化数据段大小】一般表示.data段的总大小 (动态变量的)。

DWORD SizeOfUninitializedData：【未初始化数据段大小】一般表示.bss段的总大小 (类的初始化的一些静态变量的)。

DWORD AddressOfEntryPoint：【入口点地址】它指示了程序的执行起始点。当可执行文件加载到内存中时，操作系统会从该地址开始执行代码（注意：AddressOfEntryPoint是可执行文件的入口点的偏移量，而不是地址）。

DWORD BaseOfCode：【代码段基址】表示.text代码段在内存中的起始地址（也就是写的代码第一行的位置）。

DWORD BaseOfData：【数据段基址】用于表示数据段.data在内存中的基地址。

DWORD ImageBase：【镜像基址】它是可执行文件(PE)加载到内存中时的起始地址。它表示可执行文件在内存中的基地址，也就是加载时的基础地址。所有在可执行文件中定义的相对地址都是相对于ImageBase的偏移量。

DWORD SectionAlignment： 【区段对齐】指示可执行文件中各个区段在内存中的对齐方式。

DWORD FileAlignment：【文件对齐】用来对齐镜像文件的节中的原始数据的对齐因子（以字节计）。它应该是界于512和64K之间的2的幂（包括这两个边界值）。默认是512。如果SectionAlignment小于相应系统的页面大小，那么FileAlignment必须与SectionAlignment相等。

DWORD SizeOfImage：【PE在内存中的总大小】当镜像被加载进内存时的大小，包括所有的文件头。向上舍入为SectionAlignment的倍数。

DWORD SizeOfHeaders：【头大小】PE中所有头的总大小。

DWORD CheckSum：【校验盒】现在除了游戏几乎使用的很少了。

WORD Subsystem：【子系统】

子系统表：

值	描述
0	未知子系统
1	设备驱动程序和Native Windows进程
2	Windows图形用户界面（GUI）子系统（一般程序）
3	Windows字符模式（CUI）子系统（从命令提示符启动的）
7	Posix字符模式子系统
9	Windows CE
10	可扩展固件接口（EFI）应用程序
11	带引导服务的EFI驱动程序
12	带运行时服务的EFI驱动程序
13	EFI ROM镜像
14	XBOX

WORD DllCharacteristics：DLL标识，从010Editor中打开的可选头来看该字段的值为85 40

// DllCharacteristics Entries
//     IMAGE_LIBRARY_PROCESS_INIT           0x0001     // Reserved.//     IMAGE_LIBRARY_PROCESS_TERM           0x0002     // Reserved.//     IMAGE_LIBRARY_THREAD_INIT             0x0004     // Reserved.//     IMAGE_LIBRARY_THREAD_TERM             0x0008     // Reserved.#define IMAGE_DLLCHARACTERISTICS_HIGH_ENTROPY_VA   0x0020  // Image can handle a high entropy 64-bit virtual address space.#define IMAGE_DLLCHARACTERISTICS_DYNAMIC_BASE 0x0040     // DLL can move.#define IMAGE_DLLCHARACTERISTICS_FORCE_INTEGRITY   0x0080     // Code Integrity Image#define IMAGE_DLLCHARACTERISTICS_NX_COMPAT   0x0100     // Image is NX compatible#define IMAGE_DLLCHARACTERISTICS_NO_ISOLATION 0x0200     // Image understands isolation and doesn't want it#define IMAGE_DLLCHARACTERISTICS_NO_SEH       0x0400     // Image does not use SEH. No SE handler may reside in this image#define IMAGE_DLLCHARACTERISTICS_NO_BIND     0x0800     // Do not bind this image.#define IMAGE_DLLCHARACTERISTICS_APPCONTAINER 0x1000     // Image should execute in an AppContainer#define IMAGE_DLLCHARACTERISTICS_WDM_DRIVER   0x2000     // Driver uses WDM model#define IMAGE_DLLCHARACTERISTICS_GUARD_CF     0x4000     // Image supports Control Flow Guard.#define IMAGE_DLLCHARACTERISTICS_TERMINAL_SERVER_AWARE     0x8000

IMAGE_DLLCHARACTERISTICS_DYNAMIC_BASE值为1的时候开启了aslr随机地址

windows逆向基础-PE文件结构详解（上）

以下是关闭aslr的OD截图

关闭随机地址后，我们便可以从以下公式中得出程序的入口点：

使用 ImageBase + AddressOfEntryPoint偏移量 = 程序入口点的虚拟地址。

所以我们得到：0040000h + 1000h = 00401000h

以下是开启aslr的OD截图

这里我们看到开启了随机地址，值不是00401000h

windows逆向基础-PE文件结构详解（上）

DWORD   SizeOfStackReserve：【栈保留大小】

DWORD   SizeOfStackCommit：【栈申请大小】

DWORD   SizeOfHeapReserve：【堆保留大小】

DWORD   SizeOfHeapCommit：【堆申请大小】

DWORD   LoaderFlags：【标志位】

DWORD   NumberOfRvaAndSizes：【数据目录】（十进制16，16进制0x10）

IMAGE_DATA_DIRECTORY_ARRAY DataDirArray【导入导出信息的总览结构】

struct IMAGE_DATA_DIRECTORY_ARRAY DataDirArray //指向的是一个指针，里面的内容指向的是描述表   struct IMAGE_DATA_DIRECTORY Import  //里面包含了导入表的起始地址和大小。       DWORD VirtualAddress  //指向导入表的起始地址在内存中的虚拟地址。       DWORD Size            //导入表的大小，以字节为单位。
struct IMAGE_IMPORT_DESCRIPTOR ImportDescriptor[0] //里面有dll和函数的地址

三、节头

咱们可以从C++中的winnt.h库中找到具体节头信息，跟进去搜索IMAGE_SECTION_HEADER即可看到节头的参数

typedef struct _IMAGE_SECTION_HEADER {   BYTE    Name[IMAGE_SIZEOF_SHORT_NAME];   union {           DWORD   PhysicalAddress;           DWORD   VirtualSize;  } Misc;   DWORD   VirtualAddress;   DWORD   SizeOfRawData;   DWORD   PointerToRawData;   DWORD   PointerToRelocations;   DWORD   PointerToLinenumbers;   WORD    NumberOfRelocations;   WORD    NumberOfLinenumbers;   DWORD   Characteristics;} IMAGE_SECTION_HEADER, *PIMAGE_SECTION_HEADER;

BYTE Name[IMAGE_SIZEOF_SHORT_NAME]：本节的物理地址

union：

    DWORD PhysicalAddress：本节的物理地址。

    DWORD VirtualSize：本节的实际大小。

DWORD   VirtualAddress：本节的相对虚拟地址（RVA）。

DWORD SizeOfRawData：本节在磁盘中的大小。

DWORD   PointerToRawData：本节在磁盘中的偏移。

DWORD   PointerToRelocations：重定位信息在文件中的偏移，对于本节无意义。

DWORD   PointerToLinenumbers：行号信息在文件中的偏移。

WORD    NumberOfRelocations：重定位信息的数量。

WORD    NumberOfLinenumbers：行号信息的数量。

DWORD   Characteristics：节的特征，包括可执行、可读、可写等属性。

0x03 PE的运行过程

#include <stdio.h>#include <stdlib.h>#include <Windows.h>#include <winnt.h>#pragma warning(disable:4996)void* load_PE(char* PE_data);void fix_iat(char*, IMAGE_NT_HEADERS*);void fix_base_reloc(char* p_image_base, IMAGE_NT_HEADERS* p_NT_headers);
int main(int argc, char const* argv[]) {if (argc < 2) {printf("missing path argumentn");return 1;}FILE* exe_file = fopen(argv[1], "rb");if (!exe_file) {printf("error opening filen");return 1;}// Get file size : put pointer at the endfseek(exe_file, 0L, SEEK_END);// and read its positionlong int file_size = ftell(exe_file);// put the pointer back at the beginningfseek(exe_file, 0L, SEEK_SET);// allocate memory and read the whole filechar* exe_file_data = (char*)malloc(file_size + 1);// read whole filesize_t n_read = fread(exe_file_data, 1, file_size, exe_file);if (n_read != file_size) {printf("reading error (%d)n", n_read);return 1;}// load the PE in memoryprintf("[+] Loading PE filen");//pe里面有个导入表//字典 里面不仅要有内容 还要有内容对应的名称void* entry = load_PE(exe_file_data);if (entry != NULL) {// call its entrypoint((void (*)(void))entry)();}return 0;}
void* load_PE(char* PE_data) {IMAGE_DOS_HEADER* p_DOS_header = (IMAGE_DOS_HEADER*)PE_data;IMAGE_NT_HEADERS* p_NT_headers = (IMAGE_NT_HEADERS*)(PE_data + p_DOS_header -> e_lfanew);// extract information from PE headerDWORD size_of_image = p_NT_headers->OptionalHeader.SizeOfImage;DWORD entry_point_RVA = p_NT_headers->OptionalHeader.AddressOfEntryPoint;DWORD size_of_headers = p_NT_headers->OptionalHeader.SizeOfHeaders;// allocate memory// https://docs.microsoft.com/en-us/windows/win32/api/memoryapi/nf-memoryapi•virtualallocchar* p_image_base = (char*)VirtualAlloc(NULL, size_of_image, MEM_RESERVE |MEM_COMMIT, PAGE_READWRITE);if (p_image_base == NULL) {return NULL;}// copy PE headers in memorymemcpy(p_image_base, PE_data, size_of_headers);// Section headers starts right after the IMAGE_NT_HEADERS struct, so we do somepointer arithmetic - fu here.IMAGE_SECTION_HEADER * sections = (IMAGE_SECTION_HEADER*)(p_NT_headers + 1);for (int i = 0; i < p_NT_headers->FileHeader.NumberOfSections; i++) {// calculate the VA we need to copy the content, from the RVA// section[i].VirtualAddress is a RVA, mind itchar* dest = p_image_base + sections[i].VirtualAddress;// check if there is Raw data to copyif (sections[i].SizeOfRawData > 0) {// We copy SizeOfRaw data bytes, from the offset PointerToRawData in thefilememcpy(dest, PE_data + sections[i].PointerToRawData,sections[i].SizeOfRawData);}else {memset(dest, 0, sections[i].Misc.VirtualSize);}}fix_iat(p_image_base, p_NT_headers);fix_base_reloc(p_image_base, p_NT_headers);// Set permission for the PE header to read onlyDWORD oldProtect;VirtualProtect(p_image_base, p_NT_headers->OptionalHeader.SizeOfHeaders,PAGE_READONLY, &oldProtect);for (int i = 0; i < p_NT_headers->FileHeader.NumberOfSections; ++i) {char* dest = p_image_base + sections[i].VirtualAddress;DWORD s_perm = sections[i].Characteristics;DWORD v_perm = 0; // flags are not the same between virtal protect and thesection headerif (s_perm & IMAGE_SCN_MEM_EXECUTE) {v_perm = (s_perm & IMAGE_SCN_MEM_WRITE) ? PAGE_EXECUTE_READWRITE :PAGE_EXECUTE_READ;}else {v_perm = (s_perm & IMAGE_SCN_MEM_WRITE) ? PAGE_READWRITE :PAGE_READONLY;}VirtualProtect(dest, sections[i].Misc.VirtualSize, v_perm, &oldProtect);}return (void*)(p_image_base + entry_point_RVA);}
void fix_iat(char* p_image_base, IMAGE_NT_HEADERS* p_NT_headers) {IMAGE_DATA_DIRECTORY* data_directory = p_NT_headers -> OptionalHeader.DataDirectory;// load the address of the import descriptors arrayIMAGE_IMPORT_DESCRIPTOR* import_descriptors =(IMAGE_IMPORT_DESCRIPTOR*)(p_image_base +data_directory[IMAGE_DIRECTORY_ENTRY_IMPORT].VirtualAddress);// this array is null terminatedfor (int i = 0; import_descriptors[i].OriginalFirstThunk != 0; ++i) {// Get the name of the dll, and import itchar* module_name = p_image_base + import_descriptors[i].Name;HMODULE import_module = LoadLibraryA(module_name);if (import_module == NULL) {printf("import module is null");abort();}// the lookup table points to function names or ordinals => it is the IDTIMAGE_THUNK_DATA* lookup_table = (IMAGE_THUNK_DATA*)(p_image_base +import_descriptors[i].OriginalFirstThunk);// the address table is a copy of the lookup table at first// but we put the addresses of the loaded function inside => that's the IATIMAGE_THUNK_DATA* address_table = (IMAGE_THUNK_DATA*)(p_image_base +import_descriptors[i].FirstThunk);// null terminated array, againfor (int i = 0; lookup_table[i].u1.AddressOfData != 0; ++i) {void* function_handle = NULL;// Check the lookup table for the adresse of the function name to importDWORD lookup_addr = lookup_table[i].u1.AddressOfData;if ((lookup_addr & IMAGE_ORDINAL_FLAG) == 0) { // if first bit is not 1// import by name : get the IMAGE_IMPORT_BY_NAME structIMAGE_IMPORT_BY_NAME* image_import = (IMAGE_IMPORT_BY_NAME*)(p_image_base + lookup_addr);// this struct points to the ASCII function namechar* funct_name = (char*)&(image_import->Name);// get that function address from it's module and namefunction_handle = (void*)GetProcAddress(import_module, funct_name);}else {// import by ordinal, directlyfunction_handle = (void*)GetProcAddress(import_module,(LPSTR)lookup_addr);}if (function_handle == NULL) {printf("function handle is null");abort();}// change the IAT, and put the function address inside.address_table[i].u1.Function = (DWORD)function_handle;}}}
void fix_base_reloc(char* p_image_base, IMAGE_NT_HEADERS* p_NT_headers) {IMAGE_DATA_DIRECTORY* data_directory = p_NT_headers -> OptionalHeader.DataDirectory;// this is how much we shifted the ImageBaseDWORD delta_VA_reloc = ((DWORD)p_image_base) - p_NT_headers -> OptionalHeader.ImageBase;// if there is a relocation table, and we actually shitfted the ImageBaseif (data_directory[IMAGE_DIRECTORY_ENTRY_BASERELOC].VirtualAddress != 0 &&delta_VA_reloc != 0) {// calculate the relocation table addressIMAGE_BASE_RELOCATION* p_reloc =(IMAGE_BASE_RELOCATION*)(p_image_base +data_directory[IMAGE_DIRECTORY_ENTRY_BASERELOC].VirtualAddress);// once again, a null terminated arraywhile (p_reloc->VirtualAddress != 0) {// how any relocation in this block// ie the total size, minus the size of the "header", divided by 2(those are words, so 2 bytes for each)DWORD size = (p_reloc->SizeOfBlock - sizeof(IMAGE_BASE_RELOCATION)) / 2;// the first relocation element in the block, right after the header(using pointer arithmetic again)WORD* fixups = (WORD*)(p_reloc + 1);for (int i = 0; i < size; ++i) {// type is the first 4 bits of the relocation wordint type = fixups[i] >> 12;// offset is the last 12 bitsint offset = fixups[i] & 0x0fff;// this is the address we are going to changeDWORD* change_addr = (DWORD*)(p_image_base + p_reloc->VirtualAddress+ offset);

下面是PE结构的详细运行过程：

1. 加载器加载可执行文件：当用户双击可执行文件时，操作系统的加载器（Loader）会将可执行文件加载到内存中。

2. 解析PE头：加载器会解析PE头部分，其中包含了可执行文件的各种信息，如文件类型、入口点地址、节表等。

3. 分配内存空间：加载器根据PE头中的节表信息，为可执行文件分配内存空间。

4. 加载节数据：加载器将可执行文件中的各个节（Section）的数据加载到相应的内存空间中。

5. 重定位：如果可执行文件中包含了需要重定位的代码或数据，加载器会根据重定位表中的信息，修改相应的地址。

6. 导入解析：加载器会解析可执行文件中的导入表，找到依赖的外部函数或模块，并加载这些外部函数或模块。

7. 入口点执行：加载器会跳转到PE头中指定的入口点地址，开始执行可执行文件的代码。

8. 执行代码：可执行文件的代码会按照指令顺序执行，完成相应的功能。

9.退出程序：当可执行文件的代码执行完毕或出现错误时，程序会退出，资源会被释放。

本文部分资料引用以下文章

PE结构详解：

https://blog.csdn.net/cs2626242/article/details/79391599

PE结构详解加壳脱壳必备知识:

https://blog.csdn.net/a59a59/article/details/103214936

原文始发于微信公众号（沃克学安全）：windows逆向基础-PE文件结构详解（上）

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

windows逆向基础-PE文件结构详解（上）

0x00 前置基础

0x01 什么是PE结构？

0x02 PE格式详解

一、DOS头

DOS头重点字段

二、NT头

1.PE签名

2.文件头

文件头重点字段

3.可选头

可选头重点字段

三、节头

0x03 PE的运行过程

Redroid 镜像编译及预埋 adb_key认证

五种 EXE 处理方式，突破静态查杀

Windows本地代码执行漏洞(CVE-2012-1876)x86/x64平台分析

arm中的多寄存器寻址和与堆栈寻址

【免杀思路】基于特征码免杀

木马基础伪装学习

免杀菜鸡如何免杀自己的fscan

【免杀思路】被360殴打的那些日子

Typora 1.10.8公钥替换

Metasploit 简单木马免杀

发表评论