可执行程序
二进制可执行程序
可执行程序(executable program,EXE File)是可在操作系统存储空间中浮动定位的二进制可执行程序。它可以加载到内存中,由操作系统加载并执行。特定的CPU指令集(如X86指令集)对应的不同平台之间的可执行程序不可直接移植运行。
简介
windows操作系统中的二进制可执行文件分两种:一种后辍名为.COM,另一种是.EXE 。在MS-DOSlinux不像MS-DOS/windows一样靠文件后缀名来判断是否可执行,而是靠文件属性来判断。每个文件专门有个属性来表示文件是否可执行,对于脚本之类的程序,文件第一行指明执行本脚本的程序位置。
windows/MS-DOS下的EXE 文件比较复杂,但每个EXE文件都有一个文件头,其结构如下。
EXE文件头的信息
偏移量┤  意义   ┤
├00h-01h ┤MZ'EXE文件标记   ┤
├02h-03h ┤最后一页的字节数(每页512B)  ┤
├04h-05h ┤文件长度(字节数)除以512的+1 -|   ┤
├06h-07h ┤重定位项的个数    ┤
├08h-09h ┤文件头除16的商   ┤
├0ah-0bh ┤程序运行所需最小段数 ┤
├0ch-0dh ┤..............大.... ┤
├oeh-0fh ┤堆栈段的段值 (SS)  ┤
├10h-11h ┤........sp    ┤
├12h-13h ┤文件校验和   ┤
├14h-15h ┤IP   ┤
├16h-17h ┤CS   ┤
├18h-19h ┤............    ┤
├1ah-1bh ┤............   ┤
├1ch  ┤............     ┤
―――――――――――――――――――――――――
.EXE文件包含一个文件头和一个可重定位程序映象。文件头包含MS-DOS用于加载程序的信息,例如程序的大小和寄存器的初始值。文件头还指向一个重定位表,该表包含指向程序映象中可重定位段地址指针链表。文件头的形式与EXEHEADER结构对应:
EXEHEADER STRUC
exSignature dw 5A4Dh ;.EXE标志
exExraBytes dw ;最后(部分)页中的字节数
exPages dw ;文件中的全部和部分页数
exRelocItems dw ;重定位表中的指针
exHeaderSize dw ;以字节为单位的文件头大小
exMinAlloc dw ;最小分配大小
exMaxAlloc dw ;最大分配大小
exInitSS dw ;初始SS值
exInitSP dw ;初始SP值
exChechSum dw ;补码校验值
exInitIP dw ;初始IP值
exInitCS dw ;初始CS值
exRelocTable dw ;重定位表的字节偏移量
exOverlay dw ;覆盖号
EXEHEADER ENDS程序映象
包含处理器代码和程序的初始数据,紧接在文件头之后。它的大小以字节为单位,等于EXE文件的大小减去文件头的大小,也等于exHeaderSize的域的值乘以16。MS-DOS通过把该映象直接从文件拷贝到内存加载.EXE程序然后调整定位表中说明的可重定位段地址。
定位表是一个重定位指针数组,每个指向程序映象中的可重定位段地址。文件头中的exRelocItems域说明了数组中指针的个数,exRelocTable域说明了分配表的起始文件偏移量。每个重定位指针由两个16位值组成:偏移量和段值。 为加载.EXE程序,MS-DOS首先读文件头以确定.EXE标志并计算程序映象的大小。然后它试图申请内存。首先,它计算程序映象文件的大小加上PSP的大小再加上EXEHEADER结构中的exMinAlloc域说明的内存大小这三者之和,如果总和超过最大可用内存块的大小。则MS-DOS停止加载程序并返回一个出错值。如果总和没超过最大可用内存块的大小,它便计算程序映象的大小加上PSP的大小再加上EXEHEADER结构中exMaxAlloc域说明的内存大小之和,如果第二个总和小于最大可用内存块的大小,则MS-DOS 分配计算得到的内存量。否则,它分配最大可用内存块。分配完内存后,MS-DOS确定段地址,也称为起始段地址,MS-DOS从此处加载程序映象。如果exMinAlloc域和exMaxAlloc域中的值都为零,则MS-DOS把映象尽可能地加载到内存最高端。否则,它把映象加载到紧挨着PSP域之上。接下来,MS-DOS读取重定位表中的项目调整所有由可重定位指针说明的段地址。对于重定位表中的每个指针,MS-DOS寻找程序映象中相应的可重定位段地址,并把起始段地址加到它之上。一旦调整完毕,段地址便指向了内存中被加载程序的代码和数据段。 MS-DOS在所分配内存的最低部分建造256字节的PSP,把AL和AH设置为加载 .COM程序时所设置的值。MS-DOS使用文件头中的值设置SP与SS,调整SS初始值,把起始地址加到它之上。MS-DOS还把ES和DS设置为PSP的段地址.最后,MS-DOS从程序文件头读取CS和IP的初始值,把起始段地址加到CS之 上,把控制转移到位于调整后地址处的程序。
文件格式
Linux32/64位可执行文件
Linux是靠文件属性来判断判断是否可执行。每个文件专门有个属性来表示文件是否可执行。
MS-DOS可执行文件
最简单的可执行文件格式,可以在MS-DOS和32位的WINDOWS中运行。它通过在文件头添加ASCII字符串“MZ”(16进制中表示为4D5A)来标识。“MZ”是MS-DOS开发者之一的马克·茨柏克沃斯基(Mark Zbikowski)的姓名首字母缩写DOS可执行文件是16位可执行文件,运行于兼容x86指令集(或x86虚拟机)下的实模式或虚拟8086模式。
16位NE X86可执行文件
通过在文件头添加ASCII字符串“NE”来标识。它只能运行在Windows和OS/2系统,而不能在DOS下运行。
16/32位X86可执行文件
通过在文件头添加ASCII字符串“LE”来标识。它仅用来在Windows 3.x和Windows 9x中替代VxD驱动。
32位线性可执行文件
通过在文件头添加ASCII字符串“LX”来标识。运行在OS/2 2.0以及更高版本中,也可用于某些DOS扩展。
32位X86可执行文件
这是最复杂也最流行的可执行文件格式,通过在文件头添加ASCII字符串“PE”来标识。它主要运行于Windows 95和Windows NT以及更高版本的Windows中,也可在BeOS R3中运行。
64位X86-64可执行文件
与前一种类似,但使用支持64位的X86cpu(64根地址总线)。因此它仅能在64位的Windows系统中运行,譬如Windows 7 64位和 Windows10 X64。
反编译
计算机软件反向工程也称为计算机软件还原工程,是指通过对他人软件的目标程序(可执行程序)进行“逆向分析、研究”工作,以推导出他人的软件产品所使用的思路、原理、结构、算法、处理过程、运行方法等设计要素,某些特定情况下可能推导出源代码。
反汇编是把目标代码转为汇编代码的过程,是把二级制可执行程序机器语言转换为汇编语言代码,常用于软件破解、病毒分析、逆向工程、软件汉化等领域。
常用软件debugW32DasmC32Asm
修改软件UEStudio开发环境等
参考资料
最新修订时间:2023-12-02 09:38
目录
概述
简介
参考资料