可执行程序(executable program,EXE File)是可在操作系统
存储空间中浮动定位的二进制可执行程序。它可以加载到内存中,由
操作系统加载并执行。特定的CPU
指令集(如
X86指令集)对应的不同平台之间的可执行程序不可直接移植运行。
简介
windows操作系统中的二进制可执行文件分两种:一种后辍名为.COM,另一种是.EXE 。在
MS-DOSlinux不像MS-DOS/windows一样靠文件后缀名来判断是否可执行,而是靠文件属性来判断。每个文件专门有个属性来表示文件是否可执行,对于脚本之类的程序,文件第一行指明执行本脚本的程序位置。
windows/MS-DOS下的EXE 文件比较复杂,但每个EXE文件都有一个文件头,其结构如下。
EXE文件头的信息
├00h-01h ┤MZ'EXE文件标记 ┤
├02h-03h ┤最后一页的
字节数(每页512B) ┤
├04h-05h ┤文件长度(字节数)除以512的
商+1 -| ┤
├0ah-0bh ┤程序运行所需最小段数 ┤
├0ch-0dh ┤..............大.... ┤
├10h-11h ┤........sp ┤
├12h-13h ┤文件校验和 ┤
├14h-15h ┤IP ┤
├16h-17h ┤CS ┤
├18h-19h ┤............ ┤
├1ah-1bh ┤............ ┤
├1ch ┤............ ┤
―――――――――――――――――――――――――
.EXE文件包含一个
文件头和一个可
重定位程序映象。
文件头包含
MS-DOS用于加载程序的信息,例如程序的大小和
寄存器的初始值。
文件头还指向一个
重定位表,该表包含指向程序映象中可重定位
段地址的
指针链表。文件头的形式与EXEHEADER结构对应:
EXEHEADER STRUC
exSignature dw 5A4Dh ;.EXE标志
exExraBytes dw ;最后(部分)页中的字节数
exPages dw ;文件中的全部和部分页数
exRelocItems dw ;重定位表中的
指针数
exHeaderSize dw ;以
字节为单位的
文件头大小
exMinAlloc dw ;最小分配大小
exMaxAlloc dw ;最大分配大小
exInitSS dw ;初始SS值
exInitSP dw ;初始SP值
exChechSum dw ;补码校验值
exInitIP dw ;初始IP值
exInitCS dw ;初始CS值
exRelocTable dw ;重定位表的字节
偏移量exOverlay dw ;覆盖号
EXEHEADER ENDS程序映象
包含处理器代码和程序的初始数据,紧接在
文件头之后。它的大小以
字节为单位,等于EXE文件的大小减去
文件头的大小,也等于exHeaderSize的域的值乘以16。MS-DOS通过把该映象直接从文件拷贝到内存加载.EXE程序然后调整定位表中说明的可
重定位段地址。
定位表是一个
重定位指针数组,每个指向程序映象中的可
重定位段地址。
文件头中的exRelocItems域说明了数组中
指针的个数,exRelocTable域说明了分配表的起始文件
偏移量。每个重定位
指针由两个16位值组成:
偏移量和段值。 为加载.EXE程序,MS-DOS首先读
文件头以确定.EXE标志并计算程序映象的大小。然后它试图申请内存。首先,它计算程序
映象文件的大小加上PSP的大小再加上EXEHEADER结构中的exMinAlloc域说明的内存大小这三者之和,如果总和超过最大可用内存块的大小。则MS-DOS停止加载程序并返回一个出错值。如果总和没超过最大可用内存块的大小,它便计算程序映象的大小加上PSP的大小再加上EXEHEADER结构中exMaxAlloc域说明的内存大小之和,如果第二个总和小于最大可用内存块的大小,则MS-DOS 分配计算得到的内存量。否则,它分配最大可用内存块。分配完内存后,MS-DOS确定
段地址,也称为起始段地址,MS-DOS从此处加载程序映象。如果exMinAlloc域和exMaxAlloc域中的值都为零,则MS-DOS把映象尽可能地加载到内存最高端。否则,它把映象加载到紧挨着PSP域之上。接下来,MS-DOS读取
重定位表中的项目调整所有由可重定位指针说明的
段地址。对于
重定位表中的每个
指针,MS-DOS寻找程序映象中相应的可重定位
段地址,并把起始段地址加到它之上。一旦调整完毕,
段地址便指向了内存中被加载程序的代码和
数据段。 MS-DOS在所分配内存的最低部分建造256
字节的PSP,把AL和AH设置为加载 .COM程序时所设置的值。MS-DOS使用
文件头中的值设置SP与SS,调整SS初始值,把起始地址加到它之上。MS-DOS还把ES和DS设置为PSP的
段地址.最后,MS-DOS从
程序文件头读取CS和IP的初始值,把起始段地址加到CS之 上,把控制转移到位于调整后地址处的程序。
文件格式
Linux32/64位可执行文件
Linux是靠文件属性来判断判断是否可执行。每个文件专门有个属性来表示文件是否可执行。
MS-DOS可执行文件
最简单的可执行文件格式,可以在
MS-DOS和32位的
WINDOWS中运行。它通过在
文件头添加
ASCII字符串“MZ”(16进制中表示为4D5A)来标识。“MZ”是MS-DOS开发者之一的
马克·茨柏克沃斯基(Mark Zbikowski)的姓名首字母缩写DOS可执行文件是16位可执行文件,运行于兼容x86指令集(或x86虚拟机)下的实模式或虚拟8086模式。
16位NE X86可执行文件
通过在
文件头添加ASCII字符串“NE”来标识。它只能运行在Windows和OS/2系统,而不能在DOS下运行。
16/32位X86可执行文件
通过在文件头添加ASCII字符串“LE”来标识。它仅用来在Windows 3.x和Windows 9x中替代VxD驱动。
32位线性可执行文件
通过在文件头添加ASCII字符串“LX”来标识。运行在OS/2 2.0以及更高版本中,也可用于某些
DOS扩展。
32位X86可执行文件
这是最复杂也最流行的
可执行文件格式,通过在
文件头添加ASCII字符串“PE”来标识。它主要运行于Windows 95和Windows NT以及更高版本的Windows中,也可在BeOS R3中运行。
64位X86-64可执行文件
与前一种类似,但使用支持64位的X86cpu(64根地址总线)。因此它仅能在64位的Windows系统中运行,譬如Windows 7 64位和 Windows10 X64。
反编译
计算机软件反向工程也称为计算机软件还原工程,是指通过对他人软件的目标程序(可执行程序)进行“逆向分析、研究”工作,以推导出他人的软件产品所使用的思路、原理、结构、算法、处理过程、运行方法等设计要素,某些特定情况下可能推导出源代码。
反汇编是把目标代码转为汇编代码的过程,是把二级制可执行程序机器语言转换为汇编语言代码,常用于软件破解、病毒分析、逆向工程、软件汉化等领域。