汇编语言和cpu以及内存,端口等硬件知识是连在一起的. 这也是为什么汇编语言没有通用性的原因. 下面简单讲讲基本知识(针对intel x86及其兼容机)
x86汇编语言的指令,其操作对象是cpu上的寄存器,系统内存,或者立即数. 有些指令表面上没有操作数, 或者看上去缺少操作数, 其实该指令有内定的操作对象, 比如push指令, 一定是对ss:esp指定的内存操作, 而cdq的操作对象一定是eax / edx.
在汇编语言中,寄存器用名字来访问. cpu 寄存器有好几类, 分别有不同的用处:
1. 通用寄存器: eax,ebx,ecx,edx,esi,edi,ebp,esp(这个虽然通用,但很少被用做除了堆栈指针外的用途) 这些32位可以被用作多种用途,但每一个都有'专长'. eax 是'累加器'(accumulator), 它是很多加法乘法指令的缺省寄存器. ebx 是'基地址'(base)寄存器, 在内存寻址时存放基地址. ecx 是计数器(counter), 是重复(rep)前缀指令和loop指令的内定计数器. edx是...(忘了..哈哈)但它总是被用来放整数除法产生的余数. 这4个寄存器的低16位可以被单独访问,分别用ax,bx,cx和dx. ax又可以单独访问低8位(al)和高8位(ah), bx,cx,dx也类似. 函数的返回值经常被放在eax中. esi/edi分别叫做'源/目标索引寄存器'(source/destination index),因为在很多字符串操作指令中, ds:esi指向源串,而es:edi指向目标串. ebp是'基址指针'(base pointer), 它最经常被用作高级语言函数调用的'框架指针'(frame pointer). 在破解的时候,经常可以看见一个标准的函数起始代码: push ebp ;保存当前ebp mov ebp,esp ;ebp设为当前堆栈指针 sub esp, xxx ;预留xxx字节给函数临时变量. ... 这样一来,ebp 构成了该函数的一个框架, 在ebp上方分别是原来的ebp, 返回地址和参数. ebp下方则是临时变量. 函数返回时作 mov esp,ebp/pop ebp/ret 即可. esp 专门用作堆栈指针. 2. 段寄存器: cs(code segment,代码段) 指定当前执行的代码段. eip (instruction pointer, 指令指针)则指向该段中一个具体的指令. cs:eip指向哪个指令, cpu 就执行它. 一般只能用jmp, ret, jnz, call 等指令来改变程序流程,而不能直接对它们赋值. ds(data segment, 数据段) 指定一个数据段. 注意:在当前的计算机系统中, 代码和数据没有本质差别, 都是一串二进制数, 区别只在于你如何用它. 例如, cs 制定的段总是被用作代码, 一般不能通过cs指定的地址去修改该段. 然而,你可以为同一个段申请一个数据段描述符'别名'而通过ds来访问/修改. 自修改代码的程序常如此做. es,fs,gs 是辅助的段寄存器, 指定附加的数据段. ss(stack segment)指定当前堆栈段. esp 则指出该段中当前的堆栈顶. 所有push/pop 系列指令都只对ss:esp指出的地址进行操作. 3. 标志寄存器(eflags): 该寄存器有32位,组合了各个系统标志. eflags一般不作为整体访问, 而只对单一的标志位感兴趣. 常用的标志有: 进位标志c(carry), 在加法产生进位或减法有借位时置1, 否则为0. 零标志z(zero), 若运算结果为0则置1, 否则为0 符号位s(sign), 若运算结果的最高位置1, 则该位也置1. 溢出标志o(overflow), 若(带符号)运算结果超出可表示范围, 则置1. jxx 系列指令就是根据这些标志来决定是否要跳转, 从而实现条件分枝. 要注意,很多jxx 指令是等价的, 对应相同的机器码. 例如, je 和jz 是一样的,都是当z=1是跳转. 只有jmp 是无条件跳转. jxx 指令分为两组, 分别用于无符号操作和带符号操作. jxx 后面的'xx' 有如下字母: 无符号操作: 带符号操作: a = 'above', 表示'高于' g = 'greater', 表示'大于' b = 'below', 表示'低于' l = 'less', 表示'小于' c = 'carry', 表示'进位'或'借位' o = 'overflow', 表示'溢出' s = 'sign', 表示'负' 通用符号: e = 'equal' 表示'等于', 等价于z (zero) n = 'not' 表示'非', 即标志没有置位. 如jnz '如果z没有置位则跳转' z = 'zero', 与e同. 如果仔细想一想,就会发现 ja = jnbe, jae = jnb, jbe = jna, jg = jnle, jge= jnl, jl= jnge, .... 4. 端口
端口是直接和外部设备通讯的地方。外设接入系统后,系统就会把外设的数据接口映射到特定的端口地址空间,这样,从该端口读入数据就是从外设读入数据,而向外设写入数据就是向端口写入数据。当然这一切都必须遵循外设的工作方式。端口的地址空间与内存地址空间无关,系统总共提供对64k个8位端口的访问,编号0-65535. 相邻的8位端口可以组成成一个16位端口,相邻的16位端口可以组成一个32位端口。端口输入输出由指令in,out,ins和outs实现,具体可参考汇编语言书籍。
|