__libc_start_main @ plt如何工作?

为了研究如何在linux下加载和运行目标文件,我做了最简单的c代码,文件名为simple.c。

int main(){} 

接下来,我创build目标文件并将目标文件保存为文本文件。

 $gcc ./simple.c $objdump -xD ./a.out > simple.text 

从许多互联网文章中,我可以捕捉到gccdynamic加载启动函数,如_start,_init,__libc_start_main @ plt等。 所以我开始阅读我的汇编代码,由http://dbp-consulting.com/tutorials/debugging/linuxProgramStartup.html帮助。

这是汇编代码的一部分。

 080482e0 <__libc_start_main@plt>: 80482e0: ff 25 10 a0 04 08 jmp *0x804a010 80482e6: 68 08 00 00 00 push $0x8 80482eb: e9 d0 ff ff ff jmp 80482c0 <_init+0x2c> Disassembly of section .text: 080482f0 <_start>: 80482f0: 31 ed xor %ebp,%ebp 80482f2: 5e pop %esi 80482f3: 89 e1 mov %esp,%ecx 80482f5: 83 e4 f0 and $0xfffffff0,%esp 80482f8: 50 push %eax 80482f9: 54 push %esp 80482fa: 52 push %edx 80482fb: 68 70 84 04 08 push $0x8048470 8048300: 68 00 84 04 08 push $0x8048400 8048305: 51 push %ecx 8048306: 56 push %esi 8048307: 68 ed 83 04 08 push $0x80483ed 804830c: e8 cf ff ff ff call 80482e0 <__libc_start_main@plt> 8048311: f4 hlt 8048312: 66 90 xchg %ax,%ax 8048314: 66 90 xchg %ax,%ax 8048316: 66 90 xchg %ax,%ax 8048318: 66 90 xchg %ax,%ax 804831a: 66 90 xchg %ax,%ax 804831c: 66 90 xchg %ax,%ax 804831e: 66 90 xchg %ax,%ax 080483ed <main>: 80483ed: 55 push %ebp 80483ee: 89 e5 mov %esp,%ebp 80483f0: b8 00 00 00 00 mov $0x0,%eax 80483f5: 5d pop %ebp 80483f6: c3 ret 80483f7: 66 90 xchg %ax,%ax 80483f9: 66 90 xchg %ax,%ax 80483fb: 66 90 xchg %ax,%ax 80483fd: 66 90 xchg %ax,%ax 80483ff: 90 nop ... Disassembly of section .got: 08049ffc <.got>: 8049ffc: 00 00 add %al,(%eax) ... Disassembly of section .got.plt: 0804a000 <_GLOBAL_OFFSET_TABLE_>: 804a000: 14 9f adc $0x9f,%al 804a002: 04 08 add $0x8,%al ... 804a00c: d6 (bad) 804a00d: 82 (bad) 804a00e: 04 08 add $0x8,%al 804a010: e6 82 out %al,$0x82 804a012: 04 08 add $0x8,%al 

我的问题是

在0x804830c中,0x80482e0被调用(我已经理解了前面的说明)。

在0x80482e0中,进程跳转到0x804a010。

在0x804a010中,指令是<out%al,$ 0x82>

…等待。 刚出去? %al和0x82在哪里? 我被卡在这一行。

请帮忙….

* ps我是初学者到Linux和操作系统。 我正在学校学习操作系统的概念,但仍然找不到如何学习适当的Linux汇编语言。 我已经下载了英特尔处理器手册,但是它太大,无法阅读。 任何人都可以通知我好的材料吗? 谢谢。

 80482e0: ff 25 10 a0 04 08 jmp *0x804a010 

这意味着“检索存储在0x804a010的4字节地址并跳转到该地址”。

 804a010: e6 82 out %al,$0x82 804a012: 04 08 add $0x8,%al 

这4个字节将被视为地址0x80482e6,而不是指令。

 80482e0: ff 25 10 a0 04 08 jmp *0x804a010 80482e6: 68 08 00 00 00 push $0x8 80482eb: e9 d0 ff ff ff jmp 80482c0 <_init+0x2c> 

所以我们刚刚执行了一条指令,让我们只有一条指令。 在这一点上,你可能想知道这是否有一个很好的理由。

有。 这是典型的PLT / GOT实施。 更多的细节,包括一个图,是在共享库中的位置独立代码:程序链接表 。

__libc_start_main的真实代码位于共享库glibc 。 编译器和编译时链接器不知道代码在运行时的位置,所以它们在编译后的程序中放置一个简短的__libc_start_main函数,其中只包含三条指令:

  • 跳转到GOT中第4位(或第5位,取决于您是否从0或1计数)指定的位置
  • 把$ 8推到堆栈上
  • 跳转到解析程序

第一次调用__libc_start_main ,解析器代码将运行。 它将在共享库中找到__libc_start_main的实际位置, __libc_start_main GOT的第4个条目修补为该地址。 如果您的程序再次调用__libc_start_main ,则jmp *0x804a010指令将直接将程序带到共享库中的代码。

任何人都可以通知我好的材料吗?

Wikibooks上的x86 Assembly书可能是一个开始的地方。