当前位置:  开发笔记 > 编程语言 > 正文

直接读程序计数器

如何解决《直接读程序计数器》经验,为你挑选了4个好方法。

在内核模式或其他模式下,可以直接读取Intel CPU上的程序计数器(即没有"技巧")吗?



1> Cody Brociou..:

不,EIP/IP无法直接访问,但在位置相关的代码中,它是一个链接时间常量,因此您可以使用附近(或远程)符号作为立即数.

   mov eax, nearby_label    ; in position-dependent code
nearby_label:

要使位置无关的32位代码获得EIP或IP:

        call _here
_here:  pop eax
; eax now holds the PC.

在比Pentium Pro(或可能是PIII)更新的CPU上,call rel32rel32 = 0是特殊的,不会影响返回地址预测器堆栈.因此,这在现代x86上既高效又紧凑,是clang用于32位位置无关代码的.

在旧的32位Pentium Pro CPU上,这会使调用/返回预测器堆栈失衡,因此更喜欢调用实际返回的函数,以避免ret在父函数中最多15个左右的指令错误预测.(除非你不会返回,或者很少这样做无关紧要.)但是,返回地址预测器堆栈将会恢复.

get_retaddr_ppro:
    mov  eax, [esp]
    ret                ; keeps the return-address predictor stack balanced
                       ; even on CPUs where  call +0 isn't a no-op.

在x86-64模式下,可以使用RIP相关直接读取RIPlea.

default rel           ; NASM directive: use RIP-relative by default

lea  rax, [_here]     ; RIP + 0
_here:

MASM或GNU .intel_syntax:lea rax, [rip]

AT&T语法: lea 0(%rip), %rax


这段代码实际上搞砸了返回值分支预测并减慢了很多.我会尝试为此找到参考...
Re:_这个代码实际搞砸了返回值分支预测...我会尝试找到这个参考... _ - 参考是"Intel 64-ia-32优化手册" - > 3.4.1.4内联,调用和返回 - >"_返回地址堆栈机制增强了静态和动态预测器,专门针对调用和返回进行优化.它包含16个条目,足以覆盖大多数程序的调用深度....启用使用返回堆栈机制,调用和返回必须成对匹配_"
不知道为什么这是TrayMan答案的公认答案.TrayMan的版本没有意想不到的副作用,而且更短.

2> TrayMan..:

如果您需要特定指令的地址,通常这样的方法就可以了:

thisone: 
   mov (e)ax,thisone

(注意:在某些汇编程序中,这可能做错了,并从[thisone]中读取一个单词,但通常会有一些语法让汇编程序做正确的事情.)

如果您的代码静态加载到特定地址,汇编程序已经知道(如果您告诉它正确的起始地址)所有指令的绝对地址.动态加载的代码,例如作为任何现代操作系统上的应用程序的一部分,将通过动态链接器完成的地址重定位获得正确的地址(假设汇编器足够智能以生成重定位表,它们通常是这样).



3> matja..:

在x86-64上你可以这样做:

lea rax,[rip] (48 8d 05 00 00 00 00)



4> Adam Rosenfi..:

没有指令直接读取x86上的指令指针(EIP).您可以使用一个内联汇编来获取当前指令的地址:

// GCC inline assembler; for MSVC, syntax is different
uint32_t eip;
__asm__ __volatile__("movl $., %0", : "=r"(eip));

.汇编指令获取与由汇编当前指令的地址取代.请注意,如果您在函数调用中包装上面的代码段,则每次都会获得相同的地址(在该函数内).如果你想要一个更实用的C函数,你可以使用一些非内联汇编:

// In a C header file:
uint32_t get_eip(void);

// In a separate assembly (.S) file:
.globl _get_eip
_get_eip:
    mov 0(%esp), %eax
    ret

这意味着每次要获取指令指针时,由于需要额外的函数调用,效率会稍微降低.请注意,这样做不会破坏返回地址堆栈(RAS).返回地址堆栈是处理器内部使用的单独的返回地址堆栈,以便于RET指令的分支目标预测.

每次有CALL指令时,当前EIP都会被推送到RAS,每次有RET指令时,都会弹出RAS,并将top值用作该指令的分支目标预测.如果你弄乱了RAS(比如没有将每个CALL与RET匹配,就像在Cody的解决方案中那样),你将会得到一大堆不必要的分支误预测,从而减慢你的程序速度.这种方法不会破坏RAS,因为它有一对匹配的CALL和RET指令.

推荐阅读
惬听风吟jyy_802
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有