11赞

直接读程序计数器

作者：惬听风吟jyy_802 | 2023-08-30 00:41

如何解决《直接读程序计数器》经验，为你挑选了4个好方法。

在内核模式或其他模式下,可以直接读取Intel CPU上的程序计数器(即没有"技巧")吗？

1> Cody Brociou..：

不,EIP/IP无法直接访问,但在位置相关的代码中,它是一个链接时间常量,因此您可以使用附近(或远程)符号作为立即数.

   mov eax, nearby_label    ; in position-dependent code
nearby_label:

要使位置无关的32位代码获得EIP或IP:

        call _here
_here:  pop eax
; eax now holds the PC.

在比Pentium Pro(或可能是PIII)更新的CPU上,call rel32rel32 = 0是特殊的,不会影响返回地址预测器堆栈.因此,这在现代x86上既高效又紧凑,是clang用于32位位置无关代码的.

在旧的32位Pentium Pro CPU上,这会使调用/返回预测器堆栈失衡,因此更喜欢调用实际返回的函数,以避免ret在父函数中最多15个左右的指令错误预测.(除非你不会返回,或者很少这样做无关紧要.)但是,返回地址预测器堆栈将会恢复.

get_retaddr_ppro:
    mov  eax, [esp]
    ret                ; keeps the return-address predictor stack balanced
                       ; even on CPUs where  call +0 isn't a no-op.

在x86-64模式下,可以使用RIP相关直接读取RIPlea.

default rel           ; NASM directive: use RIP-relative by default

lea  rax, [_here]     ; RIP + 0
_here:

MASM或GNU .intel_syntax:lea rax, [rip]

AT&T语法: lea 0(%rip), %rax

这段代码实际上搞砸了返回值分支预测并减慢了很多.我会尝试为此找到参考...

Re:_这个代码实际搞砸了返回值分支预测...我会尝试找到这个参考... _ - 参考是"Intel 64-ia-32优化手册" - > 3.4.1.4内联,调用和返回 - >"_返回地址堆栈机制增强了静态和动态预测器,专门针对调用和返回进行优化.它包含16个条目,足以覆盖大多数程序的调用深度....启用使用返回堆栈机制,调用和返回必须成对匹配_"

不知道为什么这是TrayMan答案的公认答案.TrayMan的版本没有意想不到的副作用,而且更短.

2> TrayMan..：

如果您需要特定指令的地址,通常这样的方法就可以了:

thisone: 
   mov (e)ax,thisone

(注意:在某些汇编程序中,这可能做错了,并从[thisone]中读取一个单词,但通常会有一些语法让汇编程序做正确的事情.)

如果您的代码静态加载到特定地址,汇编程序已经知道(如果您告诉它正确的起始地址)所有指令的绝对地址.动态加载的代码,例如作为任何现代操作系统上的应用程序的一部分,将通过动态链接器完成的地址重定位获得正确的地址(假设汇编器足够智能以生成重定位表,它们通常是这样).

3> matja..：

在x86-64上你可以这样做:

lea rax,[rip] (48 8d 05 00 00 00 00)

4> Adam Rosenfi..：

没有指令直接读取x86上的指令指针(EIP).您可以使用一个内联汇编来获取当前指令的地址:

// GCC inline assembler; for MSVC, syntax is different
uint32_t eip;
__asm__ __volatile__("movl $., %0", : "=r"(eip));

该.汇编指令获取与由汇编当前指令的地址取代.请注意,如果您在函数调用中包装上面的代码段,则每次都会获得相同的地址(在该函数内).如果你想要一个更实用的C函数,你可以使用一些非内联汇编:

// In a C header file:
uint32_t get_eip(void);

// In a separate assembly (.S) file:
.globl _get_eip
_get_eip:
    mov 0(%esp), %eax
    ret

这意味着每次要获取指令指针时,由于需要额外的函数调用,效率会稍微降低.请注意,这样做不会破坏返回地址堆栈(RAS).返回地址堆栈是处理器内部使用的单独的返回地址堆栈,以便于RET指令的分支目标预测.

每次有CALL指令时,当前EIP都会被推送到RAS,每次有RET指令时,都会弹出RAS,并将top值用作该指令的分支目标预测.如果你弄乱了RAS(比如没有将每个CALL与RET匹配,就像在Cody的解决方案中那样),你将会得到一大堆不必要的分支误预测,从而减慢你的程序速度.这种方法不会破坏RAS,因为它有一对匹配的CALL和RET指令.

推荐阅读

程序员
如何动态转换为使用Swift 2.0在字符串中命名的Type？

如何解决《如何动态转换为使用Swift2.0在字符串中命名的Type？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Cycle.js HTTP在添加加载指示符后发送多个请求

如何解决《Cycle.jsHTTP在添加加载指示符后发送多个请求》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获取materializecss复选框以使用@ Html.CheckBoxFor？

如何解决《如何获取materializecss复选框以使用@Html.CheckBoxFor？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spark的累加器使我感到困惑。

如何解决《Spark的累加器使我感到困惑。》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否在html电子邮件模板中普遍支持span元素？

如何解决《是否在html电子邮件模板中普遍支持span元素？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在msgbox中输出超过最大字符数限制的方法？

如何解决《在msgbox中输出超过最大字符数限制的方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL FORMAT函数错误

如何解决《SQLFORMAT函数错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
excel vba冻结窗格没有选择

如何解决《excelvba冻结窗格没有选择》经验，为你挑选了1个好方法。 ... [详细]
程序员
Chrome无法呈现通过<img>标记引用的SVG - 链接vs嵌入

如何解决《Chrome无法呈现通过<img>标记引用的SVG-链接vs嵌入》经验，为你挑选了0个好方法。 ... [详细]
程序员
在MacOSX上fputs()的行为是不正常的

如何解决《在MacOSX上fputs()的行为是不正常的》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python matplotlib.pyplot饼图:如何删除左侧的标签？

如何解决《Pythonmatplotlib.pyplot饼图:如何删除左侧的标签？》经验，为你挑选了1个好方法。 ... [详细]
程序员
用css自动闪耀效果

如何解决《用css自动闪耀效果》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL Max(日期)没有group by

如何解决《SQLMax(日期)没有groupby》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用PHP和GD来解释字体冲突

如何解决《如何使用PHP和GD来解释字体冲突》经验，为你挑选了0个好方法。 ... [详细]
程序员
Clojure - 使用recur vs普通递归函数调用

如何解决《Clojure-使用recurvs普通递归函数调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在UWP/RT XAML中声明系统数据类型？

如何解决《如何在UWP/RTXAML中声明系统数据类型？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在正在运行的进程中给出其地址,在可执行文件中查找指令？

如何解决《在正在运行的进程中给出其地址,在可执行文件中查找指令？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将对象数组过滤为对象

如何解决《将对象数组过滤为对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
从承诺返回然后()

如何解决《从承诺返回然后()》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何在python中更改目录，以便在运行脚本后仍保留该目录？

如何解决《如何在python中更改目录，以便在运行脚本后仍保留该目录？》经验，为你挑选了0个好方法。 ... [详细]

惬听风吟jyy_802

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章