众所周知,一些没有非平凡复制的小结构,没有非平凡的dtor在寄存器中传递.
引用ARM程序调用标准:
大于32位的基本类型可以作为参数传递给函数调用,或者作为函数调用的结果返回.当这些类型在核心寄存器中时,以下规则适用:双字大小类型在两个连续寄存器中传递(例如,r0和r1,或r2和r3).寄存器的内容就好像该值是通过单个LDM指令从存储器表示加载的.
事实上,我可以轻松地用铿锵声证实这一点.然而,gcc为这样一个简单的代码片段发出了大量的内存加载和存储:
struct Trivial { int i1; int i2; }; int foo(Trivial t) { return t.i1 + t.i2; }
$ clang++ arm.cpp -O2 -mabi=aapcs -c -S && cat arm.s add r0, r0, r1 bx lr
$ g++ arm.cpp -O2 -mabi=aapcs -c -S && cat arm.s sub sp, sp, #8 add r3, sp, #8 stmdb r3, {r0, r1} ldmia sp, {r0, r3} add r0, r0, r3 add sp, sp, #8 bx lr
我正在使用由ArchlinuxARM发行版提供的gcc和clang,在raspberry pi 2(gcc 5.2)上运行,但我也用基于gcc的交叉编译器再现它.