代码很简单.
int foo(int a, int b, int c, int d, int e, int f, int g) { int r = (1 << a) | (1 << b) | (1 << c) | (1 << d) | (1 << e ) | (1 << f) | (1 << g); return r; }
假设所有参数都不大于30.
它似乎是一个非常原始的函数,但在使用"-Ofast"标志进行编译后,仍然需要28条指令来计算r.
是否有替代代码可以使这些按位运算更快?
28条指令相当快.考虑一下你在这做什么.你有:
7班班次
6 OR操作
1个内存分配操作
这已经需要至少14条指令.现在还有其他必要的指令,例如存储中间结果和将操作数加载到寄存器中.
如果要进行更深入的分析,请发布装配输出.
编辑:现在可以优化您的算法.
你可以通过牺牲一些内存来获得更快的速度.预先计算以32位值设置的每个可能位的值,例如:int bit2value[32]={1,2,4,8,16,32,64,...};
在您的函数中而不是执行移位操作,您可以通过查找预先计算的映射来替换它们:int r = bit2value[a] | bit2value[b] | bit2value[c]...;
理论上可以节省对某些中间值的需要存储操作.