3赞

C++/VS2008:宏与内联函数的性能

作者：无名有名我无名_593 | 2023-06-29 05:06

如何解决《C++/VS2008:宏与内联函数的性能》经验，为你挑选了1个好方法。

所有,

我正在编写一些性能敏感的代码,包括一个可以执行大量交叉产品的3d矢量类.作为一名长期的C++程序员,我了解宏的弊端和内联函数的各种好处.我一直认为内联函数应该与宏的速度大致相同.然而,在性能测试宏与内联函数中,我发现了一个有趣的发现,我希望是因为我在某处犯了一个愚蠢的错误:我的函数的宏版本似乎是内联版本的8倍以上!

首先,一个简单的矢量类的荒谬修剪版本:

class Vector3d
{
public:
    double m_tX, m_tY, m_tZ;

    Vector3d() : m_tX(0), m_tY(0), m_tZ(0) {}
    Vector3d(const double &tX, const double &tY, const double &tZ):
        m_tX(tX), m_tY(tY), m_tZ(tZ) {}

    static inline void CrossAndAssign ( const Vector3d& cV1, const Vector3d& cV2, Vector3d& cV )
    {
        cV.m_tX = cV1.m_tY * cV2.m_tZ - cV1.m_tZ * cV2.m_tY;
        cV.m_tY = cV1.m_tZ * cV2.m_tX - cV1.m_tX * cV2.m_tZ;
        cV.m_tZ = cV1.m_tX * cV2.m_tY - cV1.m_tY * cV2.m_tX;
    }

#define FastVectorCrossAndAssign(cV1,cV2,cVOut) { \
    cVOut.m_tX = cV1.m_tY * cV2.m_tZ - cV1.m_tZ * cV2.m_tY; \
    cVOut.m_tY = cV1.m_tZ * cV2.m_tX - cV1.m_tX * cV2.m_tZ; \
    cVOut.m_tZ = cV1.m_tX * cV2.m_tY - cV1.m_tY * cV2.m_tX; }
};

这是我的示例基准测试代码:

Vector3d right; Vector3d forward(1.0, 2.2, 3.6); Vector3d up(3.2, 1.4, 23.6);



clock_t start = clock();
for (long l=0; l < 100000000; l++)
{
    Vector3d::CrossAndAssign(forward, up, right); // static inline version
}

clock_t end = clock();
std::cout << end - start << endl;


clock_t start2 = clock();
for (long l=0; l<100000000; l++)
{
    FastVectorCrossAndAssign(forward, up, right); // macro version
}
clock_t end2 = clock();

std::cout << end2 - start2 << endl;


    Vector3d right;
    Vector3d forward(1.0, 2.2, 3.6);
    Vector3d up(3.2, 1.4, 23.6);

class Vector3d
{
public:
    double m_tX, m_tY, m_tZ;

    Vector3d() : m_tX(0), m_tY(0), m_tZ(0) {}
    Vector3d(const double &tX, const double &tY, const double &tZ):
        m_tX(tX), m_tY(tY), m_tZ(tZ) {}

    static inline void CrossAndAssign ( const Vector3d& cV1, const Vector3d& cV2, Vector3d& cV )
    {
        cV.m_tX = cV1.m_tY * cV2.m_tZ - cV1.m_tZ * cV2.m_tY;
        cV.m_tY = cV1.m_tZ * cV2.m_tX - cV1.m_tX * cV2.m_tZ;
        cV.m_tZ = cV1.m_tX * cV2.m_tY - cV1.m_tY * cV2.m_tX;
    }

#define FastVectorCrossAndAssign(cV1,cV2,cVOut) { \
    cVOut.m_tX = cV1.m_tY * cV2.m_tZ - cV1.m_tZ * cV2.m_tY; \
    cVOut.m_tY = cV1.m_tZ * cV2.m_tX - cV1.m_tX * cV2.m_tZ; \
    cVOut.m_tZ = cV1.m_tX * cV2.m_tY - cV1.m_tY * cV2.m_tX; }
};

最终结果:完全关闭优化后,内联版本需要3200个刻度,宏版本500刻度...开启优化(/ O2,最大化速度和其他速度调整),我可以获得内联版本到1100蜱,这是更好,但仍然不一样.

所以我呼吁你们所有人:这是真的吗？我在某个地方犯过一个愚蠢的错误吗？或者内联函数真的这么慢 - 如果是这样,为什么呢？

1> Sjoerd..：

注意:发布此答案后,编辑原始问题以删除此问题.我会留下答案,因为它在几个层面上都很有启发性.

循环因他们所做的不同而不同!

如果我们手动扩展宏,我们得到:

for (long l=0; l<100000000; l++) 
    right.m_tX = forward.m_tY * up.m_tZ - forward.m_tZ * up.m_tY;
    right.m_tY = forward.m_tZ * up.m_tX - forward.m_tX * up.m_tZ;
    right.m_tZ = forward.m_tX * up.m_tY - forward.m_tY * up.m_tX;

注意大括号的缺席.所以编译器将其视为:

for (long l=0; l<100000000; l++)
{
    right.m_tX = forward.m_tY * up.m_tZ - forward.m_tZ * up.m_tY;
}
right.m_tY = forward.m_tZ * up.m_tX - forward.m_tX * up.m_tZ;
right.m_tZ = forward.m_tX * up.m_tY - forward.m_tY * up.m_tX;

这显然是为什么第二个循环如此快得多.

Udpate:这也是为什么宏是邪恶的一个很好的例子:)

推荐阅读

程序员
在opencv-python中检测星形

如何解决《在opencv-python中检测星形》经验，为你挑选了0个好方法。 ... [详细]
程序员
Amazon RDS中的lower_case_table_names设置

如何解决《AmazonRDS中的lower_case_table_names设置》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么出口/进口申报必须在2015年达到顶级水平？

如何解决《为什么出口/进口申报必须在2015年达到顶级水平？》经验，为你挑选了1个好方法。 ... [详细]
程序员
chrome webview中出现"不支持的ABI"错误

如何解决《chromewebview中出现"不支持的ABI"错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用$ rootscope显示和隐藏

如何解决《使用$rootscope显示和隐藏》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用python中的openpyxl读取存储在sharepoint位置的xlsx？

如何解决《使用python中的openpyxl读取存储在sharepoint位置的xlsx？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法使用python子进程模块使用*运行shell命令

如何解决《无法使用python子进程模块使用*运行shell命令》经验，为你挑选了1个好方法。 ... [详细]
程序员
熊猫改变了数据帧结构

如何解决《熊猫改变了数据帧结构》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Swift中执行一次代码只执行一次？

如何解决《如何在Swift中执行一次代码只执行一次？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用SharedElement在活动转换中崩溃

如何解决《使用SharedElement在活动转换中崩溃》经验，为你挑选了0个好方法。 ... [详细]
程序员
在数组上使用AsEnumerable()有什么用？

如何解决《在数组上使用AsEnumerable()有什么用？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Swift UI测试 - 用户通知系统警报

如何解决《SwiftUI测试-用户通知系统警报》经验，为你挑选了0个好方法。 ... [详细]
程序员
ActiveRecord :: NoDatabaseError FATAL:数据库"db/development.postgresql"不存在

如何解决《ActiveRecord::NoDatabaseErrorFATAL:数据库"db/development.postgresql"不存在》经验，为你挑选了1个好方法。 ... [详细]
程序员
Flink:如何使用命令行界面取消正确的作业？

如何解决《Flink:如何使用命令行界面取消正确的作业？》经验，为你挑选了1个好方法。 ... [详细]
程序员
React/Flux - 为什么我需要一个动作调度员？

如何解决《React/Flux-为什么我需要一个动作调度员？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在rails中使用x-www-form-urlencoded

如何解决《如何在rails中使用x-www-form-urlencoded》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在Android中使用Intent打开Linkedin个人资料

如何解决《无法在Android中使用Intent打开Linkedin个人资料》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否有原始的linux系统调用API/ABI文档

如何解决《是否有原始的linux系统调用API/ABI文档》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何通过pyspark以gzip格式保存spark RDD

如何解决《如何通过pyspark以gzip格式保存sparkRDD》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spock/Grails - Groovy:无法解析类grails.test.mixin.TestFor并且无法解析类spock.lang.Specification

如何解决《Spock/Grails-Groovy:无法解析类grails.test.mixin.TestFor并且无法解析类spock.lang.Specification》经验，为你挑选了0个好方法。 ... [详细]

无名有名我无名_593

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章