1赞

C++ 11与OpenMP结合使用会产生较慢的可执行文件

作者：手机用户2402851335 | 2023-09-09 14:24

如何解决《C++11与OpenMP结合使用会产生较慢的可执行文件》经验，为你挑选了2个好方法。

我正在尝试学习OpenMP,并希望使用OpenMP学习加速.为此,我写了以下小程序:

#include 
#include 

int main() {
    static const unsigned int testDataSize = 1 << 28;

    std::vector a (testDataSize), b (testDataSize);

    for (int i = 0; i < testDataSize; ++i) {
        a [i] = static_cast (23 ^ i) / 1000.0;
    }
    b.resize(testDataSize);

    #pragma omp parallel for
    for (int i = 0; i < testDataSize; ++i) {
        b [i] = std::pow(a[i], 3) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 5) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 7) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 9) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 11) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 13) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 15) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 17) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 19) * std::exp(-a[i] * a[i]);
        b [i] += std::pow(a[i], 21) * std::exp(-a[i] * a[i]);
    }

    return 0;
}



我使用或不使用-std = c ++ 11指令编译了上面的代码.我注意到当我使用-std = c ++ 11指令时,我的代码运行速度大约慢了8倍,因为没有使用它.我在Linux Debian系统上使用-O3和gcc版本4.9.2.此外,当我在不使用OpenMP的情况下比较执行时间时,我注意到速度差异.因此,在我看来,-std = c ++ 11存在问题,而不是OpenMP存在问题.

详细地说,我获得了以下执行时间(使用Linux time命令测量)

使用OpenMP和-std = c ++ 11编译: 35.262s

仅使用OpenMP编译: 5.875s

仅使用-std = c ++ 11: 2m12进行编译

没有OpenMP的编译和-std = c ++ 11: 23.757s

使用-std = c ++ 11时执行时间慢得多的原因是什么？

非常感谢任何帮助或建议!



在我的拙见中,我已经标记了最好的答案.在oLen的回答的后续内容中,我已经制作了自己的pow(double,int)函数,如下所示:

double my_pow(double base, int exp) {
    double result = 1.0;

    while (exp) {
        if (exp & 1)
            result *= base;
        exp >>= 1;
        base *= base;
    }

    return result;
}


我不确定这是否是计算某个基数的整数幂的最有效方法,但是使用此函数时,无论使用或不使用std = c ++ 11进行编译,我在计算效率方面都得到完全相同的结果与oLen的回答.


1> oLen..：
原因是没有-std = c ++ 11的版本使用std::pow(double,int),显然在C++ 11中不可用,并且速度比std::pow(double,double).如果用双打(3.0,5.0等)替换整数(3,5等),您将获得相同的速度.

编辑: 
这是我的时间与g ++版本4.8.4:

原始版本:
 
-O3 -fopenmp:10.678 s
 
-O3 -fopenmp -std = c ++ 11:36.994 s 

在整数后添加".0": -
 
O3 -fopenmp :36.679 s
 
-O3 -fopenmp -std = c ++ 11:36.938 s  

        

2> Ben Voigt..：
除了函数重载选择问题@oLen指出,你有错误的共享,这会损害并行性.不要在每个语句中访问数组成员,它在与其他线程中被修改的元素直接相邻的内存中,这会导致缓存一致性算法的颠簸.而是将结果累积到一个临时的,只写一次结果数组:

for (int i = 0; i < testDataSize; ++i) {
    double accum = std::pow(a[i], 3) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 5) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 7) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 9) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 11) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 13) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 15) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 17) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 19) * std::exp(-a[i] * a[i]);
    accum += std::pow(a[i], 21) * std::exp(-a[i] * a[i]);
    b[i] = accum;
}


就此而言,std::exp(-a[i] * a[i])只调用一次并保存结果应该有助于单线程情况,因为编译器很难证明这个公共子表达式可以被优化.最重要的是,影响整个计算的因素:

for (int i = 0; i < testDataSize; ++i) {
    double accum = std::pow(a[i], 3);
    accum += std::pow(a[i], 5);
    accum += std::pow(a[i], 7);
    accum += std::pow(a[i], 9);
    accum += std::pow(a[i], 11);
    accum += std::pow(a[i], 13);
    accum += std::pow(a[i], 15);
    accum += std::pow(a[i], 17);
    accum += std::pow(a[i], 19);
    accum += std::pow(a[i], 21);
    b[i] = accum * std::exp(-a[i] * a[i]);
}

        
@erip:`a [i]`只是被读取而不是被写入,因此错误共享不会导致问题(所有内核都可以将缓存行置于状态`S`  - 共享,只读)



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        在"if"中遇到"return"时不返回值的方法
                    

                    
                                                
                        如何解决《在"if"中遇到"return"时不返回值的方法》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        NoReverseMatch Django教程1.8第4章
                    

                    
                                                
                        如何解决《NoReverseMatchDjango教程1.8第4章》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在按钮内居中对齐离子图标？
                    

                    
                                                
                            
                        
                                                
                        如何解决《如何在按钮内居中对齐离子图标？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        将大量自定义数据添加到jpg图像文件中
                    

                    
                                                
                        如何解决《将大量自定义数据添加到jpg图像文件中》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Java Server包装器（tanuki）-启动失败：等待JVM发出的信号超时
                    

                    
                                                
                        如何解决《JavaServer包装器（tanuki）-启动失败：等待JVM发出的信号超时》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        特定键的映射中的值的总和
                    

                    
                                                
                        如何解决《特定键的映射中的值的总和》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        像Lmax Disruptor一样可以批量观察
                    

                    
                                                
                        如何解决《像LmaxDisruptor一样可以批量观察》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        woocommerce webhooks没有解雇
                    

                    
                                                
                        如何解决《woocommercewebhooks没有解雇》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        while循环使用嵌套的if语句--C
                    

                    
                                                
                        如何解决《while循环使用嵌套的if语句--C》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        IPython Notebook：在下一步之前“实时”显示循环图像
                    

                    
                                                
                        如何解决《IPythonNotebook：在下一步之前“实时”显示循环图像》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Cython中的并行性不起作用
                    

                    
                                                
                        如何解决《Cython中的并行性不起作用》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        C＃错误CS1061：类型“ System.Collections.Generic.List &lt;int&gt;”不包含“长度”的定义
                    

                    
                                                
                        如何解决《C＃错误CS1061：类型“System.Collections.Generic.List&lt;int&gt;”不包含“长度”的定义》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Gstreamer:为什么在显示某些过滤器之前我需要一个视频转换？
                    

                    
                                                
                            
                        
                                                
                        如何解决《Gstreamer:为什么在显示某些过滤器之前我需要一个视频转换？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Reactive Banana 1.0.0  -  MomentIO()Monad中的单元测试
                    

                    
                                                
                        如何解决《ReactiveBanana1.0.0-MomentIO()Monad中的单元测试》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        等到回调
                    

                    
                                                
                        如何解决《等到回调》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        寻找设计模式以减少虚拟方法过载
                    

                    
                                                
                        如何解决《寻找设计模式以减少虚拟方法过载》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        并行聚合集合
                    

                    
                                                
                        如何解决《并行聚合集合》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        有没有更好的方法来填充多个下拉列表？
                    

                    
                                                
                        如何解决《有没有更好的方法来填充多个下拉列表？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        是否可以将std :: array移动到std :: vector中？
                    

                    
                                                
                        如何解决《是否可以将std::array移动到std::vector中？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在div内部进行内联CKEditor滚动？
                    

                    
                                                
                        如何解决《如何在div内部进行内联CKEditor滚动？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                手机用户2402851335            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1可能错误调用ArrayList索引？
                
                                
                    2什么是bash中的unix历史命令"!$"？
                
                                
                    3使用robomongo在json文档中搜索
                
                                
                    4条件检查由按位运算符替换
                
                                
                    5窃取Parallel Computing Toolbox的工作
                
                                
                    6使用按钮启动此计时器
                
                                
                    7如何使用asyncio添加连接超时？
                
                                
                    8添加新处理程序以运行python tornado服务器
                
                                
                    9字符串数组到java中的Array List问题
                
                                
                    10gradle中'all'和'each'之间有什么区别？
                
                                
                    11哪一个应该使用,语义标签或表示？
                
                                
                    12Botan编译错误VS2015
                
                                
                    13使用DOMElements的THREE.js SphereGeometry Panorama热点
                
                                
                    14将xml字符串反序列化为对象
                
                                
                    15NodeJS x-ray web-scraper:如何关注链接并从子页面获取内容
                
                                
                    16永久添加蜂巢罐
                
                                
                    17将字符串连接到数据库中的现有字符串
                
                                
                    18使用中间变量而不是array.length会使你的for循环变得更快吗？
                
                                
                    19增强了对新跟踪器的电子商务分析跟踪
                
                                
                    20从二叉树中随机选择一个节点