在Linux上,GCC/pthread并行代码比简单的单线程代码慢得多

作者：拾味湖 | 2023-09-11 12:45

如何解决《在Linux上,GCC/pthread并行代码比简单的单线程代码慢得多》经验，为你挑选了1个好方法。

我正在使用gcc(GCC)4.8.3 20140911在CentOS 7服务器上测试Linux上的pthread并行代码.

单线程版本很简单,它用于初始化10000*10000矩阵:

int main(int argc)
{
    int size = 10000;

    int * r = (int*)malloc(size * size * sizeof(int));
    for (int i=0; i

然后我想看看并行代码是否可以提高性能:

#include 
#include 
#include 

int size = 10000;

void *SetOdd(void *param) 
{
   printf("Enter odd\n"); 
   int * r      = (int*)param;
   for (int i=0; i

简单的代码运行大约0.8秒,而多线程版本运行大约10秒!!!!!!!

我在4核服务器上运行.但为什么多线程版本如此之慢？


1> P.P...：
rand()既不是线程安全也不是重入.所以你不能rand()在多线程应用程序中使用.

使用rand_r()替代这也是一个伪随机数发生器,是线程安全的.如果你在乎.使用rand_r()更短的执行时间结果我有2个内核(大约一半的时间作为单线程版本)系统上的代码.

在两个线程函数中,执行:

void *SetOdd(void *param)
{
   printf("Enter odd\n");
   unsigned int s = (unsigned int)time(0);

   int * r      = (int*)param;
   for (int i=0; i



更新:

虽然C和POSIX标准确实要求rand()是一个线程安全的函数,但glibc实现(在Linux上使用)实际上确实以线程安全的方式实现它.

如果我们看一下rand()的glibc实现,就会有一个锁:

 291   __libc_lock_lock (lock);
 292 
 293   (void) __random_r (&unsafe_state, &retval);
 294 
 295   __libc_lock_unlock (lock);
 296 


任何同步构造(互斥,条件变量等)都不利于性能,即代码中使用的此类构造的数量越少,性能就越好(当然,我们无法完全避免在多线程应用程序中确定它们). 

因此,只有一个线程可以实际访问随机数生成器,因为两个线程一直在争夺锁定.这解释了为什么rand()导致多线程代码性能不佳.

推荐阅读

程序员
如何读取CSV文件并分配给Eigen Matrix？

如何解决《如何读取CSV文件并分配给EigenMatrix？》经验，为你挑选了1个好方法。 ... [详细]
程序员
芹菜工作,但花不起作用

如何解决《芹菜工作,但花不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用javascript从图像中删除灰度css过滤器

如何解决《使用javascript从图像中删除灰度css过滤器》经验，为你挑选了1个好方法。 ... [详细]
程序员
球拍相当于/ dev/null？

如何解决《球拍相当于/dev/null？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel查询生成器 - 日期现在使用碳

如何解决《Laravel查询生成器-日期现在使用碳》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift中的全局变量和可选绑定

如何解决《Swift中的全局变量和可选绑定》经验，为你挑选了1个好方法。 ... [详细]
程序员
在O(1)中查找数组值大于x的第一个索引

如何解决《在O(1)中查找数组值大于x的第一个索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
在语法中(在Perl 6中)是什么意思？

如何解决《在语法中(在Perl6中)是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Racket脚本中调用`racket`

如何解决《在Racket脚本中调用`racket`》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用moment.js减去2次,然后减去几分钟

如何解决《如何用moment.js减去2次,然后减去几分钟》经验，为你挑选了1个好方法。 ... [详细]
程序员
Varnish Hashtwo/Xkey和Fastly的"代理键"是一样的吗？

如何解决《VarnishHashtwo/Xkey和Fastly的"代理键"是一样的吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Matplotlib 1.5使用axes.prop_cycle

如何解决《Matplotlib1.5使用axes.prop_cycle》经验，为你挑选了1个好方法。 ... [详细]
程序员
对象适合不影响图像

如何解决《对象适合不影响图像》经验，为你挑选了3个好方法。 ... [详细]
程序员
components由Swift中的多个分隔符分隔

如何解决《components由Swift中的多个分隔符分隔》经验，为你挑选了1个好方法。 ... [详细]
程序员
Stream.forEach是否遵循顺序流的遭遇顺序？

如何解决《Stream.forEach是否遵循顺序流的遭遇顺序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在TensorFlow中合并字符串张量

如何解决《在TensorFlow中合并字符串张量》经验，为你挑选了1个好方法。 ... [详细]
程序员
android检测测试的输出在哪里？

如何解决《android检测测试的输出在哪里？》经验，为你挑选了1个好方法。 ... [详细]
程序员
节点错误:"找不到模块'路由'"

如何解决《节点错误:"找不到模块'路由'"》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将swagger与我的快速应用程序集成

如何解决《如何将swagger与我的快速应用程序集成》经验，为你挑选了1个好方法。 ... [详细]
程序员
cv2.ml_KNearest对象没有属性find_nearest

如何解决《cv2.ml_KNearest对象没有属性find_nearest》经验，为你挑选了1个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章