8赞

写入数组时,最后一个线程的执行速度比第一个线程慢

作者：大大炮 | 2023-09-08 11:37

如何解决《写入数组时,最后一个线程的执行速度比第一个线程慢》经验，为你挑选了1个好方法。

我正在尝试优化Mandelbrot集生成器,问题是我试图通过使用_beginthread()函数使其成为多线程.我正在解决的计算问题是在2D平面上运行一个函数,我试图同时运行大约8个线程,每个线程计算2D阵列的一部分(行),但我注意到第一个线程完成后,完成的最后一个线程完成得快得多.这是输出:

Starting thread 0
Starting thread 1
Starting thread 2
Starting thread 3
Starting thread 4
Starting thread 5
Starting thread 6
Starting thread 7
Ending thread   0 - Time taken: 1062ms
Ending thread   7 - Time taken: 1031ms
Ending thread   1 - Time taken: 1610ms
Ending thread   6 - Time taken: 1563ms
Ending thread   2 - Time taken: 10265ms
Ending thread   5 - Time taken: 10219ms
Ending thread   4 - Time taken: 31609ms
Ending thread   3 - Time taken: 31641ms

每个线程都有相同的事情要做,但是有不同的数字,我不明白为什么我得到那些时间这就是我多线程这个:

#define HEIGHT 4000
#define WIDTH 4000
#define MAX_THREADS 8
int const maxIterations = 150;

int bitmap[HEIGHT][WIDTH];
bool finishedThreads[MAX_THREADS];

void renderRow(void * arg) {
    int startTime = GetTickCount();
    int * threadNumPinter = (int*)arg;
    int threadNum = *threadNumPinter;
    int startRow = threadNum * (HEIGHT / MAX_THREADS);
    for (int y = startRow; y <= startRow+(HEIGHT / MAX_THREADS); y++) {
        for (int x = 0; x <= WIDTH; x++) {
            double xx = (((double)x / (double)WIDTH) * 4.0) - 2.0;
            double yy = (((double)y / (double)HEIGHT) * 4.0) - 2.0;
            bitmap[x][y] = isPartOfSet(xx, yy) * 10;
        }
    }
    threadNum = startRow / (HEIGHT / MAX_THREADS);
    finishedThreads[threadNum] = true;
    cout << "Ending thread " << threadNum << " - Time: " << GetTickCount() - startTime << "ms" << endl;
    _endthread();
}


int main() {
    int startTime = GetTickCount();
    HANDLE hThread;
    HANDLE ghEvents[2];
    DWORD dwThreadID;
    int rowsPerThread = HEIGHT / MAX_THREADS;
    int arg;
    int threadIds[MAX_THREADS];
    for (int i = 0; i < MAX_THREADS; i ++) {
        threadIds[i] = i;
        cout << "Starting thread " << i << endl;
        arg = i;
        _beginthread(renderRow, 0, &threadIds[i]);
        Sleep(10);
    }
    bool done = true;//Wait for all threads to finish
    while (1) {
        for (int i = 0; i < MAX_THREADS; i++){
            if (finishedThreads[i] == false)done = false;
        }
        if (done == true) break;
        else done = true;
        Sleep(20);
    }
    saveBitmap(WIDTH, HEIGHT);
    cout << endl << "Rendered in " << double(GetTickCount() - startTime) / 1000.0 << " seconds" << endl;
    cin.get();
    main();
}

显然有更多的代码,但我不认为它对这个问题有任何影响.我在这做错了什么？我在CUDA上遇到了同样的问题,所以我相信这是我实现多线程的方式.谢谢.

1> ThorngardSO..：

在我的回答中,我既不会解决线程/同步问题或缓存的想法 - 请参阅其他答案/评论.

我的观点与众不同:你写的是"每个主题都有相同的事情要做,但数字不同".如果我对mandelbrot集合的记忆对我isPartOfSet有用,那么确定一个点是否是该集合的成员(IOW你的函数的实现,你没有提供)是一个迭代过程.有些要点很快就会"拯救",有些要点并没有,你必须继续迭代,直到你预定义的最大数量为止.

所以我所说的是:通过"每个线程一个大块"的并行化,你的线程可能会花费大量不同的时间.

这类问题的解决方案是将问题(即图像)分成较小的部分,其大小不依赖于线程的数量,但应根据经验选择a)不要太大以防止不平等的工作分布(如你的巨大块的例子)和b)不会导致过多的组织开销.

所以现在,你有M个线程和N个工作块(N >> M),你需要一个实现让每个线程像一个循环一样工作

while (worktodo) fetch_a_chunk_of_work_and_do_it ()

如何实现这种生产者/消费者模式 - 我将留给其他人描述(或者你为google :-))

推荐阅读

程序员
如何告诉析构函数不被调用？

如何解决《如何告诉析构函数不被调用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在制作Swift Command line工具时使用carthage库？

如何解决《如何在制作SwiftCommandline工具时使用carthage库？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Tesseract在openCV Mat上失败(安装问题？)

如何解决《Tesseract在openCVMat上失败(安装问题？)》经验，为你挑选了1个好方法。 ... [详细]
程序员
声明具有相同类型的多个TypeScript变量

如何解决《声明具有相同类型的多个TypeScript变量》经验，为你挑选了2个好方法。 ... [详细]
程序员
基于相同的索引连接两个列表

如何解决《基于相同的索引连接两个列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
将行复制粘贴到Excel电子表格中,而不覆盖下面的现有内容

如何解决《将行复制粘贴到Excel电子表格中,而不覆盖下面的现有内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
R中for循环的矢量化

如何解决《R中for循环的矢量化》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Web worker预加载图像是否有优势？

如何解决《使用Webworker预加载图像是否有优势？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Python Opencv Image(numpy数组)转换为PyQt QPixmap图像

如何解决《将PythonOpencvImage(numpy数组)转换为PyQtQPixmap图像》经验，为你挑选了2个好方法。 ... [详细]
程序员
对于带数组的循环不起作用

如何解决《对于带数组的循环不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++字符串.为什么答案显示字符串"dog"大于"cat",那么"cat"大于"dog"？

如何解决《C++字符串.为什么答案显示字符串"dog"大于"cat",那么"cat"大于"dog"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在给定索引处添加值而不删除

如何解决《在给定索引处添加值而不删除》经验，为你挑选了1个好方法。 ... [详细]
程序员
jsPDF无法设置字体系列

如何解决《jsPDF无法设置字体系列》经验，为你挑选了1个好方法。 ... [详细]
程序员
从列表到data.table与hash的R快速单项查找

如何解决《从列表到data.table与hash的R快速单项查找》经验，为你挑选了2个好方法。 ... [详细]
程序员
无法在Windows上安装python lxml(和libxml2)

如何解决《无法在Windows上安装pythonlxml(和libxml2)》经验，为你挑选了1个好方法。 ... [详细]
程序员
在基本模板中向<body>添加类的DRY方法？

如何解决《在基本模板中向<body>添加类的DRY方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从整数序列构造String实例？

如何解决《如何从整数序列构造String实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
GraphQL Schema处理混合类型

如何解决《GraphQLSchema处理混合类型》经验，为你挑选了0个好方法。 ... [详细]
程序员
日期上的dplyr过滤器

如何解决《日期上的dplyr过滤器》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何将Azure Search的@ search.score作为自定义$ orderby子句的一部分

如何解决《如何将AzureSearch的@search.score作为自定义$orderby子句的一部分》经验，为你挑选了1个好方法。 ... [详细]

大大炮

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章