如何帮助gcc矢量化C代码

作者：雯颜哥_135 | 2023-09-07 12:50

如何解决《如何帮助gcc矢量化C代码》经验，为你挑选了0个好方法。

我有以下C代码.第一部分只是从标准中读入一个复数的矩阵,称为矩阵M.有趣的部分是第二部分.

#include 
#include 
#include 
#include 
#include 

int main() {
    int n, m, c, d;
    float re, im;

    scanf("%d %d", &n, &m);
    assert(n==m);
    complex float M[n][n];

    for(c=0; c

我编译gcc -fopt-info-vec-all -O3  -ffast-math -march=bdver2 permanent-in-c.c -lm.这向我解释了为什么几乎没有循环被矢量化.  

性能最重要的部分是47-50行,它们是:

for (i = 0; i < n; i++) {
    v[i] -= 2.*delta[j]*M[j][i];
    prod *= v[i];
}


gcc告诉我:

permanent-in-c.c:47:7: note: reduction used in loop.
permanent-in-c.c:47:7: note: Unknown def-use cycle pattern.
permanent-in-c.c:47:7: note: reduction used in loop.
permanent-in-c.c:47:7: note: Unknown def-use cycle pattern.
permanent-in-c.c:47:7: note: Unsupported pattern.
permanent-in-c.c:47:7: note: not vectorized: unsupported use in stmt.
permanent-in-c.c:47:7: note: unexpected pattern.
[...]
permanent-in-c.c:48:26: note: SLP: step doesn't divide the vector-size.
permanent-in-c.c:48:26: note: Unknown alignment for access: IMAGPART_EXPR <*M.4_40[j_202]{lb: 0 sz: pretmp_291 * 4}[i_200]>
permanent-in-c.c:48:26: note: SLP: step doesn't divide the vector-size.
permanent-in-c.c:48:26: note: Unknown alignment for access: REALPART_EXPR <*M.4_40[j_202]{lb: 0 sz: pretmp_291 * 4}[i_200]>
[...]
permanent-in-c.c:48:26: note: Build SLP failed: unrolling required in basic block SLP
permanent-in-c.c:48:26: note: Failed to SLP the basic block.
permanent-in-c.c:48:26: note: not vectorized: failed to find SLP opportunities in basic block.



  如何解决阻止此部分被矢量化的问题？




奇怪的是这部分是矢量化的,但我不确定为什么:

for (j = 0; j 



gcc -fopt-info-vec-all -O3 -ffast-math -march = bdver2 permanent-in-cc -lm的完整输出位于https://bpaste.net/show/18ebc3d66a53.

推荐阅读

程序员
使用Beautiful Soup时,无需任何猜测即可正确检测编码

如何解决《使用BeautifulSoup时,无需任何猜测即可正确检测编码》经验，为你挑选了0个好方法。 ... [详细]
程序员
简单的html dom解析器返回错误500

如何解决《简单的htmldom解析器返回错误500》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除所有空格除了捕获组中包含的内容

如何解决《删除所有空格除了捕获组中包含的内容》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么这不会在内联中工作？

如何解决《为什么这不会在内联中工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Swift Package Manager时,如何生成用于开发的Xcode项目文件

如何解决《使用SwiftPackageManager时,如何生成用于开发的Xcode项目文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何按字母顺序对字符串的ArrayList进行排序？

如何解决《如何按字母顺序对字符串的ArrayList进行排序？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何对键进行排序:按列表中的值列出字典？

如何解决《如何对键进行排序:按列表中的值列出字典？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么有些字符不能在Python的IDLE中输入？

如何解决《为什么有些字符不能在Python的IDLE中输入？》经验，为你挑选了1个好方法。 ... [详细]
程序员
计算长数中的Set位数

如何解决《计算长数中的Set位数》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel说Auth guard []没有定义

如何解决《Laravel说Authguard[]没有定义》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Swift for Linux中读取用户输入或stdin？

如何解决《如何在SwiftforLinux中读取用户输入或stdin？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在工具栏下设置导航抽屉

如何解决《在工具栏下设置导航抽屉》经验，为你挑选了1个好方法。 ... [详细]
程序员
UICollectionView每行显示3个项目

如何解决《UICollectionView每行显示3个项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
groovy if语句与变量中的正则表达式

如何解决《groovyif语句与变量中的正则表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用fetch时拒绝承诺

如何解决《使用fetch时拒绝承诺》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Sails.js中使用客户端模板

如何解决《在Sails.js中使用客户端模板》经验，为你挑选了1个好方法。 ... [详细]
程序员
warpPerspective和perspectiveTransform之间有所不同

如何解决《warpPerspective和perspectiveTransform之间有所不同》经验，为你挑选了1个好方法。 ... [详细]
程序员
Unity WebGL的EditorUtility.OpenFilePanel(运行时)

如何解决《UnityWebGL的EditorUtility.OpenFilePanel(运行时)》经验，为你挑选了1个好方法。 ... [详细]
程序员
Webpack extract-text-webpack-plugin和css-loader缩小

如何解决《Webpackextract-text-webpack-plugin和css-loader缩小》经验，为你挑选了1个好方法。 ... [详细]
程序员
Tensorflow卷积神经网络 - 使用小数据集进行训练,对图像应用随机变化

如何解决《Tensorflow卷积神经网络-使用小数据集进行训练,对图像应用随机变化》经验，为你挑选了0个好方法。 ... [详细]

雯颜哥_135

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章