如何使用gcc进行矢量化？

作者：手机用户2402851335 | 2023-09-01 13:50

如何解决《如何使用gcc进行矢量化？》经验，为你挑选了2个好方法。

gcc编译器的v4系列可以在一些现代CPU上使用SIMD处理器自动矢量化循环,例如AMD Athlon或Intel Pentium/Core芯片.这是怎么做到的？

1> casualcoder..：

原始页面提供了有关使gcc自动向量化循环的详细信息,包括以下几个示例:

http://gcc.gnu.org/projects/tree-ssa/vectorization.html

虽然示例很棒,但事实证明,使用最新GCC调用这些选项的语法似乎有所改变,现在看:

https://gcc.gnu.org/onlinedocs/gcc/Developer-Options.html#index-fopt-info

总之,以下选项适用于带有SSE2的x86芯片,给出了已经向量化的循环日志:

gcc -O2 -ftree-vectorize -msse2 -ftree-vectorizer-verbose=5

注意-msse也是一种可能性,但它只使用浮点数而不是双精度数或整数来向量化循环.

2> Ganesh Gopal..：

有一个gimple(GCC的中级代表)通过pass_vectorize.此过程将启用gimple级别的自动矢量化.

要启用自动向量化(GCC V4.4.0),我们需要执行以下步骤:

根据目标体系结构提及向量中的单词数.这可以通过定义宏来完成UNITS_PER_SIMD_WORD.

可能需要在单独的文件中定义可能的矢量模式-modes.def.此文件必须驻留在包含计算机描述的其他文件所在的目录中.(根据配置脚本.如果您可以更改脚本,则可以将文件放在您希望它所在的任何目录中).

根据目标体系结构考虑进行矢量化的模式.比如,4个单词将构成一个向量,或者8个半字将构成一个向量或两个双字将构成一个向量.有关详细信息需要在-modes.def文件中提及.例如:

VECTOR_MODES (INT, 8);     /*       V8QI V4HI V2SI /

VECTOR_MODES (INT, 16);    / V16QI V8HI V4SI V2DI /

VECTOR_MODES (FLOAT, 8);   /            V4HF V2SF */

建立端口.可以使用命令行选项启用矢量化-O2 -ftree-vectorize.

推荐阅读

程序员
Laravel 5 mongo DB的倍增列的Eloquent总和

如何解决《Laravel5mongoDB的倍增列的Eloquent总和》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python argparse类似帮助的选项

如何解决《Pythonargparse类似帮助的选项》经验，为你挑选了1个好方法。 ... [详细]
程序员
将4个整数打包成一个[10,10,10,2]整数

如何解决《将4个整数打包成一个[10,10,10,2]整数》经验，为你挑选了1个好方法。 ... [详细]
程序员
docker构建并发布插件使用情况

如何解决《docker构建并发布插件使用情况》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular 2 Promises还是RxJs？

如何解决《Angular2Promises还是RxJs？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Swift中混淆强引用循环的例子

如何解决《在Swift中混淆强引用循环的例子》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何计算回调？

如何解决《如何计算回调？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何排除在ASP.NET Core中发布的文件？

如何解决《如何排除在ASP.NETCore中发布的文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当未定义属性时,Angularjs Filter无法正常工作

如何解决《当未定义属性时,AngularjsFilter无法正常工作》经验，为你挑选了0个好方法。 ... [详细]
程序员
android:将字节转换为dex时出错

如何解决《android:将字节转换为dex时出错》经验，为你挑选了8个好方法。 ... [详细]
程序员
R:更简单的方法将矩阵列表中的0更改为NA？

如何解决《R:更简单的方法将矩阵列表中的0更改为NA？》经验，为你挑选了1个好方法。 ... [详细]
程序员
不推荐使用的SVG pathSegList的替代方案

如何解决《不推荐使用的SVGpathSegList的替代方案》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法识别的Content-Security-Policy指令'script-src：'

如何解决《无法识别的Content-Security-Policy指令'script-src：'》经验，为你挑选了1个好方法。 ... [详细]
程序员
与DDNAME相关的PDS成员列表

如何解决《与DDNAME相关的PDS成员列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
两个索引上的MERGE JOIN仍导致SORT？

如何解决《两个索引上的MERGEJOIN仍导致SORT？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为每个终端加载.bash_profile

如何解决《为每个终端加载.bash_profile》经验，为你挑选了1个好方法。 ... [详细]
程序员
Webpack:无法解析模块'file-loader'

如何解决《Webpack:无法解析模块'file-loader'》经验，为你挑选了1个好方法。 ... [详细]
程序员
问题删除NavigationView菜单项选择的颜色？

如何解决《问题删除NavigationView菜单项选择的颜色？》经验，为你挑选了4个好方法。 ... [详细]
程序员
seo工具包-robots.txt规则不允许请求

如何解决《seo工具包-robots.txt规则不允许请求》经验，为你挑选了0个好方法。 ... [详细]
程序员
交易ID设置正确,但稍后仅显示提交

如何解决《交易ID设置正确,但稍后仅显示提交》经验，为你挑选了0个好方法。 ... [详细]

手机用户2402851335

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章