14赞

使用clang / g ++时，__ m256i数组出现分段错误

作者：郑谊099_448 | 2023-09-09 12:56

如何解决《使用clang/g++时，__m256i数组出现分段错误》经验，为你挑选了0个好方法。

我正在尝试生成的数组，__m256i以在其他计算中重用。当我尝试执行此操作（即使使用最小的测试用例）时，也会遇到分段错误-但仅当代码是使用g ++或clang编译时。如果我使用Intel编译器（版本16.0）编译代码，则不会发生分段错误。这是我创建的测试用例：

int main() {
    __m256i *table = new __m256i[10000];
    __m256i zeroes = _mm256_set_epi64x(0, 0, 0, 0);
    table[99] = zeroes;
}

当使用clang 3.6和g ++ 4.8编译以上代码时，会发生分段错误。

这是Intel编译器生成的程序集（来自https://gcc.godbolt.org/，icc 13.0）：

pushq     %rbx                                          #3.12
movq      %rsp, %rbx                                    #3.12
andq      $-32, %rsp                                    #3.12
pushq     %rbp                                          #3.12
pushq     %rbp                                          #3.12
movq      8(%rbx), %rbp                                 #3.12
movq      %rbp, 8(%rsp)                                 #3.12
movq      %rsp, %rbp                                    #3.12
subq      $112, %rsp                                    #3.12
movl      $3200, %eax                                   #4.38
vzeroupper                                              #4.38
movq      %rax, %rdi                                    #4.38
call      operator new[](unsigned long)                 #4.38
movq      %rax, -112(%rbp)                              #4.38
movq      -112(%rbp), %rax                              #4.38
movq      %rax, -104(%rbp)                              #4.20
vxorps    %ymm0, %ymm0, %ymm0                           #5.22
vmovdqu   %ymm0, -80(%rbp)                              #5.22
vmovdqu   -80(%rbp), %ymm0                              #5.22
vmovdqu   %ymm0, -48(%rbp)                              #5.20
movl      $3168, %eax                                   #6.17
addq      -104(%rbp), %rax                              #6.5
vmovdqu   -48(%rbp), %ymm0                              #6.17
vmovdqu   %ymm0, (%rax)                                 #6.5
movl      $0, %eax                                      #7.1
vzeroupper                                              #7.1
leave                                                   #7.1
movq      %rbx, %rsp                                    #7.1
popq      %rbx                                          #7.1
ret                                                     #7.1

这是来自clang 3.7：

pushq   %rbp
movq    %rsp, %rbp
andq    $-32, %rsp
subq    $192, %rsp
xorl    %eax, %eax
movl    $3200, %ecx             # imm = 0xC80
movl    %ecx, %edi
movl    %eax, 28(%rsp)          # 4-byte Spill
callq   operator new[](unsigned long)
movq    %rax, 88(%rsp)
movq    $0, 168(%rsp)
movq    $0, 160(%rsp)
movq    $0, 152(%rsp)
movq    $0, 144(%rsp)
vmovq   168(%rsp), %xmm0        # xmm0 = mem[0],zero
vmovq   160(%rsp), %xmm1        # xmm1 = mem[0],zero
vpunpcklqdq     %xmm0, %xmm1, %xmm0 # xmm0 = xmm1[0],xmm0[0]
vmovq   152(%rsp), %xmm1        # xmm1 = mem[0],zero
vpslldq $8, %xmm1, %xmm1        # xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0,1,2,3,4,5,6,7]
vmovaps %xmm1, %xmm2
vinserti128     $1, %xmm0, %ymm2, %ymm2
vmovaps %ymm2, 96(%rsp)
vmovaps %ymm2, 32(%rsp)
movq    88(%rsp), %rax
vmovaps %ymm2, 3168(%rax)
movl    28(%rsp), %eax          # 4-byte Reload
movq    %rbp, %rsp
popq    %rbp
vzeroupper
retq

我是否在clang / g ++中遇到编译器错误？还是我只是做错了什么？

推荐阅读

程序员
为什么不锁定基于值的类

如何解决《为什么不锁定基于值的类》经验，为你挑选了1个好方法。 ... [详细]
程序员
`lab`和`code` vs`mocha`和`chai` nodejs库之间的比较

如何解决《`lab`和`code`vs`mocha`和`chai`nodejs库之间的比较》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从我的汇总捆绑包中保留bower包依赖项？

如何解决《如何从我的汇总捆绑包中保留bower包依赖项？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用资源处理临时文件

如何解决《使用资源处理临时文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Cleaning up Protractor stack trace

如何解决《CleaningupProtractorstacktrace》经验，为你挑选了0个好方法。 ... [详细]
程序员
flexbox项目是否更喜欢换行而不是扩展其容器？

如何解决《flexbox项目是否更喜欢换行而不是扩展其容器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Elixir中BitString的位计数或汉明重量？

如何解决《Elixir中BitString的位计数或汉明重量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
copy_backward和reverse_copy之间的区别？

如何解决《copy_backward和reverse_copy之间的区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获得Yocto中所有可用目标的列表？

如何解决《如何获得Yocto中所有可用目标的列表？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么SBCL会像这样打印Sublis？

如何解决《为什么SBCL会像这样打印Sublis？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在ASP.NET web api中接收json？

如何解决《如何在ASP.NETwebapi中接收json？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在堆栈视图中设置容器的高度？

如何解决《如何在堆栈视图中设置容器的高度？》经验，为你挑选了1个好方法。 ... [详细]
程序员
长双没有提供所需的精度

如何解决《长双没有提供所需的精度》经验，为你挑选了1个好方法。 ... [详细]
程序员
Bootstrap popover无法在iPad Safari上运行

如何解决《Bootstrappopover无法在iPadSafari上运行》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何为每个列名添加后缀(或前缀)？

如何解决《如何为每个列名添加后缀(或前缀)？》经验，为你挑选了3个好方法。 ... [详细]
程序员
在python中找到单词结尾的索引

如何解决《在python中找到单词结尾的索引》经验，为你挑选了0个好方法。 ... [详细]
程序员
在编号中将monadic函数与纯函数混合使用

如何解决《在编号中将monadic函数与纯函数混合使用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何重命名插件标题> Wordpress>仪表板

如何解决《如何重命名插件标题>Wordpress>仪表板》经验，为你挑选了1个好方法。 ... [详细]
程序员
Vim/Sed:仅删除单个空行

如何解决《Vim/Sed:仅删除单个空行》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ACL"public-read"保存到s3时,带有AdministratorAccess的AWS Lambda会抛出"拒绝访问"

如何解决《使用ACL"public-read"保存到s3时,带有AdministratorAccess的AWSLambda会抛出"拒绝访问"》经验，为你挑选了1个好方法。 ... [详细]

郑谊099_448

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章