当前位置:  开发笔记 > 编程语言 > 正文

使用Clang将OpenCL编译为PTX时未解决的extern?

如何解决《使用Clang将OpenCL编译为PTX时未解决的extern?》经验,为你挑选了0个好方法。

我按照这个SO答案的说明但是当我尝试运行生成的PTX文件时,我在clBuild中得到了跟随错误

ptxas fatal   : Unresolved extern function 'get_group_id'

在PTX文件中,我使用的每个OpenCL函数调用都有以下内容

.func  (.param .b64 func_retval0) get_group_id
(
        .param .b32 get_group_id_param_0
)
;

当我提供一个CL文件时,OpenCL运行时创建的PTX文件中不存在上述内容.相反,它有适当的特殊寄存器.

遵循这些说明(链接到不同的libclc库)在LLVM IR到PTX编译期间给出了分段错误,并出现以下错误:

fatal error: error in backend: Cannot cast between two non-generic address spaces

这些说明仍然有效吗?还有什么我应该做的吗?

我使用的是最新版本的libclc,Clang 3.7和Nvidia驱动程序352.39

推荐阅读
mobiledu2402852357
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有