4赞

如何将CUDA代码分成多个文件

作者：360691894_8a5c48 | 2023-08-11 14:12

如何解决《如何将CUDA代码分成多个文件》经验，为你挑选了1个好方法。

我正在尝试将CUDA程序分成两个独立的.cu文件,以便更接近于在C++中编写真正的应用程序.我有一个简单的小程序:

在主机和设备上分配内存.
将主机阵列初始化为一系列数字.将主机阵列复制到设备阵列使用设备内核查找阵列中所有元素的平方将设备阵列复制回主机阵列打印结果

如果我把它全部放在一个.cu文件中并运行它,这很有效.当我将它分成两个单独的文件时,我开始得到链接错误.像我最近的所有问题一样,我知道这很小,但它是什么？

KernelSupport.cu

#ifndef _KERNEL_SUPPORT_
#define _KERNEL_SUPPORT_

#include 
#include 

int main( int argc, char** argv) 
{
    int* hostArray;
    int* deviceArray;
    const int arrayLength = 16;
    const unsigned int memSize = sizeof(int) * arrayLength;

    hostArray = (int*)malloc(memSize);
    cudaMalloc((void**) &deviceArray, memSize);

    std::cout << "Before device\n";
    for(int i=0;i>> (deviceArray);
    cudaMemcpy(hostArray, deviceArray, memSize, cudaMemcpyDeviceToHost);

    std::cout << "After device\n";
    for(int i=0;i

MyKernel.cu

#ifndef _MY_KERNEL_
#define _MY_KERNEL_

__global__ void TestDevice(int *deviceArray)
{
    int idx = blockIdx.x*blockDim.x + threadIdx.x;
    deviceArray[idx] = deviceArray[idx]*deviceArray[idx];
}


#endif


构建日志:

1>------ Build started: Project: CUDASandbox, Configuration: Debug x64 ------
1>Compiling with CUDA Build Rule...
1>"C:\CUDA\bin64\nvcc.exe"    -arch sm_10 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 9.0\VC\bin"    -Xcompiler "/EHsc /W3 /nologo /O2 /Zi   /MT  "  -maxrregcount=32  --compile -o "x64\Debug\KernelSupport.cu.obj" "d:\Stuff\Programming\Visual Studio 2008\Projects\CUDASandbox\CUDASandbox\KernelSupport.cu" 
1>KernelSupport.cu
1>tmpxft_000016f4_00000000-3_KernelSupport.cudafe1.gpu
1>tmpxft_000016f4_00000000-8_KernelSupport.cudafe2.gpu
1>tmpxft_000016f4_00000000-3_KernelSupport.cudafe1.cpp
1>tmpxft_000016f4_00000000-12_KernelSupport.ii
1>Linking...
1>KernelSupport.cu.obj : error LNK2005: __device_stub__Z10TestDevicePi already defined in MyKernel.cu.obj
1>KernelSupport.cu.obj : error LNK2005: "void __cdecl TestDevice__entry(int *)" (?TestDevice__entry@@YAXPEAH@Z) already defined in MyKernel.cu.obj
1>D:\Stuff\Programming\Visual Studio 2008\Projects\CUDASandbox\x64\Debug\CUDASandbox.exe : fatal error LNK1169: one or more multiply defined symbols found
1>Build log was saved at "file://d:\Stuff\Programming\Visual Studio 2008\Projects\CUDASandbox\CUDASandbox\x64\Debug\BuildLog.htm"
1>CUDASandbox - 3 error(s), 0 warning(s)
========== Build: 0 succeeded, 1 failed, 0 up-to-date, 0 skipped ==========


我在Windows 7 64bit上运行Visual Studio 2008.



编辑:

我想我需要详细说明一点.我在这里寻找的最终结果是有一个普通的C++应用程序,其中包含Main.cpp和int main()事件,并从那里运行.在我的.cpp代码的某些点上,我希望能够引用CUDA位.所以我的想法(如果有更标准的约定,请纠正我)是我将CUDA内核代码放入他们的.cu文件中,然后有一个支持.cu文件,它将负责与设备通话并调用内核函数和什么不是.


1> Scott Wales..：
你是包括mykernel.cu在kernelsupport.cu,当你尝试链接编译器看到mykernel.cu两次.您必须创建一个定义TestDevice的标头并包含它.

评论:

这样的事情应该有效

// MyKernel.h
#ifndef mykernel_h
#define mykernel_h
__global__ void TestDevice(int* devicearray);
#endif


然后将包含文件更改为

//KernelSupport.cu
#ifndef _KERNEL_SUPPORT_
#define _KERNEL_SUPPORT_

#include 
#include 
// ...


重新编辑

只要你在C使用的头++代码没有任何CUDA具体的东西(__kernel__,__global__,等),你应该罚款链接C++和CUDA代码.

        
你的MyKernel.h应该有`void TestDeviceWrapper(dim3 grid,dim3 block,int*devicearray)`因为当KernelSupport.cu变成KernelSupport.cpp时,cl.exe将无法理解__global__语法.然后在MyKernel.cu中,`TestDeviceWrapper()`只调用`TestDevice <<< >>>`.

推荐阅读

程序员
如何防止"可能的分数损失"？

如何解决《如何防止"可能的分数损失"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Loader项目中连接信号？

如何解决《如何在Loader项目中连接信号？》经验，为你挑选了1个好方法。 ... [详细]
程序员
模板实例化,两阶段名称查找,具有自动推导类型的不同行为

如何解决《模板实例化,两阶段名称查找,具有自动推导类型的不同行为》经验，为你挑选了0个好方法。 ... [详细]
程序员
什么在Ruby中更快,`arr + = [x]`或`arr << x`

如何解决《什么在Ruby中更快,`arr+=[x]`或`arr<<x`》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQLSTATE [HY000] [1049]未知数据库'register_login'

如何解决《SQLSTATE[HY000][1049]未知数据库'register_login'》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rails,Sidekiq - Redis NOAUTH

如何解决《Rails,Sidekiq-RedisNOAUTH》经验，为你挑选了1个好方法。 ... [详细]
程序员
反序列化XML - 对于无符号字节,值太大或太小

如何解决《反序列化XML-对于无符号字节,值太大或太小》经验，为你挑选了1个好方法。 ... [详细]
程序员
量角器检查位置路径

如何解决《量角器检查位置路径》经验，为你挑选了1个好方法。 ... [详细]
程序员
RavenDB Map减少了不同的索引

如何解决《RavenDBMap减少了不同的索引》经验，为你挑选了0个好方法。 ... [详细]
程序员
Yii2注销特定用户

如何解决《Yii2注销特定用户》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用javascript按类名获取价值

如何解决《如何使用javascript按类名获取价值》经验，为你挑选了1个好方法。 ... [详细]
程序员
Xcode中文件夹和组之间的区别？

如何解决《Xcode中文件夹和组之间的区别？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Angular2错误 - 我的登录组件没有提供程序错误

如何解决《Angular2错误-我的登录组件没有提供程序错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
SearchView中的onQueryTextSubmit在Android Java中处理两次

如何解决《SearchView中的onQueryTextSubmit在AndroidJava中处理两次》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Swift_Message对象获取附件列表

如何解决《从Swift_Message对象获取附件列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
在JQuery中传递参数来过滤函数

如何解决《在JQuery中传递参数来过滤函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
React.js在悬停问题上显示组件的一部分

如何解决《React.js在悬停问题上显示组件的一部分》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Uri字符串,可能有也可能没有尾随/

如何解决《使用Uri字符串,可能有也可能没有尾随/》经验，为你挑选了0个好方法。 ... [详细]
程序员
确定Touch ID保护的钥匙串项是否存在？

如何解决《确定TouchID保护的钥匙串项是否存在？》经验，为你挑选了2个好方法。 ... [详细]
程序员
C#escape花括号不能使用格式修饰符？

如何解决《C#escape花括号不能使用格式修饰符？》经验，为你挑选了1个好方法。 ... [详细]

360691894_8a5c48

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章