CUDA中的原子操作？要包含哪个头文件？

作者：小色米虫_524 | 2023-06-19 13:44

如何解决《CUDA中的原子操作？要包含哪个头文件？》经验，为你挑选了1个好方法。

对于在CUDA中使用原子操作,是否需要包含一些CUDA头文件？CUDA编程指南似乎对此非常紧张.

下面给出的代码glmax.cu给出了以下编译错误.

gaurish108 MyPractice: nvcc glmax.cu -o glmax
glmax.cu(11): error: identifier "atomicMax" is undefined

1 error detected in the compilation of "/tmp/tmpxft_000010fa_00000000-4_glmax.cpp1.ii".

这是代码.它基本上是使用原子操作计算GPU上阵列的最大值atomicMax.由于我是CUDA的新手,因此我确信这是一个非常简单的代码,但我写这篇文章是为了帮助自己理解原子操作.

#include
#include
#include

__global__ void global_max(int* values, int* gl_max)
{

  int i=threadIdx.x + blockDim.x * blockIdx.x;
  int val=values[i];

  atomicMax(gl_max,val);

}


int main(void)
{
  int array_size=5;
  int num_bytes=array_size*sizeof(int);
  int *device_array=0;
  int *host_array=0;

  int *device_max=0;
  int *host_max=0;

  //Allocate memory on the host
  host_array=(int*)malloc(num_bytes);

  //Allocate memory on the device
  cudaMalloc((void**)&device_array,num_bytes);
  cudaMalloc((void**)&device_max,sizeof(int));


  //If either memory allocation failed, report an error message
  if(host_array == 0 || device_array == 0)
  {
    printf("couldn't allocate memory\n");
    return 1;
  }

  //Assign a random integer in the  interval [0,25] to host_array members
  for(int i=0;i>>(device_array,device_max);

  //Transfer the maximum value so calculated into the CPU and print it
  cudaMemcpy(host_max,device_max,sizeof(int),cudaMemcpyDeviceToHost);
  printf("\nMaximum value is %d\n",*host_max);


  // deallocate memory
  free(host_array);
  cudaFree(device_array);
  cudaFree(device_max);
  return 0;
}

Jared Hobero.. 15

我不相信有#include必要."Compute Capability"1.0(sm_10)设备上没有原子操作,这是您要求nvcc编译的(默认情况下).

要atomicMax在代码中使用,请至少-arch=sm_11在命令行中指定:

$nvcc -arch=sm_11 glmax.cu -o glmax

为了将来参考,您可以参考"CUDA C编程指南"的附录F,了解有关特定计算能力平台上可用的原子操作的信息.

当然,您需要一个sm_11兼容的GPU才能执行代码.我的印象是,这些现在很常见.

1> Jared Hobero..：

我不相信有#include必要."Compute Capability"1.0(sm_10)设备上没有原子操作,这是您要求nvcc编译的(默认情况下).

要atomicMax在代码中使用,请至少-arch=sm_11在命令行中指定:

$nvcc -arch=sm_11 glmax.cu -o glmax

为了将来参考,您可以参考"CUDA C编程指南"的附录F,了解有关特定计算能力平台上可用的原子操作的信息.

当然,您需要一个sm_11兼容的GPU才能执行代码.我的印象是,这些现在很常见.

推荐阅读

程序员
android:将字节转换为dex时出错

如何解决《android:将字节转换为dex时出错》经验，为你挑选了8个好方法。 ... [详细]
程序员
R:更简单的方法将矩阵列表中的0更改为NA？

如何解决《R:更简单的方法将矩阵列表中的0更改为NA？》经验，为你挑选了1个好方法。 ... [详细]
程序员
不推荐使用的SVG pathSegList的替代方案

如何解决《不推荐使用的SVGpathSegList的替代方案》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法识别的Content-Security-Policy指令'script-src：'

如何解决《无法识别的Content-Security-Policy指令'script-src：'》经验，为你挑选了1个好方法。 ... [详细]
程序员
与DDNAME相关的PDS成员列表

如何解决《与DDNAME相关的PDS成员列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
两个索引上的MERGE JOIN仍导致SORT？

如何解决《两个索引上的MERGEJOIN仍导致SORT？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为每个终端加载.bash_profile

如何解决《为每个终端加载.bash_profile》经验，为你挑选了1个好方法。 ... [详细]
程序员
Webpack:无法解析模块'file-loader'

如何解决《Webpack:无法解析模块'file-loader'》经验，为你挑选了1个好方法。 ... [详细]
程序员
问题删除NavigationView菜单项选择的颜色？

如何解决《问题删除NavigationView菜单项选择的颜色？》经验，为你挑选了4个好方法。 ... [详细]
程序员
seo工具包-robots.txt规则不允许请求

如何解决《seo工具包-robots.txt规则不允许请求》经验，为你挑选了0个好方法。 ... [详细]
程序员
交易ID设置正确,但稍后仅显示提交

如何解决《交易ID设置正确,但稍后仅显示提交》经验，为你挑选了0个好方法。 ... [详细]
程序员
用于显示/隐藏div的动态搜索功能

如何解决《用于显示/隐藏div的动态搜索功能》经验，为你挑选了0个好方法。 ... [详细]
程序员
vstest.console可以按所有匹配的特征过滤测试吗？

如何解决《vstest.console可以按所有匹配的特征过滤测试吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android：活动之间出现黑屏

如何解决《Android：活动之间出现黑屏》经验，为你挑选了0个好方法。 ... [详细]
程序员
更改MySQL存储过程'Database Collation'名称

如何解决《更改MySQL存储过程'DatabaseCollation'名称》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从C++中的protobuf执行TensorFlow图？

如何解决《如何从C++中的protobuf执行TensorFlow图？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查arraylist是否包含字符串

如何解决《如何检查arraylist是否包含字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
travis构建失败,因为devtools缺失

如何解决《travis构建失败,因为devtools缺失》经验，为你挑选了1个好方法。 ... [详细]
程序员
Google跟踪代码管理器代码被触发，但事件未显示在Google Analytics（分析）实时事件标签中

如何解决《Google跟踪代码管理器代码被触发，但事件未显示在GoogleAnalytics（分析）实时事件标签中》经验，为你挑选了0个好方法。 ... [详细]
程序员
在gulp中用冒号调用任务意味着什么？

如何解决《在gulp中用冒号调用任务意味着什么？》经验，为你挑选了1个好方法。 ... [详细]

小色米虫_524

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章