6赞

CUDA全局(如在C中)分配给设备内存的动态数组

作者：小白也坚强_177 | 2023-09-05 14:47

如何解决《CUDA全局(如在C中)分配给设备内存的动态数组》经验，为你挑选了1个好方法。

因此,我试图编写一些利用Nvidia的CUDA架构的代码.我注意到复制到设备和从设备复制真的是在损害我的整体性能,所以现在我试图将大量数据移动到设备上.

由于这些数据用于众多功能,我希望它是全球性的.是的,我可以传递指针,但我真的想知道在这个例子中如何使用全局变量.

所以,我有想要访问设备分配数组的设备功能.

理想情况下,我可以这样做:

__device__ float* global_data;

main()
{
  cudaMalloc(global_data);
  kernel1<<>>(blah); //access global data
  kernel2<<>>(blah); //access global data again
}

但是,我还没弄明白如何创建动态数组.我通过声明如下数组找出了一个解决方法:

__device__ float global_data[REALLY_LARGE_NUMBER];

虽然这不需要cudaMalloc调用,但我更喜欢动态分配方法.

1> 小智..：

这样的事情应该可行.

#include 

#define NDEBUG
#define CUT_CHECK_ERROR(errorMessage) do {                                 \
        cudaThreadSynchronize();                                           \
         cudaError_t err = cudaGetLastError();                             \
         if( cudaSuccess != err) {                                         \
                     fprintf(stderr, "Cuda error: %s in file '%s' in line %i : %s.\n",    \
                                             errorMessage, __FILE__, __LINE__, cudaGetErrorString( err) );\
                     exit(EXIT_FAILURE);                                                  \
                 } } while (0)


__device__ float *devPtr;

__global__
void kernel1(float *some_neat_data)
{
    devPtr = some_neat_data;
}

__global__
void kernel2(void)
{
    devPtr[threadIdx.x] *= .3f;
}


int main(int argc, char *argv[])
{
    float* otherDevPtr;
    cudaMalloc((void**)&otherDevPtr, 256 * sizeof(*otherDevPtr));
    cudaMemset(otherDevPtr, 0, 256 * sizeof(*otherDevPtr));

    kernel1<<<1,128>>>(otherDevPtr);
    CUT_CHECK_ERROR("kernel1");

    kernel2<<<1,128>>>();

    CUT_CHECK_ERROR("kernel2");

    return 0;
}

给它一个旋转.

推荐阅读

程序员
WFLYEJB0043：计时器[timer]的先前执行仍在进行中，在[time]处跳过了此重叠的计划执行

如何解决《WFLYEJB0043：计时器[timer]的先前执行仍在进行中，在[time]处跳过了此重叠的计划执行》经验，为你挑选了1个好方法。 ... [详细]
程序员
SAS存储过程的XML语法

如何解决《SAS存储过程的XML语法》经验，为你挑选了0个好方法。 ... [详细]
程序员
Scala用if else返回布尔值

如何解决《Scala用ifelse返回布尔值》经验，为你挑选了1个好方法。 ... [详细]
程序员
从.aar文件Android中提取代码

如何解决《从.aar文件Android中提取代码》经验，为你挑选了2个好方法。 ... [详细]
程序员
AWS Beanstalk docker镜像自动更新不起作用

如何解决《AWSBeanstalkdocker镜像自动更新不起作用》经验，为你挑选了2个好方法。 ... [详细]
程序员
Snippet在VS2015中插入了额外的换行符

如何解决《Snippet在VS2015中插入了额外的换行符》经验，为你挑选了1个好方法。 ... [详细]
程序员
列表视图元素的操作溢出菜单

如何解决《列表视图元素的操作溢出菜单》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Java获取MySQL版本

如何解决《使用Java获取MySQL版本》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么循环变量的值不存储在动态创建的AnonymousThread中

如何解决《为什么循环变量的值不存储在动态创建的AnonymousThread中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过jquery将'this'元素传递给内部函数（'click'）

如何解决《如何通过jquery将'this'元素传递给内部函数（'click'）》经验，为你挑选了1个好方法。 ... [详细]
程序员
OpenCV C++多线程加速

如何解决《OpenCVC++多线程加速》经验，为你挑选了0个好方法。 ... [详细]
程序员
Symfony2 - 为服务指定的类型名称不匹配

如何解决《Symfony2-为服务指定的类型名称不匹配》经验，为你挑选了1个好方法。 ... [详细]
程序员
C语言可以决定是否可以访问指针指向的内存？

如何解决《C语言可以决定是否可以访问指针指向的内存？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Lombok @Builder和JPA Default构造函数

如何解决《Lombok@Builder和JPADefault构造函数》经验，为你挑选了3个好方法。 ... [详细]
程序员
朱莉娅语言:有没有t检验？

如何解决《朱莉娅语言:有没有t检验？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为kotlin异常生成serialVersionUID？

如何解决《如何为kotlin异常生成serialVersionUID？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用SVG渐变插值色相？

如何解决《如何使用SVG渐变插值色相？》经验，为你挑选了0个好方法。 ... [详细]
程序员
ggplot在facet_wrap中重命名facet标签

如何解决《ggplot在facet_wrap中重命名facet标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python类方法装饰器

如何解决《Python类方法装饰器》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS - 具有多个UILabel和UIImage动态大小的Autolayout

如何解决《iOS-具有多个UILabel和UIImage动态大小的Autolayout》经验，为你挑选了1个好方法。 ... [详细]

小白也坚强_177

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章