20赞

OpenCL内核是否异步执行？

作者：echo7111436 | 2023-09-06 12:34

如何解决《OpenCL内核是否异步执行？》经验，为你挑选了1个好方法。

对于CUDA，我知道在向默认流（空流）发出启动命令后，它们是异步执行的，那么在OpenCL中呢？示例代码如下：

cl_context context;
cl_device_id device_id;
cl_int err;
...
cl_kernel kernel1;
cl_kernel kernel2;
cl_command_queue Q = clCreateCommandQueue(context, device_id, 0, &err);
...
size_t global_w_offset[3] = {0,0,0};
size_t global_w_size[3] = {16,16,1};
size_t local_w_size[3] = {16,16,1};
err = clEnqueueNDRangeKernel(Q, kernel1, 3, global_w_offset, global_w_size, 
                             local_w_size, 0, nullptr, nullptr);
err = clEnqueueNDRangeKernel(Q, kernel2, 3, global_w_offset, global_w_size, 
                             local_w_size, 0, nullptr, nullptr);
clFinish(Q);

命令排队后是否会kernel1和kernel2异步执行？（即执行重叠）

更新
按照OpenCL的参考，这似乎是一套properties为CL_QUEUE_OUT_OF_ORDER_EXEC_MODE_ENABLE在clCreateCommandQueue能满足我的需要。但是，out_of_order是否意味着异步？

1> 小智..：

out_of_order是否意味着异步

“乱序”队列表示内核可能以与排队时不同的顺序执行（如果事件/数据相关性允许的话）。它们也可以同时执行，但不是必须执行。

同样，异步执行意味着执行重叠之外的其他东西（称为并行执行或并发）。异步执行意味着设备上的内核代码独立于主机代码执行-在OpenCL中始终如此。

获取并发（执行重叠）的简单方法是在同一设备上使用> 1个队列。即使在不具有乱序队列功能的实现上也可以使用。它不能保证执行重叠（因为OpenCL可以在比CUDA上更多的设备上使用，并且在某些设备上您一次不能执行1个以上的内核），但是根据我对大多数GPU的经验，您应该至少获得一些交叠。但是，您需要注意内核在单独队列中使用的缓冲区。

推荐阅读

程序员
循环内的递归函数

如何解决《循环内的递归函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
TensorFlow培训

如何解决《TensorFlow培训》经验，为你挑选了1个好方法。 ... [详细]
程序员
显示名称不会出现在Windows 10中的大图标/平铺下面

如何解决《显示名称不会出现在Windows10中的大图标/平铺下面》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何防止在非const对象上意外调用变异函数？

如何解决《如何防止在非const对象上意外调用变异函数？》经验，为你挑选了5个好方法。 ... [详细]
程序员
loopback在单个请求中保存相关的hasmany模型

如何解决《loopback在单个请求中保存相关的hasmany模型》经验，为你挑选了0个好方法。 ... [详细]
程序员
react.js替换img src onerror

如何解决《react.js替换imgsrconerror》经验，为你挑选了5个好方法。 ... [详细]
程序员
获取MVC中的子域以实现国际化

如何解决《获取MVC中的子域以实现国际化》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用JavaScript切换元素的可见性

如何解决《使用JavaScript切换元素的可见性》经验，为你挑选了1个好方法。 ... [详细]
程序员
Docker flask应用程序环境变量

如何解决《Dockerflask应用程序环境变量》经验，为你挑选了0个好方法。 ... [详细]
程序员
HTML5视频 - 如何无缝播放和/或循环播放多个视频？

如何解决《HTML5视频-如何无缝播放和/或循环播放多个视频？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当光标在右列上方时如何滚动左列？

如何解决《当光标在右列上方时如何滚动左列？》经验，为你挑选了0个好方法。 ... [详细]
程序员
C# - 在Universal Apps中获取mac地址

如何解决《C#-在UniversalApps中获取mac地址》经验，为你挑选了2个好方法。 ... [详细]
程序员
Visual Studio 2015 JSX/ES2015语法高亮显示

如何解决《VisualStudio2015JSX/ES2015语法高亮显示》经验，为你挑选了4个好方法。 ... [详细]
程序员
在Spark中连接稀疏向量？

如何解决《在Spark中连接稀疏向量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用union将字典添加到`set()`

如何解决《使用union将字典添加到`set()`》经验，为你挑选了2个好方法。 ... [详细]
程序员
杀死一个敌人会使每个敌人消失 - C#Unity

如何解决《杀死一个敌人会使每个敌人消失-C#Unity》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Windows上的Anaconda Python中安装Keras和Theano？

如何解决《如何在Windows上的AnacondaPython中安装Keras和Theano？》经验，为你挑选了4个好方法。 ... [详细]
程序员
TypeScript:继承类中静态方法的自引用返回类型

如何解决《TypeScript:继承类中静态方法的自引用返回类型》经验，为你挑选了1个好方法。 ... [详细]
程序员
我应该为我的API使用哪种身份验证策略？

如何解决《我应该为我的API使用哪种身份验证策略？》经验，为你挑选了1个好方法。 ... [详细]
程序员
找出给定键组合的相应转义序列

如何解决《找出给定键组合的相应转义序列》经验，为你挑选了0个好方法。 ... [详细]

echo7111436

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章