OpenCL kernel execution does not start until clFinish or clWaitForEvents is called(在调用clFinish或clWaitForEvents之前,OpenCL内核执行不会开始)
问题描述
我正在尝试在GPU上运行内核,并在主机(CPU)上进行额外的计算。我看到了这个效果:
只有内核需要2000毫秒左右:
clEnqueeNDRangeKernel...
clFinish(或者clWaitForEvents,我都试过了)
我用睡眠在CPU上模拟了额外的计算(10):
clEnqueeNDRangeKernel...
睡眠(10);
clFinish(或clitForEvents)
理论上,内核应该在GPU上运行,在10秒的休眠之后,内核应该完成。但时间测量显示,这一切都需要12000毫秒,而不是10000毫秒。
是clFinish还是clWaitForEvents调用内核来启动,还是我遗漏了什么?
我使用的是AMD Fusion CPU/GPU和Linux。
非常感谢。
推荐答案
尝试在clEnqueueNDRangeKernel之后立即调用clFlush:
clFlush
在中发出所有以前排队的OpenCL命令 与命令队列关联的设备的命令队列。
http://www.khronos.org/registry/cl/sdk/1.0/docs/man/xhtml/clFlush.html
这篇关于在调用clFinish或clWaitForEvents之前,OpenCL内核执行不会开始的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:在调用clFinish或clWaitForEvents之前,OpenCL内核执行不会开始
基础教程推荐
- GDB 显示调用堆栈上函数地址的当前编译二进制文 2022-09-05
- CString 到 char* 2021-01-01
- 为什么派生模板类不能访问基模板类的标识符? 2021-01-01
- 我应该对 C++ 中的成员变量和函数参数使用相同的名称吗? 2021-01-01
- 为什么 RegOpenKeyEx() 在 Vista 64 位上返回错误代码 2021-01-01
- 初始化列表*参数*评估顺序 2021-01-01
- 通过引用传递 C++ 迭代器有什么问题? 2022-01-01
- 如果我为无符号变量分配负值会发生什么? 2022-01-01
- 为什么 typeid.name() 使用 GCC 返回奇怪的字符以及如 2022-09-16
- 非静态 const 成员,不能使用默认赋值运算符 2022-10-09
