Change LWS selection policy for short kernels.

-prefer small LWS. Signed-off-by: Michal Mrozek <michal.mrozek@intel.com>
2025-09-15 13:01:45 +08:00 · 2021-05-20 13:56:31 +00:00
parent da34084514
commit 270cae33fd
1 changed files with 4 additions and 0 deletions
--- a/opencl/source/command_queue/local_work_size.cpp
+++ b/opencl/source/command_queue/local_work_size.cpp
@ -423,6 +423,10 @@ Vec3<size_t> computeWorkgroupSize(const DispatchInfo &dispatchInfo) {
            setSpecialWorkgroupSize(workGroupSize);
        } else if (DebugManager.flags.EnableComputeWorkSizeND.get()) {
            WorkSizeInfo wsInfo(dispatchInfo);
+            if (wsInfo.slmTotalSize == 0 && !wsInfo.hasBarriers && !wsInfo.imgUsed && hwHelper.preferSmallWorkgroupSizeForKernel(kernel->getKernelInfo().heapInfo.KernelUnpaddedSize)) {
+                wsInfo.maxWorkGroupSize = wsInfo.simdSize * 2;
+            }
+
            size_t workItems[3] = {dispatchInfo.getGWS().x, dispatchInfo.getGWS().y, dispatchInfo.getGWS().z};
            computeWorkgroupSizeND(wsInfo, workGroupSize, workItems, dispatchInfo.getDim());
        } else {