do not specialize M

grimoire · grimoire · commit df50eb47ea72 · 2025-12-01T20:26:04.000+08:00
diff --git a/lmdeploy/pytorch/kernels/cuda/blocked_gemm_fp8.py b/lmdeploy/pytorch/kernels/cuda/blocked_gemm_fp8.py
@@ -11,7 +11,7 @@
 logger = get_logger('lmdeploy')
 
 
-@triton.jit
+@triton.jit(do_not_specialize=['M', 'M_out'])
 def _quant_fp8_kernel(
     a_ptr,
     out_ptr,