qwen25vl does not need maybe_get_vit_flash_attn_backend

tjtanaa · tjtanaa · commit 7f915f44f867 · 2025-11-04T14:46:59.000Z
Signed-off-by: tjtanaa &lt;tunjian.tan@embeddedllm.com&gt;
diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
@@ -43,7 +43,6 @@
 )
 
 from vllm.attention.backends.registry import _MHA_Backend
-from vllm.attention.layer import maybe_get_vit_flash_attn_backend
 from vllm.attention.ops.vit_attn_wrappers import (
     vit_flash_attn_wrapper,
     vit_torch_sdpa_wrapper,
@@ -351,9 +350,6 @@ def __init__(
             disable_tp=use_data_parallel,
         )
         self.attn_backend = attn_backend
-        self.flash_attn_varlen_func = maybe_get_vit_flash_attn_backend(
-            self.attn_backend,
-        )
 
         self.is_flash_attn_backend = self.attn_backend in {
             _MHA_Backend.FLASH_ATTN,
@@ -681,10 +677,6 @@ def __init__(
             attn_backend_override=attn_backend_override,
         )
 
-        self.flash_attn_varlen_func = maybe_get_vit_flash_attn_backend(
-            self.attn_backend,
-        )
-
         if self.attn_backend not in {
             _MHA_Backend.FLASH_ATTN,
             _MHA_Backend.VLLM_FLASH_ATTN,