fix pylint (#2321)

lvyufeng · web-flow · commit e8180b0961fe · 2025-12-15T11:49:18.000+08:00
diff --git a/src/mindnlp/diffusers.py b/src/mindnlp/diffusers.py
@@ -8,5 +8,6 @@
 )
 
 # Setup backward compatibility: apply patches
+# pylint: disable=wrong-import-position
 from .patch.diffusers import setup_diffusers_module
 setup_diffusers_module()
diff --git a/src/mindnlp/inference/__init__.py b/src/mindnlp/inference/__init__.py
@@ -1,2 +1,2 @@
 from .llm import LLM
-from .sampling_params import SamplingParams
+from .sampling_params import SamplingParams
diff --git a/src/mindnlp/inference/config.py b/src/mindnlp/inference/config.py
@@ -23,4 +23,4 @@ def __post_init__(self):
         assert 1 <= self.tensor_parallel_size <= 8
         self.hf_config = AutoConfig.from_pretrained(self.model)
         self.max_model_len = min(self.max_model_len, self.hf_config.max_position_embeddings)
-        assert self.max_num_batched_tokens >= self.max_model_len
+        assert self.max_num_batched_tokens >= self.max_model_len
diff --git a/src/mindnlp/inference/engine/block_manager.py b/src/mindnlp/inference/engine/block_manager.py
@@ -109,4 +109,4 @@ def may_append(self, seq: Sequence):
             last_block.update(h, token_ids)
             self.hash_to_block_id[h] = last_block.block_id
         else:
-            assert last_block.hash == -1
+            assert last_block.hash == -1
diff --git a/src/mindnlp/inference/engine/llm_engine.py b/src/mindnlp/inference/engine/llm_engine.py
@@ -94,4 +94,4 @@ def generate(
         outputs = [{"text": self.tokenizer.decode(token_ids), "token_ids": token_ids} for token_ids in outputs]
         if use_tqdm:
             pbar.close()
-        return outputs
+        return outputs
diff --git a/src/mindnlp/inference/engine/model_runner.py b/src/mindnlp/inference/engine/model_runner.py
@@ -1,9 +1,9 @@
 import os
 import pickle
-import mindtorch
-import mindtorch.distributed as dist
 from multiprocessing.synchronize import Event
 from multiprocessing.shared_memory import SharedMemory
+import mindtorch
+import mindtorch.distributed as dist
 
 from ..config import Config
 from ..engine.sequence import Sequence
@@ -156,7 +156,7 @@ def prepare_prefill(self, seqs: list[Sequence]):
                 if i != seq.num_blocks - 1:
                     end = start + self.block_size
                 else:
-                    end = start + seq.last_block_num_tokens 
+                    end = start + seq.last_block_num_tokens
                 slot_mapping.extend(list(range(start, end)))
         if cu_seqlens_k[-1] > cu_seqlens_q[-1]:    # prefix cache
             block_tables = self.prepare_block_tables(seqs)
@@ -255,4 +255,4 @@ def capture_cudagraph(self):
             context_lens=context_lens,
             block_tables=block_tables,
             outputs=outputs,
-        )
+        )
diff --git a/src/mindnlp/inference/engine/scheduler.py b/src/mindnlp/inference/engine/scheduler.py
@@ -68,4 +68,5 @@ def postprocess(self, seqs: list[Sequence], token_ids: list[int]) -> list[bool]:
             if (not seq.ignore_eos and token_id == self.eos) or seq.num_completion_tokens == seq.max_tokens:
                 seq.status = SequenceStatus.FINISHED
                 self.block_manager.deallocate(seq)
-                self.running.remove(seq)
+
+                self.running.remove(seq)
diff --git a/src/mindnlp/inference/engine/sequence.py b/src/mindnlp/inference/engine/sequence.py
@@ -80,4 +80,4 @@ def __setstate__(self, state):
         if self.num_completion_tokens == 0:
             self.token_ids = state[-1]
         else:
-            self.last_token = state[-1]
+            self.last_token = state[-1]
diff --git a/src/mindnlp/inference/layers/activation.py b/src/mindnlp/inference/layers/activation.py
@@ -6,9 +6,9 @@
 class SiluAndMul(nn.Module):
 
     def __init__(self):
-        super().__init__()
+        super().__init__()  # pylint: disable=useless-parent-delegation
 
     @mindtorch.compile
     def forward(self, x: mindtorch.Tensor) -> mindtorch.Tensor:
         x, y = x.chunk(2, -1)
-        return F.silu(x) * y
+        return F.silu(x) * y
diff --git a/src/mindnlp/inference/layers/attention.py b/src/mindnlp/inference/layers/attention.py
@@ -1,12 +1,12 @@
 import mindtorch
 from mindtorch import nn
-import triton
-import triton.language as tl
 
 from ..utils.context import get_context
 
 
 def store_kvcache(key: mindtorch.Tensor, value: mindtorch.Tensor, k_cache: mindtorch.Tensor, v_cache: mindtorch.Tensor, slot_mapping: mindtorch.Tensor):
+    # pylint: disable=undefined-variable
+    # These are conditionally imported from flash_attn or other backends
     N, num_heads, head_dim = key.shape
     D = num_heads * head_dim
     assert key.stride(-1) == 1 and value.stride(-1) == 1
@@ -40,12 +40,15 @@ def forward(self, q: mindtorch.Tensor, k: mindtorch.Tensor, v: mindtorch.Tensor)
         if context.is_prefill:
             if context.block_tables is not None:    # prefix cache
                 k, v = k_cache, v_cache
+            # pylint: disable=undefined-variable
             o = flash_attn_varlen_func(q, k, v,
                                        max_seqlen_q=context.max_seqlen_q, cu_seqlens_q=context.cu_seqlens_q,
                                        max_seqlen_k=context.max_seqlen_k, cu_seqlens_k=context.cu_seqlens_k,
                                        softmax_scale=self.scale, causal=True, block_table=context.block_tables)
         else:    # decode
-            o = flash_attn_with_kvcache(q.unsqueeze(1), k_cache, v_cache,
-                                        cache_seqlens=context.context_lens, block_table=context.block_tables, 
+            # flash_attn_with_kvcache is conditionally imported from flash_attn
+            # pylint: disable=undefined-variable
+            o = flash_attn_with_kvcache(q.unsqueeze(1), k_cache, v_cache,  # noqa: F821
+                                        cache_seqlens=context.context_lens, block_table=context.block_tables,
                                         softmax_scale=self.scale, causal=True)
-        return o
+        return o
diff --git a/src/mindnlp/inference/layers/embed_head.py b/src/mindnlp/inference/layers/embed_head.py
@@ -21,7 +21,7 @@ def __init__(
         else:
             self.tp_rank = 0
             self.tp_size = 1
-            
+
         assert num_embeddings % self.tp_size == 0
         self.num_embeddings = num_embeddings
         self.num_embeddings_per_partition = self.num_embeddings // self.tp_size
@@ -74,4 +74,4 @@ def forward(self, x: mindtorch.Tensor):
             all_logits = [mindtorch.empty_like(logits) for _ in range(self.tp_size)] if self.tp_rank == 0 else None
             dist.gather(logits, all_logits, 0)
             logits = mindtorch.cat(all_logits, -1) if self.tp_rank == 0 else None
-        return logits
+        return logits
diff --git a/src/mindnlp/inference/layers/layernorm.py b/src/mindnlp/inference/layers/layernorm.py
@@ -1,7 +1,7 @@
 # FILE: nanovllm/layers/layernorm.py
+from typing import Optional, Tuple, Union
 import mindtorch
 from mindtorch import nn
-from typing import Optional, Tuple, Union
 
 
 class RMSNorm(nn.Module):
@@ -50,4 +50,4 @@ def forward(
         if residual is None:
             return self.rms_forward(x)
         else:
-            return self.add_rms_forward(x, residual)
+            return self.add_rms_forward(x, residual)
diff --git a/src/mindnlp/inference/layers/linear.py b/src/mindnlp/inference/layers/linear.py
@@ -1,9 +1,9 @@
 # FILE: nanovllm/layers/linear.py
+from typing import Optional, List
 import mindtorch
 from mindtorch import nn
 import mindtorch.nn.functional as F
 import mindtorch.distributed as dist
-from typing import Optional, List
 
 
 def divide(numerator, denominator):
@@ -122,13 +122,13 @@ def __init__(
         self.head_size = head_size
         self.total_num_heads = total_num_heads
         self.total_num_kv_heads = total_num_kv_heads or total_num_heads
-        
+
         # This layer's __init__ is called before the parent's, so we need to get tp_size here too
         if dist.is_initialized():
             tp_size = dist.get_world_size()
         else:
             tp_size = 1
-            
+
         self.num_heads = divide(self.total_num_heads, tp_size)
         self.num_kv_heads = divide(self.total_num_kv_heads, tp_size)
         input_size = hidden_size
@@ -184,4 +184,3 @@ def forward(self, x: mindtorch.Tensor) -> mindtorch.Tensor:
         if self.tp_size > 1:
             dist.all_reduce(y)
         return y
-
diff --git a/src/mindnlp/inference/layers/rotary_embedding.py b/src/mindnlp/inference/layers/rotary_embedding.py
@@ -1,8 +1,8 @@
 # FILE: nanovllm/layers/rotary_embedding.py
 from functools import lru_cache
+from typing import Optional, Dict
 import mindtorch
 from mindtorch import nn
-from typing import Optional, Dict
 
 
 def apply_rotary_emb(
@@ -67,4 +67,4 @@ def get_rope(
 ):
     assert rope_scaling is None
     rotary_emb = RotaryEmbedding(head_size, rotary_dim, max_position, base)
-    return rotary_emb
+    return rotary_emb
diff --git a/src/mindnlp/inference/layers/sampler.py b/src/mindnlp/inference/layers/sampler.py
@@ -5,14 +5,14 @@
 class Sampler(nn.Module):
 
     def __init__(self):
-        super().__init__()
+        super().__init__()  # pylint: disable=useless-parent-delegation
 
     def forward(self, logits: mindtorch.Tensor, temperatures: mindtorch.Tensor):
         logits = logits.to(mindtorch.float)
         greedy_tokens = logits.argmax(dim=-1)
         logits.div_(temperatures.unsqueeze(dim=1))
         probs = mindtorch.softmax(logits, dim=-1, dtype=mindtorch.float)
         # logprobs = mindtorch.log_softmax(logits, dim=-1, dtype=mindtorch.float)
-        epsilon = 1e-10  
-        sample_tokens = probs.div_(mindtorch.empty_like(probs).exponential_(1) + epsilon).argmax(dim=-1)  
-        return mindtorch.where(temperatures == 0, greedy_tokens, sample_tokens)
+        epsilon = 1e-10
+        sample_tokens = probs.div_(mindtorch.empty_like(probs).exponential_(1) + epsilon).argmax(dim=-1)
+        return mindtorch.where(temperatures == 0, greedy_tokens, sample_tokens)
diff --git a/src/mindnlp/inference/llm.py b/src/mindnlp/inference/llm.py
@@ -2,4 +2,4 @@
 
 
 class LLM(LLMEngine):
-    pass
+    pass
diff --git a/src/mindnlp/inference/models/qwen3.py b/src/mindnlp/inference/models/qwen3.py
@@ -1,7 +1,7 @@
+from transformers import Qwen3Config
 import mindtorch
 from mindtorch import nn
 import mindtorch.distributed as dist
-from transformers import Qwen3Config
 
 from ..layers.activation import SiluAndMul
 from ..layers.attention import Attention
@@ -212,4 +212,4 @@ def compute_logits(
         self,
         hidden_states: mindtorch.Tensor,
     ) -> mindtorch.Tensor:
-        return self.lm_head(hidden_states)
+        return self.lm_head(hidden_states)
diff --git a/src/mindnlp/inference/sampling_params.py b/src/mindnlp/inference/sampling_params.py
@@ -8,4 +8,4 @@ class SamplingParams:
     ignore_eos: bool = False
 
     def __post_init__(self):
-        assert self.temperature > 1e-10, "greedy sampling is not permitted"
+        assert self.temperature > 1e-10, "greedy sampling is not permitted"
diff --git a/src/mindnlp/inference/utils/context.py b/src/mindnlp/inference/utils/context.py
@@ -1,7 +1,7 @@
 # FILE: nanovllm/utils/context.py
 from dataclasses import dataclass
-import mindtorch
 from typing import Optional
+import mindtorch
 
 
 @dataclass
@@ -27,4 +27,4 @@ def set_context(is_prefill, cu_seqlens_q=None, cu_seqlens_k=None, max_seqlen_q=0
 
 def reset_context():
     global _CONTEXT
-    _CONTEXT = Context()
+    _CONTEXT = Context()
diff --git a/src/mindnlp/inference/utils/loader.py b/src/mindnlp/inference/utils/loader.py
@@ -1,8 +1,8 @@
 import os
 from glob import glob
+from safetensors import safe_open
 import mindtorch
 from mindtorch import nn
-from safetensors import safe_open
 
 
 def default_weight_loader(param: nn.Parameter, loaded_weight: mindtorch.Tensor):
diff --git a/src/mindnlp/launcher.py b/src/mindnlp/launcher.py
@@ -1,8 +1,8 @@
 import mindspore.multiprocessing as mp
 ctx = mp.get_context("spawn")
 
-def lanuch_wrapper(*wargs, **kwargs):
+def lanuch_wrapper(launcher, *args, **kwargs):
     mp.set_start_method('spawn', force=True)
     process = mp.Process(target=launcher, args=args, kwargs=kwargs)
     process.start()
-    process.join()
+    process.join()
diff --git a/src/mindnlp/patch/__init__.py b/src/mindnlp/patch/__init__.py
@@ -8,4 +8,3 @@
 from .registry import apply_all_patches
 
 __all__ = ['apply_all_patches']
-
diff --git a/src/mindnlp/patch/common.py b/src/mindnlp/patch/common.py
@@ -8,35 +8,35 @@
 
 class MissingLibraryErrorModule:
     """A module that raises a friendly error when the library is not installed."""
-    
+
     def __init__(self, library_name: str, module_name: str = None):
         self._library_name = library_name
         self._module_name = module_name or f"mindnlp.{library_name}"
         self.__name__ = self._module_name
-    
+
     def __getattr__(self, name: str):
         raise ImportError(
             f"`{self._library_name}` is required but not installed. "
             f"Please install it with: `pip install {self._library_name}`\n"
             f"Note: The usage 'from {self._module_name} import ...' is deprecated. "
             f"Please use 'import mindnlp; from {self._library_name} import ...' instead."
         )
-    
+
     def __dir__(self):
         return []
 
 
 def setup_missing_library_error_module(library_name: str, module_name: Optional[str] = None):
     """
     Set up an error module when a library is not installed.
-    
+
     Args:
         library_name: The name of the library (e.g., 'transformers', 'diffusers')
         module_name: The full module name in sys.modules (e.g., 'mindnlp.transformers').
                     If None, defaults to f'mindnlp.{library_name}'
     """
     if module_name is None:
         module_name = f'mindnlp.{library_name}'
-    
+
     if module_name not in sys.modules:
         sys.modules[module_name] = MissingLibraryErrorModule(library_name, module_name)
diff --git a/src/mindnlp/patch/diffusers/__init__.py b/src/mindnlp/patch/diffusers/__init__.py
@@ -17,9 +17,9 @@ def setup_diffusers_module():
     except ImportError:
         setup_missing_library_error_module('diffusers', 'mindnlp.diffusers')
         return
-    
+
     apply_diffusers_patches()
-    
+
     # Redirect mindnlp.diffusers to diffusers
     if 'mindnlp.diffusers' not in sys.modules:
         sys.modules['mindnlp.diffusers'] = diffusers
diff --git a/src/mindnlp/patch/diffusers/common.py b/src/mindnlp/patch/diffusers/common.py
@@ -12,7 +12,7 @@ def patch_diffusers_common():
     """diffusers 通用补丁"""
     try:
         import diffusers
-        
+
         patch_dtype_wrapper(
             diffusers.pipelines.pipeline_utils.DiffusionPipeline,
             'from_pretrained'
diff --git a/src/mindnlp/patch/registry.py b/src/mindnlp/patch/registry.py
diff --git a/src/mindnlp/patch/safetensors/common.py b/src/mindnlp/patch/safetensors/common.py
diff --git a/src/mindnlp/patch/transformers/__init__.py b/src/mindnlp/patch/transformers/__init__.py
diff --git a/src/mindnlp/patch/transformers/common.py b/src/mindnlp/patch/transformers/common.py
diff --git a/src/mindnlp/patch/transformers/v4_55.py b/src/mindnlp/patch/transformers/v4_55.py
diff --git a/src/mindnlp/patch/transformers/v4_56.py b/src/mindnlp/patch/transformers/v4_56.py
diff --git a/src/mindnlp/patch/utils/__init__.py b/src/mindnlp/patch/utils/__init__.py
diff --git a/src/mindnlp/patch/utils/trainer.py b/src/mindnlp/patch/utils/trainer.py
diff --git a/src/mindnlp/transformers.py b/src/mindnlp/transformers.py
diff --git a/src/mindtorch/_apis/numpy.py b/src/mindtorch/_apis/numpy.py
diff --git a/src/mindtorch/nn/functional.py b/src/mindtorch/nn/functional.py

Original file line number	Diff line number	Diff line change
`@@ -8,5 +8,6 @@`
`8`	`8`	`)`
`9`	`9`
`10`	`10`	`# Setup backward compatibility: apply patches`
	`11`	`+# pylint: disable=wrong-import-position`
`11`	`12`	`from .patch.diffusers import setup_diffusers_module`
`12`	`13`	`setup_diffusers_module()`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`	`from .llm import LLM`
`2`		`-from .sampling_params import SamplingParams`
	`2`	`+from .sampling_params import SamplingParams`