fix(arg_utils): docs build

Ther-LF · Ther-LF · commit f8f9bee2211b · 2025-10-17T10:06:01.000Z
Signed-off-by: Ther-LF &lt;2639852836@qq.com&gt;
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
@@ -74,7 +74,9 @@ def __init__(
         # Scheduling constraints.
         self.max_num_running_reqs = self.scheduler_config.max_num_seqs
         self.max_num_scheduled_tokens = self.scheduler_config.max_num_batched_tokens
-        self.prefill_max_num_scheduled_tokens = self.scheduler_config.prefill_max_num_batched_tokens
+        self.prefill_max_num_scheduled_tokens = (
+            self.scheduler_config.prefill_max_num_batched_tokens
+        )
         self.max_model_len = self.scheduler_config.max_model_len
         self.enable_kv_cache_events = (
             self.kv_events_config is not None
@@ -176,8 +178,9 @@ def __init__(
 
     def _has_decode_requests(self) -> bool:
         """Check if there are any requests in the decode phase in the running queue.
-        
-        Criteria: The request has completed prompt computation and is generating output tokens
+
+        Criteria:
+        The request has completed prompt computation and is generating output tokens
         i.e., num_computed_tokens >= num_prompt_tokens
         """
         for request in self.running:
@@ -207,7 +210,10 @@ def schedule(self) -> SchedulerOutput:
 
         # Check if there are any requests in the decode phase in the running queue.
         has_decode_requests = self._has_decode_requests()
-        if self.scheduler_config.enable_hybrid_chunked_prefill and not has_decode_requests:
+        if (
+            self.scheduler_config.enable_hybrid_chunked_prefill
+            and not has_decode_requests
+        ):
             token_budget = self.prefill_max_num_scheduled_tokens
         else:
             token_budget = self.max_num_scheduled_tokens
@@ -597,7 +603,10 @@ def schedule(self) -> SchedulerOutput:
 
         # Check if the scheduling constraints are satisfied.
         total_num_scheduled_tokens = sum(num_scheduled_tokens.values())
-        if self.scheduler_config.enable_hybrid_chunked_prefill and not has_decode_requests:
+        if (
+            self.scheduler_config.enable_hybrid_chunked_prefill
+            and not has_decode_requests
+        ):
             assert total_num_scheduled_tokens <= self.prefill_max_num_scheduled_tokens
         else:
             assert total_num_scheduled_tokens <= self.max_num_scheduled_tokens