vllm-project
diff --git a/‎benchmarks/backend_request_func.py‎
Lines changed: 1 addition & 1 deletion b/‎benchmarks/backend_request_func.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎tests/entrypoints/openai/test_chat_template.py‎
Lines changed: 8 additions & 6 deletions b/‎tests/entrypoints/openai/test_chat_template.py‎
Lines changed: 8 additions & 6 deletions
diff --git a/‎tests/entrypoints/openai/test_serving_engine.py‎
Lines changed: 1 addition & 1 deletion b/‎tests/entrypoints/openai/test_serving_engine.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎tests/entrypoints/test_chat_utils.py‎
Lines changed: 2 additions & 1 deletion b/‎tests/entrypoints/test_chat_utils.py‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎tests/models/language/generation/test_mistral.py‎
Lines changed: 1 addition & 1 deletion b/‎tests/models/language/generation/test_mistral.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎tests/models/multimodal/generation/test_voxtral.py‎
Lines changed: 1 addition & 1 deletion b/‎tests/models/multimodal/generation/test_voxtral.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎tests/models/multimodal/processing/test_common.py‎
Lines changed: 2 additions & 4 deletions b/‎tests/models/multimodal/processing/test_common.py‎
Lines changed: 2 additions & 4 deletions
diff --git a/‎tests/test_inputs.py‎
Lines changed: 4 additions & 3 deletions b/‎tests/test_inputs.py‎
Lines changed: 4 additions & 3 deletions
diff --git a/‎tests/v1/engine/test_process_multi_modal_uuids.py‎
Lines changed: 2 additions & 2 deletions b/‎tests/v1/engine/test_process_multi_modal_uuids.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎vllm/engine/protocol.py‎
Lines changed: 5 additions & 0 deletions b/‎vllm/engine/protocol.py‎
Lines changed: 5 additions & 0 deletions
@@ -620,7 +620,7 @@ def get_tokenizer(
         kwargs["use_fast"] = False
     if tokenizer_mode == "mistral":
         try:
-            from vllm.tokenizers import MistralTokenizer
+            from vllm.tokenizers.mistral import MistralTokenizer
         except ImportError as e:
             raise ImportError(
                 "MistralTokenizer requires vllm package.\n"
 
@@ -3,8 +3,9 @@
 
 import pytest
 
-from vllm.entrypoints.chat_utils import apply_hf_chat_template, load_chat_template
+from vllm.entrypoints.chat_utils import load_chat_template
 from vllm.entrypoints.openai.protocol import ChatCompletionRequest
+from vllm.renderers.hf import safe_apply_chat_template
 from vllm.tokenizers import get_tokenizer
 
 from ...models.registry import HF_EXAMPLE_MODELS
@@ -125,14 +126,15 @@ def test_get_gen_prompt(
     )
 
     # Call the function and get the result
-    result = apply_hf_chat_template(
-        tokenizer=tokenizer,
-        conversation=mock_request.messages,
-        chat_template=mock_request.chat_template or template_content,
-        renderer_config=renderer_config,
+    result = safe_apply_chat_template(
+        renderer_config,
+        tokenizer,
+        mock_request.messages,
         tools=None,
+        chat_template=mock_request.chat_template or template_content,
         add_generation_prompt=mock_request.add_generation_prompt,
         continue_final_message=mock_request.continue_final_message,
+        tokenize=False,
     )
 
     # Test assertion
 
@@ -10,7 +10,7 @@
 from vllm.config import ModelConfig, RendererConfig
 from vllm.entrypoints.openai.serving_engine import OpenAIServing
 from vllm.entrypoints.openai.serving_models import OpenAIServingModels
-from vllm.tokenizers import MistralTokenizer
+from vllm.tokenizers.mistral import MistralTokenizer
 
 
 @pytest.fixture()
 
@@ -29,7 +29,8 @@
     encode_image_base64,
     encode_video_base64,
 )
-from vllm.tokenizers import MistralTokenizer, get_tokenizer
+from vllm.tokenizers import get_tokenizer
+from vllm.tokenizers.mistral import MistralTokenizer
 from vllm.utils.serial_utils import tensor2base64
 
 from ..models.registry import HF_EXAMPLE_MODELS
 
@@ -10,7 +10,7 @@
     MistralToolParser,
 )
 from vllm.sampling_params import SamplingParams
-from vllm.tokenizers import MistralTokenizer
+from vllm.tokenizers.mistral import MistralTokenizer
 
 from ...utils import check_logprobs_close
 
 
@@ -9,7 +9,7 @@
 from mistral_common.protocol.instruct.chunk import AudioChunk, RawAudio, TextChunk
 from mistral_common.protocol.instruct.messages import UserMessage
 
-from vllm.tokenizers import MistralTokenizer
+from vllm.tokenizers.mistral import MistralTokenizer
 
 from ....conftest import AudioTestAssets
 from ....utils import RemoteOpenAIServer
 
@@ -22,10 +22,8 @@
 from vllm.multimodal.cache import MultiModalProcessorOnlyCache
 from vllm.multimodal.inputs import MultiModalInputs, batched_tensors_equal
 from vllm.multimodal.processing import BaseMultiModalProcessor, InputProcessingContext
-from vllm.tokenizers import (
-    MistralTokenizer,
-    TokenizerLike,
-)
+from vllm.tokenizers import TokenizerLike
+from vllm.tokenizers.mistral import MistralTokenizer
 
 from ....multimodal.utils import random_audio, random_image, random_video
 from ...registry import (
 
@@ -7,7 +7,7 @@
 from vllm.inputs import zip_enc_dec_prompts
 from vllm.inputs.parse import parse_raw_prompts
 from vllm.inputs.preprocess import InputPreprocessor
-from vllm.tokenizers import init_tokenizer_from_config
+from vllm.renderers import RendererRegistry
 
 pytestmark = pytest.mark.cpu_test
 
@@ -109,10 +109,11 @@ def test_zip_enc_dec_prompts(mm_processor_kwargs, expected_mm_kwargs):
 def test_preprocessor_always_mm_code_path(model_id, prompt):
     model_config = ModelConfig(model=model_id)
     renderer_config = RendererConfig(model_config=model_config)
-    tokenizer = init_tokenizer_from_config(renderer_config)
-    input_preprocessor = InputPreprocessor(renderer_config, tokenizer)
+    renderer = RendererRegistry.get_renderer(renderer_config)
+    input_preprocessor = InputPreprocessor(renderer_config, renderer)
 
     # HF processor adds sep token
+    tokenizer = renderer.get_tokenizer()
     sep_token_id = tokenizer.vocab[tokenizer.sep_token]
 
     processed_inputs = input_preprocessor.preprocess(prompt)
 
@@ -13,6 +13,7 @@
     RendererConfig,
     VllmConfig,
 )
+from vllm.renderers.terratorch import TerratorchRenderer
 from vllm.sampling_params import SamplingParams
 from vllm.v1.engine import input_processor as input_processor_mod
 from vllm.v1.engine.input_processor import InputProcessor
@@ -59,7 +60,6 @@ def _mock_input_processor(
 
     renderer_config = RendererConfig(
         model_config=model_config,
-        tokenizer="dummy",
         skip_tokenizer_init=True,
     )
 
@@ -70,7 +70,7 @@ def _mock_input_processor(
         device_config=DeviceConfig(device="cpu"),
     )
 
-    return InputProcessor(vllm_config, tokenizer=None)
+    return InputProcessor(vllm_config, renderer=TerratorchRenderer(renderer_config))
 
 
 def test_multi_modal_uuids_length_mismatch_raises(monkeypatch):
 
@@ -11,6 +11,7 @@
 from vllm.outputs import PoolingRequestOutput, RequestOutput
 from vllm.plugins.io_processors import IOProcessor
 from vllm.pooling_params import PoolingParams
+from vllm.renderers import RendererLike
 from vllm.sampling_params import SamplingParams
 from vllm.tasks import SupportedTask
 from vllm.tokenizers import TokenizerLike
@@ -27,6 +28,10 @@ class EngineClient(ABC):
     input_processor: InputProcessor
     io_processor: IOProcessor | None
 
+    @property
+    @abstractmethod
+    def renderer(self) -> RendererLike: ...
+
     @property
     @abstractmethod
     def is_running(self) -> bool: ...
Original file line number	Diff line number	Diff line change
`@@ -29,7 +29,8 @@`
`29`	`29`	`encode_image_base64,`
`30`	`30`	`encode_video_base64,`
`31`	`31`	`)`
`32`		`-from vllm.tokenizers import MistralTokenizer, get_tokenizer`
	`32`	`+from vllm.tokenizers import get_tokenizer`
	`33`	`+from vllm.tokenizers.mistral import MistralTokenizer`
`33`	`34`	`from vllm.utils.serial_utils import tensor2base64`
`34`	`35`
`35`	`36`	`from ..models.registry import HF_EXAMPLE_MODELS`
Original file line number	Diff line number	Diff line change
`@@ -10,7 +10,7 @@`
`10`	`10`	`MistralToolParser,`
`11`	`11`	`)`
`12`	`12`	`from vllm.sampling_params import SamplingParams`
`13`		`-from vllm.tokenizers import MistralTokenizer`
	`13`	`+from vllm.tokenizers.mistral import MistralTokenizer`
`14`	`14`
`15`	`15`	`from ...utils import check_logprobs_close`
`16`	`16`
Original file line number	Diff line number	Diff line change
`@@ -13,6 +13,7 @@`
`13`	`13`	`RendererConfig,`
`14`	`14`	`VllmConfig,`
`15`	`15`	`)`
	`16`	`+from vllm.renderers.terratorch import TerratorchRenderer`
`16`	`17`	`from vllm.sampling_params import SamplingParams`
`17`	`18`	`from vllm.v1.engine import input_processor as input_processor_mod`
`18`	`19`	`from vllm.v1.engine.input_processor import InputProcessor`
`@@ -59,7 +60,6 @@ def _mock_input_processor(`
`59`	`60`
`60`	`61`	`renderer_config = RendererConfig(`
`61`	`62`	`model_config=model_config,`
`62`		`- tokenizer="dummy",`
`63`	`63`	`skip_tokenizer_init=True,`
`64`	`64`	`)`
`65`	`65`
`@@ -70,7 +70,7 @@ def _mock_input_processor(`
`70`	`70`	`device_config=DeviceConfig(device="cpu"),`
`71`	`71`	`)`
`72`	`72`
`73`		`- return InputProcessor(vllm_config, tokenizer=None)`
	`73`	`+ return InputProcessor(vllm_config, renderer=TerratorchRenderer(renderer_config))`
`74`	`74`
`75`	`75`
`76`	`76`	`def test_multi_modal_uuids_length_mismatch_raises(monkeypatch):`