Models Hub Update

AbdullahMubeenAnwar · web-flow · commit b827818c7e9e · 2025-10-09T13:21:55.000+02:00
diff --git a/docs/_posts/AbdullahMubeenAnwar/2025-09-15-qwen2.5_vl_7b_instruct_q16_gguf_en.md b/docs/_posts/AbdullahMubeenAnwar/2025-09-15-qwen2.5_vl_7b_instruct_q16_gguf_en.md
@@ -0,0 +1,193 @@
+---
+layout: model
+title: Qwen2.5-VL-7B-Instruct (Q16 GGUF Quantized)
+author: John Snow Labs
+name: qwen2.5_vl_7b_instruct_q16_gguf
+date: 2025-09-15
+tags: [qwen2_5_vl, image_to_text, multimodal, conversational, instruct, q16, 7b, en, open_source, llamacpp]
+task: Image Captioning
+language: en
+edition: Spark NLP 6.1.1
+spark_version: 3.0
+supported: true
+engine: llamacpp
+annotator: AutoGGUFVisionModel
+article_header:
+  type: cover
+use_language_switcher: "Python-Scala-Java"
+---
+
+## Description
+
+**Qwen2.5-VL-7B-Instruct (Q16 GGUF Quantized)** is a 7-billion-parameter multimodal instruction-tuned model supporting **text, image, and video understanding**. Compared to Qwen2-VL, it introduces major enhancements in **fine-grained visual analysis (objects, text, charts, layouts), structured outputs (tables, invoices, forms), visual localization (bounding boxes, points with JSON), and long-video comprehension (over 1 hour with temporal reasoning)**.  
+
+It also adds **agentic capabilities**, enabling tool use such as computer and phone control. This version is provided in **GGUF Q16 format** for efficient inference in SparkNLP pipelines and lightweight runtimes, balancing speed and accuracy.  
+
+Originally from [Qwen/Qwen2.5-VL-7B-Instruct](https://huggingface.co/Qwen/Qwen2.5-VL-7B-Instruct).
+
+{:.btn-box}
+<button class="button button-orange" disabled>Live Demo</button>
+<button class="button button-orange" disabled>Open in Colab</button>
+[Download](https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/qwen2.5_vl_7b_instruct_q16_gguf_en_6.1.1_3.0_1757966755156.zip){:.button.button-orange.button-orange-trans.arr.button-icon}
+[Copy S3 URI](s3://auxdata.johnsnowlabs.com/public/models/qwen2.5_vl_7b_instruct_q16_gguf_en_6.1.1_3.0_1757966755156.zip){:.button.button-orange.button-orange-trans.button-icon.button-copy-s3}
+
+## How to use
+
+
+
+<div class="tabs-box" markdown="1">
+{% include programmingLanguageSelectScalaPythonNLU.html %}
+```python
+from sparknlp.base import DocumentAssembler, ImageAssembler
+from sparknlp.annotator import AutoGGUFVisionModel
+from pyspark.sql.functions import lit
+from pyspark.ml import Pipeline
+
+images_path = "path/to/images/folder"
+prompt = "Caption this image."
+
+data = ImageAssembler.loadImagesAsBytes(spark, images_path)
+data = data.withColumn("caption", lit(prompt))
+
+document_assembler = (
+    DocumentAssembler()
+    .setInputCol("caption")
+    .setOutputCol("caption_document")
+)
+
+image_assembler = (
+    ImageAssembler()
+    .setInputCol("image")
+    .setOutputCol("image_assembler")
+)
+
+qwen_chat_template = """<|im_start|>user
+prompt<|im_end|>
+<|im_start|>assistant
+"""
+
+autoGGUFVisionModel = (
+    AutoGGUFVisionModel.pretrained("qwen2.5_vl_7b_instruct_q16_gguf")
+    .setInputCols(["caption_document", "image_assembler"])
+    .setOutputCol("completions")
+    .setChatTemplate(qwen_chat_template)
+    .setBatchSize(4)
+    .setNGpuLayers(32)
+    .setNCtx(4096)
+    .setMinKeep(0)
+    .setMinP(0.05)
+    .setNPredict(64)
+    .setNProbs(0)
+    .setPenalizeNl(False)
+    .setRepeatLastN(256)
+    .setRepeatPenalty(1.1)
+    .setStopStrings(["</s>", "<|im_end|>", "User:"])
+    .setTemperature(0.2)
+    .setTfsZ(1)
+    .setTypicalP(1)
+    .setTopK(40)
+    .setTopP(0.95)
+)
+
+pipeline = Pipeline().setStages([
+    document_assembler,
+    image_assembler,
+    autoGGUFVisionModel
+])
+
+model = pipeline.fit(data)
+result = model.transform(data)
+
+result.selectExpr(
+    "reverse(split(image.origin, '/'))[0] as image_name",
+    "completions.result"
+).show(truncate=False)
+```
+```scala
+import com.johnsnowlabs.nlp.base._
+import com.johnsnowlabs.nlp.annotators._
+import org.apache.spark.sql.functions.lit
+import org.apache.spark.ml.Pipeline
+
+val images_path = "path/to/images/folder"
+val prompt = "Caption this image."
+
+var data = ImageAssembler.loadImagesAsBytes(spark, images_path)
+data = data.withColumn("caption", lit(prompt))
+
+val document_assembler = new DocumentAssembler()
+  .setInputCol("caption")
+  .setOutputCol("caption_document")
+
+val image_assembler = new ImageAssembler()
+  .setInputCol("image")
+  .setOutputCol("image_assembler")
+
+val qwen_chat_template = """<|im_start|>user
+prompt<|im_end|>
+<|im_start|>assistant
+"""
+
+val autoGGUFVisionModel = AutoGGUFVisionModel.pretrained("qwen2.5_vl_7b_instruct_q16_gguf")
+  .setInputCols(Array("caption_document", "image_assembler"))
+  .setOutputCol("completions")
+  .setChatTemplate(qwen_chat_template)
+  .setBatchSize(4)
+  .setNGpuLayers(32)
+  .setNCtx(4096)
+  .setMinKeep(0)
+  .setMinP(0.05)
+  .setNPredict(64)
+  .setNProbs(0)
+  .setPenalizeNl(false)
+  .setRepeatLastN(256)
+  .setRepeatPenalty(1.1)
+  .setStopStrings(Array("</s>", "<|im_end|>", "User:"))
+  .setTemperature(0.2)
+  .setTfsZ(1)
+  .setTypicalP(1)
+  .setTopK(40)
+  .setTopP(0.95)
+
+val pipeline = new Pipeline().setStages(Array(
+  document_assembler,
+  image_assembler,
+  autoGGUFVisionModel
+))
+
+val model = pipeline.fit(data)
+val result = model.transform(data)
+
+result.selectExpr(
+  "reverse(split(image.origin, '/'))[0] as image_name",
+  "completions.result"
+).show(false)
+```
+</div>
+
+## Results
+
+```bash
+
++-------------------+-----------------------------------------------------------------------------------------------------------------------------------+
+|image_name         |result                                                                                                                             |
++-------------------+-----------------------------------------------------------------------------------------------------------------------------------+
+|prescription_02.png|["Medical prescription for systemic lupus erythematosus and scleroderma overlap with interstitial lung disease, dated 02/07/2021."]|
+|prescription_01.png|["Prescription for malaria treatment, dated 30-Aug-2023, from SMS Hospital."]                                                      |
++-------------------+-----------------------------------------------------------------------------------------------------------------------------------+
+
+```
+
+{:.model-param}
+## Model Information
+
+{:.table-model}
+|---|---|
+|Model Name:|qwen2.5_vl_7b_instruct_q16_gguf|
+|Compatibility:|Spark NLP 6.1.1+|
+|License:|Open Source|
+|Edition:|Official|
+|Input Labels:|[caption_document, image_assembler]|
+|Output Labels:|[completions]|
+|Language:|en|
+|Size:|13.3 GB|
diff --git a/docs/_posts/DevinTDHa/2025-09-01-bge_reranker_v2_m3_Q4_K_M_en.md b/docs/_posts/DevinTDHa/2025-09-01-bge_reranker_v2_m3_Q4_K_M_en.md
@@ -0,0 +1,70 @@
+---
+layout: model
+title: BGE Reranker V2 M3 Q4_K_M GGUF
+author: John Snow Labs
+name: bge_reranker_v2_m3_Q4_K_M
+date: 2025-09-01
+tags: [llamacpp, gguf, reranker, bge, en, open_source]
+task: Reranking
+language: en
+edition: Spark NLP 6.1.2
+spark_version: 3.0
+supported: true
+engine: llamacpp
+annotator: AutoGGUFReranker
+article_header:
+  type: cover
+use_language_switcher: "Python-Scala-Java"
+---
+
+## Description
+
+Lightweight reranker model, possesses strong multilingual capabilities, easy to deploy, with fast inference.
+
+{:.btn-box}
+<button class="button button-orange" disabled>Live Demo</button>
+<button class="button button-orange" disabled>Open in Colab</button>
+[Download](https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/bge_reranker_v2_m3_Q4_K_M_en_6.1.2_3.0_1756718229635.zip){:.button.button-orange.button-orange-trans.arr.button-icon}
+[Copy S3 URI](s3://auxdata.johnsnowlabs.com/public/models/bge_reranker_v2_m3_Q4_K_M_en_6.1.2_3.0_1756718229635.zip){:.button.button-orange.button-orange-trans.button-icon.button-copy-s3}
+
+## How to use
+
+
+
+<div class="tabs-box" markdown="1">
+{% include programmingLanguageSelectScalaPythonNLU.html %}
+```python
+import sparknlp
+from sparknlp.base import *
+from sparknlp.annotator import *
+from pyspark.ml import Pipeline
+document = DocumentAssembler() \n    .setInputCol("text") \n    .setOutputCol("document")
+reranker = AutoGGUFReranker.pretrained("bge_reranker_v2_m3_Q4_K_M") \n    .setInputCols(["document"]) \n    .setOutputCol("reranked_documents") \n    .setBatchSize(4) \n    .setQuery("A man is eating pasta.")
+pipeline = Pipeline().setStages([document, reranker])
+data = spark.createDataFrame([
+    ["A man is eating food."],
+    ["A man is eating a piece of bread."],
+    ["The girl is carrying a baby."],
+    ["A man is riding a horse."]
+]).toDF("text")
+result = pipeline.fit(data).transform(data)
+result.select("reranked_documents").show(truncate = False)
+# Each document will have a relevance_score in metadata showing how relevant it is to the query
+
+```
+
+</div>
+
+{:.model-param}
+## Model Information
+
+{:.table-model}
+|---|---|
+|Model Name:|bge_reranker_v2_m3_Q4_K_M|
+|Compatibility:|Spark NLP 6.1.2+|
+|License:|Open Source|
+|Edition:|Official|
+|Input Labels:|[document]|
+|Output Labels:|[reranked_documents]|
+|Language:|en|
+|Size:|416.0 MB|