datastax
diff --git a/‎src/java/org/apache/cassandra/config/CassandraRelevantProperties.java‎
Lines changed: 2 additions & 0 deletions b/‎src/java/org/apache/cassandra/config/CassandraRelevantProperties.java‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/java/org/apache/cassandra/index/sai/disk/format/Version.java‎
Lines changed: 3 additions & 0 deletions b/‎src/java/org/apache/cassandra/index/sai/disk/format/Version.java‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/java/org/apache/cassandra/index/sai/disk/vector/CassandraDiskAnn.java‎
Lines changed: 1 addition & 1 deletion b/‎src/java/org/apache/cassandra/index/sai/disk/vector/CassandraDiskAnn.java‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/java/org/apache/cassandra/index/sai/disk/vector/CassandraOnHeapGraph.java‎
Lines changed: 19 additions & 3 deletions b/‎src/java/org/apache/cassandra/index/sai/disk/vector/CassandraOnHeapGraph.java‎
Lines changed: 19 additions & 3 deletions
@@ -415,6 +415,8 @@ public enum CassandraRelevantProperties
     SAI_VECTOR_FLUSH_THRESHOLD_MAX_ROWS("cassandra.sai.vector_flush_threshold_max_rows", "-1"),
     // Use non-positive value to disable it. Period in millis to trigger a flush for SAI vector memtable index.
     SAI_VECTOR_FLUSH_PERIOD_IN_MILLIS("cassandra.sai.vector_flush_period_in_millis", "-1"),
+    // Use nvq when building graphs in compaction
+    SAI_VECTOR_ENABLE_NVQ("cassandra.sai.vector.enable_nvq", "true"),
     /**
      * Whether to disable auto-compaction
      */
 
@@ -39,6 +39,7 @@
 import org.apache.cassandra.index.sai.disk.v5.V5OnDiskFormat;
 import org.apache.cassandra.index.sai.disk.v6.V6OnDiskFormat;
 import org.apache.cassandra.index.sai.disk.v7.V7OnDiskFormat;
+import org.apache.cassandra.index.sai.disk.v8.V8OnDiskFormat;
 import org.apache.cassandra.index.sai.utils.TypeUtil;
 import org.apache.cassandra.io.sstable.format.SSTableFormat;
 import org.apache.cassandra.schema.SchemaConstants;
@@ -75,6 +76,8 @@ public class Version implements Comparable<Version>
     public static final Version EC = new Version("ec", V7OnDiskFormat.instance, (c, i, g) -> stargazerFileNameFormat(c, i, g, "ec"));
     // total terms count serialization in index metadata, enables ANN_USE_SYNTHETIC_SCORE by default
     public static final Version ED = new Version("ed", V7OnDiskFormat.instance, (c, i, g) -> stargazerFileNameFormat(c, i, g, "ed"));
+    // Vector feature: NVQ TODO is this EE or FA?
+    public static final Version EE = new Version("EE", V8OnDiskFormat.instance, (c, i, g) -> stargazerFileNameFormat(c, i, g, "ee"));
 
     // These are in reverse-chronological order so that the latest version is first. Version matching tests
     // are more likely to match the latest version, so we want to test that one first.
 
@@ -124,7 +124,7 @@ public CassandraDiskAnn(SSTableContext sstableContext, SegmentMetadata.Component
                 // don't load full PQVectors, all we need is the metadata from the PQ at the start
                 pq = ProductQuantization.load(reader);
                 compression = new VectorCompression(VectorCompression.CompressionType.PRODUCT_QUANTIZATION,
-                                                    rawGraph.getDimension() * Float.BYTES,
+                                                    graph.getDimension() * Float.BYTES,
                                                     pq.compressedVectorSize());
             }
             else
 
@@ -48,9 +48,11 @@
 import io.github.jbellis.jvector.graph.disk.feature.Feature;
 import io.github.jbellis.jvector.graph.disk.feature.FeatureId;
 import io.github.jbellis.jvector.graph.disk.feature.InlineVectors;
+import io.github.jbellis.jvector.graph.disk.feature.NVQ;
 import io.github.jbellis.jvector.graph.similarity.DefaultSearchScoreProvider;
 import io.github.jbellis.jvector.quantization.BinaryQuantization;
 import io.github.jbellis.jvector.quantization.CompressedVectors;
+import io.github.jbellis.jvector.quantization.NVQuantization;
 import io.github.jbellis.jvector.quantization.ProductQuantization;
 import io.github.jbellis.jvector.quantization.VectorCompressor;
 import io.github.jbellis.jvector.util.Accountable;
@@ -64,6 +66,7 @@
 import io.github.jbellis.jvector.vector.types.VectorFloat;
 import io.github.jbellis.jvector.vector.types.VectorTypeSupport;
 import org.agrona.collections.IntHashSet;
+import org.apache.cassandra.config.CassandraRelevantProperties;
 import org.apache.cassandra.db.compaction.CompactionSSTable;
 import org.apache.cassandra.db.marshal.VectorType;
 import org.apache.cassandra.db.memtable.Memtable;
@@ -101,6 +104,9 @@ public enum PQVersion {
         V1, // includes unit vector calculation
     }
 
+    /** Whether to use NVQ when writing indexes (assuming all other conditions are met) */
+    private static final boolean ENABLE_NVQ = CassandraRelevantProperties.SAI_VECTOR_ENABLE_NVQ.getBoolean();
+
     /** minimum number of rows to perform PQ codebook generation */
     public static final int MIN_PQ_ROWS = 1024;
 
@@ -127,6 +133,8 @@ public enum PQVersion {
     // we don't need to explicitly close these since only on-heap resources are involved
     private final ThreadLocal<GraphSearcherAccessManager> searchers;
 
+    private final boolean writeNvq;
+
     /**
      * @param forSearching if true, vectorsByKey will be initialized and populated with vectors as they are added
      */
@@ -159,6 +167,9 @@ public CassandraOnHeapGraph(IndexContext context, boolean forSearching, Memtable
         allVectorsAreUnitLength = true;
 
         int jvectorVersion = context.version().onDiskFormat().jvectorFileFormatVersion();
+        // NVQ is only written during compaction to save on compute costs
+        writeNvq = ENABLE_NVQ && jvectorVersion >= 6 && !forSearching;
+
         // This is only a warning since it's not a fatal error to write without hierarchy
         if (indexConfig.isHierarchyEnabled() && jvectorVersion < 4)
             logger.warn("Hierarchical graphs configured but node configured with V3OnDiskFormat.JVECTOR_VERSION {}. " +
@@ -439,6 +450,9 @@ public SegmentMetadata.ComponentMetadataMap flush(IndexComponents.ForWrite perIn
 
         OrdinalMapper ordinalMapper = remappedPostings.ordinalMapper;
 
+        // Write the NVQ feature, optimize when https://github.com/datastax/jvector/pull/549 is merged
+        NVQuantization nvq = writeNvq ? NVQuantization.compute(vectorValues, 2) : null;
+
         IndexComponent.ForWrite termsDataComponent = perIndexComponents.addOrGet(IndexComponentType.TERMS_DATA);
         var indexFile = termsDataComponent.file();
         long termsOffset = SAICodecUtils.headerSize();
@@ -450,7 +464,7 @@ public SegmentMetadata.ComponentMetadataMap flush(IndexComponents.ForWrite perIn
                                .withStartOffset(termsOffset)
                                .withVersion(perIndexComponents.version().onDiskFormat().jvectorFileFormatVersion())
                                .withMapper(ordinalMapper)
-                               .with(new InlineVectors(vectorValues.dimension()))
+                               .with(nvq != null ? new NVQ(nvq) : new InlineVectors(vectorValues.dimension()))
                                .build())
         {
             SAICodecUtils.writeHeader(pqOutput);
@@ -483,8 +497,10 @@ public SegmentMetadata.ComponentMetadataMap flush(IndexComponents.ForWrite perIn
 
             // write the graph
             var start = System.nanoTime();
-            var suppliers = Feature.singleStateFactory(FeatureId.INLINE_VECTORS, nodeId -> new InlineVectors.State(vectorValues.getVector(nodeId)));
-            indexWriter.write(suppliers);
+            var supplier = nvq != null
+                            ? Feature.singleStateFactory(FeatureId.NVQ_VECTORS, nodeId -> new NVQ.State(nvq.encode(vectorValues.getVector(nodeId))))
+                            : Feature.singleStateFactory(FeatureId.INLINE_VECTORS, nodeId -> new InlineVectors.State(vectorValues.getVector(nodeId)));
+            indexWriter.write(supplier);
             SAICodecUtils.writeFooter(indexWriter.getOutput(), indexWriter.checksum());
             logger.info("Writing graph took {}ms", (System.nanoTime() - start) / 1_000_000);
             long termsLength = indexWriter.getOutput().position() - termsOffset;
Original file line number	Diff line number	Diff line change
`@@ -124,7 +124,7 @@ public CassandraDiskAnn(SSTableContext sstableContext, SegmentMetadata.Component`
`124`	`124`	`// don't load full PQVectors, all we need is the metadata from the PQ at the start`
`125`	`125`	`pq = ProductQuantization.load(reader);`
`126`	`126`	`compression = new VectorCompression(VectorCompression.CompressionType.PRODUCT_QUANTIZATION,`
`127`		`- rawGraph.getDimension() * Float.BYTES,`
	`127`	`+ graph.getDimension() * Float.BYTES,`
`128`	`128`	`pq.compressedVectorSize());`
`129`	`129`	`}`
`130`	`130`	`else`