google · cyyever · Aug 24, 2025 · Aug 26, 2025 · Aug 26, 2025 · fbarchard
diff --git a/src/operators/batch-matrix-multiply-nc.c b/src/operators/batch-matrix-multiply-nc.c
@@ -16,6 +16,7 @@
 #include "src/xnnpack/compute.h"
 #include "src/xnnpack/config-types.h"
 #include "src/xnnpack/config.h"
+#include "src/xnnpack/internal.h"
 #include "src/xnnpack/log.h"
 #include "src/xnnpack/math.h"
 #include "src/xnnpack/microfnptr.h"

diff --git a/src/xnnpack/internal.h b/src/xnnpack/internal.h
@@ -103,7 +103,7 @@ enum xnn_status xnn_setup_batch_matrix_multiply_nc_qp8_f32_qc8w(
     xnn_operator_t batch_matrix_multiply_op,  //
     void* workspace,                          //
     const int8_t* input_a,                    //
-    const int8_t* input_b,                    //
+    const float* input_b,                     //
     float* output);
 
 enum xnn_status xnn_create_convert_nc_f32_qp8(
@@ -258,7 +258,7 @@ enum xnn_status xnn_create_batch_matrix_multiply_nc_pf16(
     uint32_t flags, xnn_operator_t* batch_matrix_multiply_op_out);
 
 enum xnn_status xnn_create_batch_matrix_multiply_nc_pf16_const_weights(
-    size_t batch_size_b, size_t k, size_t n, const void* data_b, uint32_t flags,
+    size_t batch_size_b, size_t k, size_t n, const xnn_float16* data_b, uint32_t flags,
     xnn_operator_t* batch_matrix_multiply_op_out);
 
 enum xnn_status xnn_reshape_batch_matrix_multiply_nc_pf16(
@@ -476,7 +476,7 @@ enum xnn_status xnn_reshape_batch_matrix_multiply_nc_qdu8_f32_qc8w(
 
 enum xnn_status xnn_setup_batch_matrix_multiply_nc_qdu8_f32_qc8w(
     xnn_operator_t batch_matrix_multiply_op, void* workspace,
-    const int8_t* input_a, const int8_t* input_b,
+    const int8_t* input_a, const float* input_b,
     const struct xnn_quantization_params* quantization_params, float* output);
 
 enum xnn_status xnn_create_fully_connected_nc_pf16(