Log samples to converge

pgmpablo157321 · pgmpablo157321 · commit 05e7faef06ec · 2025-09-09T15:56:47.000-05:00
diff --git a/mlperf_logging/result_summarizer/compute_score/__main__.py b/mlperf_logging/result_summarizer/compute_score/__main__.py
@@ -87,6 +87,29 @@ def _find_benchmark(result_file, ruleset):
     return benchmark
 
 
+def _find_samples_to_converge(result_file, ruleset):
+    loglines, _ = parse_file(result_file, ruleset)
+    train_samples = None
+    epoch_num = None
+    samples_count = None
+    for logline in loglines:
+        if logline.key == "train_samples":
+            train_samples = logline.value["value"]
+        if logline.key == "eval_accuracy":
+            if "epoch_num" in logline.value["metadata"]:
+                epoch_num = logline.value["metadata"]["epoch_num"]
+            if "samples_count" in logline.value["metadata"]:
+                samples_count = logline.value["metadata"]["samples_count"]
+    if samples_count is not None:
+        return samples_count
+    if train_samples is not None and epoch_num is not None:
+        return train_samples * epoch_num
+    raise ValueError(
+        "Not enough values specified in result file. One of ('samples_count')"
+        "or ('train_samples' and 'epoch_num') is needed"
+    )
+
+
 args = get_compute_args()
 _reset_scaling(args.benchmark_folder)
 pattern = "{folder}/result_*.txt".format(folder=args.benchmark_folder)
@@ -142,7 +165,10 @@ def _find_benchmark(result_file, ruleset):
     print_benchmark_info(args, benchmark)
     mean_score = 0
     for file, s in scores_track.items():
-        print(f"Score - Time to Train (minutes) for {file}: {s}")
+        samples_to_converge = _find_samples_to_converge(file, args.ruleset)
+        print(
+            f"Score - Time to Train (minutes) for {file}: {s}. Samples to converge: {samples_to_converge}"
+        )
         mean_score += s
     mean_score /= len(result_files)
     mean_score *= scaling_factor