Fix usage miscalculation.

ericdallo · ericdallo · commit 2f5090127a6e · 2025-08-04T21:08:53.000-03:00
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -2,6 +2,8 @@
 
 ## Unreleased
 
+- Fix usage miscalculation.
+
 ## 0.14.3
 
 - Fix reason-id on openai models afecting chat thoughts messages.
diff --git a/src/eca/features/chat.clj b/src/eca/features/chat.clj
@@ -83,7 +83,7 @@
   [{:keys [input-tokens output-tokens
            input-cache-creation-tokens input-cache-read-tokens]}
    model
-   {:keys [chat-id db*] :as chat-ctx}]
+   {:keys [chat-id db*]}]
   (when (and output-tokens input-tokens)
     (swap! db* update-in [:chats chat-id :total-input-tokens] (fnil + 0) input-tokens)
     (swap! db* update-in [:chats chat-id :total-output-tokens] (fnil + 0) output-tokens)
@@ -98,13 +98,11 @@
           total-input-cache-read-tokens (get-in db [:chats chat-id :total-input-cache-read-tokens] nil)
           total-input-cache-tokens (or total-input-cache-creation-tokens 0)
           total-output-tokens (get-in db [:chats chat-id :total-output-tokens] 0)]
-      (send-content! chat-ctx :system
-                     (assoc-some {:type :usage
-                                  :message-output-tokens output-tokens
-                                  :message-input-tokens (+ input-tokens message-input-cache-tokens)
-                                  :session-tokens (+ total-input-tokens total-input-cache-tokens total-output-tokens)}
-                                 :message-cost (tokens->cost input-tokens input-cache-creation-tokens input-cache-read-tokens output-tokens model db)
-                                 :session-cost (tokens->cost total-input-tokens total-input-cache-creation-tokens total-input-cache-read-tokens total-output-tokens model db))))))
+      (assoc-some {:message-output-tokens output-tokens
+                   :message-input-tokens (+ input-tokens message-input-cache-tokens)
+                   :session-tokens (+ total-input-tokens total-input-cache-tokens total-output-tokens)}
+                  :message-cost (tokens->cost input-tokens input-cache-creation-tokens input-cache-read-tokens output-tokens model db)
+                  :session-cost (tokens->cost total-input-tokens total-input-cache-creation-tokens total-input-cache-read-tokens total-output-tokens model db)))))
 
 (defn ^:private message->decision [message]
   (let [slash? (string/starts-with? message "/")
@@ -170,6 +168,10 @@
                                     (send-content! chat-ctx :system {:type :progress
                                                                      :state :running
                                                                      :text "Generating"}))
+      :on-usage-updated (fn [usage]
+                          (send-content! chat-ctx :system
+                                         (merge {:type :usage}
+                                                (usage-msg->usage usage model chat-ctx))))
       :on-message-received (fn [{:keys [type] :as msg}]
                              (assert-chat-not-stopped! chat-ctx)
                              (case type
@@ -188,10 +190,6 @@
                                                 (finish-chat-prompt! :idle chat-ctx))
                                :finish (do
                                          (add-to-history! {:role "assistant" :content @received-msgs*})
-                                         (when-let [usage (usage-msg->usage (:usage msg) model chat-ctx)]
-                                           (send-content! chat-ctx :system
-                                                          (merge usage
-                                                                 {:type :usage})))
                                          (finish-chat-prompt! :idle chat-ctx))))
       :on-prepare-tool-call (fn [{:keys [id name arguments-text]}]
                               (assert-chat-not-stopped! chat-ctx)
diff --git a/src/eca/llm_api.clj b/src/eca/llm_api.clj
@@ -81,7 +81,7 @@
 
 (defn complete!
   [{:keys [model model-config instructions reason? user-messages config on-first-response-received
-           on-message-received on-error on-prepare-tool-call on-tool-called on-reason
+           on-message-received on-error on-prepare-tool-call on-tool-called on-reason on-usage-updated
            past-messages tools]}]
   (let [first-response-received* (atom false)
         emit-first-message-fn (fn [& args]
@@ -114,7 +114,8 @@
                    :on-error on-error-wrapper
                    :on-prepare-tool-call on-prepare-tool-call-wrapper
                    :on-tool-called on-tool-called
-                   :on-reason on-reason-wrapper}]
+                   :on-reason on-reason-wrapper
+                   :on-usage-updated on-usage-updated}]
     (cond
       (contains? #{"o4-mini"
                    "o3"
diff --git a/src/eca/llm_providers/anthropic.clj b/src/eca/llm_providers/anthropic.clj
@@ -98,7 +98,7 @@
   [{:keys [model user-messages temperature instructions max-output-tokens
            api-url api-key reason? reason-tokens past-messages tools web-search]
     :or {temperature 1.0}}
-   {:keys [on-message-received on-error on-reason on-prepare-tool-call on-tool-called]}]
+   {:keys [on-message-received on-error on-reason on-prepare-tool-call on-tool-called on-usage-updated]}]
   (let [messages (concat (normalize-messages past-messages)
                          (normalize-messages user-messages))
         body (assoc-some
@@ -150,35 +150,38 @@
                                                                   :external-id (-> data :delta :signature)
                                                                   :id reason-id})
                                     nil)
-            "message_delta" (case (-> data :delta :stop_reason)
-                              "tool_use" (doseq [content-block (vals @content-block*)]
-                                           (when (= "tool_use" (:type content-block))
-                                             (let [function-name (:name content-block)
-                                                   function-args (:input-json content-block)
-                                                   {:keys [new-messages]} (on-tool-called {:id (:id content-block)
-                                                                                           :name function-name
-                                                                                           :arguments (json/parse-string function-args)})
-                                                   messages (-> (normalize-messages new-messages)
-                                                                add-cache-to-last-message)]
-                                               (base-request!
-                                                {:rid (llm-util/gen-rid)
-                                                 :body (assoc body :messages messages)
-                                                 :api-url api-url
-                                                 :api-key api-key
-                                                 :content-block* (atom nil)
-                                                 :on-error on-error
-                                                 :on-response handle-response}))))
-                              "end_turn" (do
-                                           (reset! content-block* {})
-                                           (on-message-received {:type :finish
-                                                                 :usage {:input-tokens (-> data :usage :input_tokens)
-                                                                         :input-cache-creation-tokens (-> data :usage :cache_creation_input_tokens)
-                                                                         :input-cache-read-tokens (-> data :usage :cache_read_input_tokens)
-                                                                         :output-tokens (-> data :usage :output_tokens)}
-                                                                 :finish-reason (-> data :delta :stop_reason)}))
-                              "max_tokens" (on-message-received {:type :limit-reached
-                                                                 :tokens (:usage data)})
-                              nil)
+            "message_delta" (do
+                              (when-let [usage (and (-> data :delta :stop_reason)
+                                                    (:usage data))]
+                                (on-usage-updated {:input-tokens (:input_tokens usage)
+                                                   :input-cache-creation-tokens (:cache_creation_input_tokens usage)
+                                                   :input-cache-read-tokens (:cache_read_input_tokens usage)
+                                                   :output-tokens (:output_tokens usage)}))
+                              (case (-> data :delta :stop_reason)
+                                "tool_use" (doseq [content-block (vals @content-block*)]
+                                             (when (= "tool_use" (:type content-block))
+                                               (let [function-name (:name content-block)
+                                                     function-args (:input-json content-block)
+                                                     {:keys [new-messages]} (on-tool-called {:id (:id content-block)
+                                                                                             :name function-name
+                                                                                             :arguments (json/parse-string function-args)})
+                                                     messages (-> (normalize-messages new-messages)
+                                                                  add-cache-to-last-message)]
+                                                 (base-request!
+                                                  {:rid (llm-util/gen-rid)
+                                                   :body (assoc body :messages messages)
+                                                   :api-url api-url
+                                                   :api-key api-key
+                                                   :content-block* (atom nil)
+                                                   :on-error on-error
+                                                   :on-response handle-response}))))
+                                "end_turn" (do
+                                             (reset! content-block* {})
+                                             (on-message-received {:type :finish
+                                                                   :finish-reason (-> data :delta :stop_reason)}))
+                                "max_tokens" (on-message-received {:type :limit-reached
+                                                                   :tokens (:usage data)})
+                                nil))
             nil))]
     (base-request!
      {:rid (llm-util/gen-rid)
diff --git a/src/eca/llm_providers/openai.clj b/src/eca/llm_providers/openai.clj
@@ -41,31 +41,31 @@
        (on-error {:exception e})))))
 
 (defn ^:private normalize-messages [past-messages]
-  (keep-indexed (fn [i {:keys [role content] :as msg}]
-                  (case role
-                    "tool_call" {:type "function_call"
-                                 :name (:name content)
-                                 :call_id (:id content)
-                                 :arguments (json/generate-string (:arguments content))}
-                    "tool_call_output"
-                    {:type "function_call_output"
-                     :call_id (:id content)
-                     :output (llm-util/stringfy-tool-result content)}
-                    ;; TODO include reason blocks
-                    "reason" nil
-                    (update msg :content (fn [c]
-                                           (if (string? c)
-                                             c
-                                             (mapv #(if (= "text" (name (:type %)))
-                                                      (assoc % :type (if (= "user" role)
-                                                                       "input_text"
-                                                                       "output_text"))
-                                                      %) c))))))
-                past-messages))
+  (keep (fn [{:keys [role content] :as msg}]
+          (case role
+            "tool_call" {:type "function_call"
+                         :name (:name content)
+                         :call_id (:id content)
+                         :arguments (json/generate-string (:arguments content))}
+            "tool_call_output"
+            {:type "function_call_output"
+             :call_id (:id content)
+             :output (llm-util/stringfy-tool-result content)}
+            ;; TODO include reason blocks
+            "reason" nil
+            (update msg :content (fn [c]
+                                   (if (string? c)
+                                     c
+                                     (mapv #(if (= "text" (name (:type %)))
+                                              (assoc % :type (if (= "user" role)
+                                                               "input_text"
+                                                               "output_text"))
+                                              %) c))))))
+        past-messages))
 
 (defn completion! [{:keys [model user-messages instructions reason? temperature api-key api-url
                            max-output-tokens past-messages tools web-search]}
-                   {:keys [on-message-received on-error on-prepare-tool-call on-tool-called on-reason]}]
+                   {:keys [on-message-received on-error on-prepare-tool-call on-tool-called on-reason on-usage-updated]}]
   (let [input (concat (normalize-messages past-messages)
                       (normalize-messages user-messages))
         tools (cond-> tools
@@ -149,11 +149,13 @@
 
             ;; done
             "response.completed"
-            (when-not (= "function_call" (-> data :response :output last :type))
-              (on-message-received {:type :finish
-                                    :usage {:input-tokens (-> data :response :usage :input_tokens)
-                                            :output-tokens (-> data :response :usage :output_tokens)}
-                                    :finish-reason (-> data :response :status)}))
+            (do
+              (on-usage-updated {:input-tokens (-> data :response :usage :input_tokens)
+                                 :output-tokens (-> data :response :usage :output_tokens)})
+              (when-not (= "function_call" (-> data :response :output last :type))
+                (on-message-received {:type :finish
+
+                                      :finish-reason (-> data :response :status)})))
             nil))]
     (base-completion-request!
      {:rid (llm-util/gen-rid)