feat: 토큰 사용량 및 비용 계산 기능 추가 및 커밋 메시지 생성 로직 개선

WoongheeLee · WoongheeLee · commit aedb540de1b7 · 2025-04-20T17:24:56.000+09:00
diff --git a/commitgen/generator.py b/commitgen/generator.py
@@ -1,10 +1,18 @@
 import time 
 import requests
+import tiktoken
 from commitgen.config import load_api_key, load_prompt_template
 
 
 # --- constants
-LLM_MODEL = 'gpt-4o-mini'
+MODEL_PRICING = {
+    "gpt-4": {"prompt": 0.03, "completion": 0.06},
+    "gpt-4.0": {"prompt": 0.03, "completion": 0.06},
+    "gpt-4.1": {"prompt": 0.03, "completion": 0.06},
+    "gpt-3.5-turbo": {"prompt": 0.0015, "completion": 0.002},
+}
+
+LLM_MODEL = 'gpt-4.1'
 OpenAI_API = load_api_key()
 
 MAX_RETRIES = 5 
@@ -17,32 +25,46 @@
 
 
 # --- utils 
+def count_tokens(messages, model="gpt-4"):
+    """Estimate number of tokens used in messages for a chat completion."""
+    try:
+        encoding = tiktoken.encoding_for_model(model)
+    except KeyError:
+        encoding = tiktoken.get_encoding("cl100k_base")  # fallback
+
+    num_tokens = 0
+    for message in messages:
+        num_tokens += 4  # role, name overhead
+        for key, value in message.items():
+            num_tokens += len(encoding.encode(value))
+    num_tokens += 2  # reply priming
+    return num_tokens
+
+
 def get_openai_api_result(
         system_prompt='', 
         user_prompt='', 
         llm_model=LLM_MODEL, 
         headers=HEADERS,
         max_retries=MAX_RETRIES, 
         retry_delay=RETRY_DELAY,
-        ): 
+        return_usage=True
+    ): 
+
+    messages = [
+        {"role": "system", "content": system_prompt},
+        {"role": "user", "content": user_prompt}
+    ]
 
     payload = {
         "model": llm_model, 
-        "messages": [
-            {
-                "role": "system", 
-                "content": system_prompt
-            }, 
-            {
-                "role": "user", 
-                "content": user_prompt
-            }
-        ], 
+        "messages": messages,
         "max_tokens": 4096, 
         "temperature": 0, 
-        "top_p": .7,
+        "top_p": 0.7,
     }
 
+    # retry loop
     for attempt in range(max_retries): 
         response = requests.post(
             "https://api.openai.com/v1/chat/completions",
@@ -51,16 +73,36 @@ def get_openai_api_result(
         )
 
         if response.status_code == 200: 
-            result = response.json() 
-            content = result['choices'][0]['message']['content'] 
-            break 
+            result = response.json()
+            content = result['choices'][0]['message']['content']
+            usage = result.get("usage", {})
+            prompt_tokens = usage.get("prompt_tokens", 0)
+            completion_tokens = usage.get("completion_tokens", 0)
+            total_tokens = usage.get("total_tokens", prompt_tokens + completion_tokens)
+            break
         else: 
             if attempt < max_retries - 1:
                 time.sleep(retry_delay)
             else:
                 content = ''
-
-    return content
+                prompt_tokens = completion_tokens = total_tokens = 0
+
+    if return_usage:
+        pricing = MODEL_PRICING.get(llm_model, {"prompt": 0.03, "completion": 0.06})
+        input_cost = (prompt_tokens / 1000) * pricing["prompt"]
+        output_cost = (completion_tokens / 1000) * pricing["completion"]
+        total_cost = input_cost + output_cost
+
+        return content, {
+            "prompt_tokens": prompt_tokens,
+            "completion_tokens": completion_tokens,
+            "total_tokens": total_tokens,
+            "input_cost": input_cost,
+            "output_cost": output_cost,
+            "total_cost": total_cost
+        }
+    else:
+        return content
 
 
 def generate_commit_message(
@@ -87,5 +129,13 @@ def generate_commit_message(
 {git_diff_text}
 """
 
-    response = get_openai_api_result(system_prompt=system_prompt, user_prompt=user_prompt, llm_model=llm_model, max_retries=max_retries)
-    return response
+    message, usage = get_openai_api_result(
+        system_prompt=system_prompt,
+        user_prompt=user_prompt,
+        llm_model=llm_model,
+        max_retries=max_retries,
+        return_usage=True
+    )
+
+    return message, usage
+
diff --git a/main.py b/main.py
@@ -45,11 +45,18 @@ def main():
         return
 
     print(f"🤖 Generating commit message in {args.language} using GPT (model name: {args.model})...\n")
-    message = generate_commit_message(
+    message, usage = generate_commit_message(
         git_diff_text=git_diff_text,
         language=args.language, 
-        llm_model=LLM_MODEL,
-        )
+        llm_model=args.model,
+    )
+
+    print("\n📊 Token usage:")
+    print(f"   - Prompt tokens     : {usage['prompt_tokens']}")
+    print(f"   - Completion tokens : {usage['completion_tokens']}")
+    print(f"   - Total tokens      : {usage['total_tokens']}")
+    print(f"💰 Estimated cost      : ${usage['total_cost']:.5f} USD")
+    print()
 
     print("\n✅ Generated commit message:\n")
     print(message)