ログファイル

本ツールのログファイルについて説明します。

はじめに

本ツールが出力するログには以下のものがあります。

  • interactive (対話型インタフェース)
  • judge (状況確認)
  • test_sequence (テストシーケンス=自動チェック)
  • program_log (開発者向け)
  • stats (コスト計測用)

ログファイルが保存されるディレクトリの構成は以下の通りです。

log/
    YYYYmmDD-HHMMSS/
        interactive/
        judge/
        test_sequence/
        program_log/
        stats/

各種ログファイル

以下に個々のログファイルについて説明します。

YYYYmmDD-HHMMSS は日時を示しています。
例:20250301-133045(2025年3月1日13時30分45秒)

log

ログのトップフォルダです。 全てのログが本フォルダの配下に保存されます。

log/

YYYYmmDD-HHMMSS

ログのトップフォルダの下に、ツールの起動毎にフォルダを生成します。

log/
    YYYYmmDD-HHMMSS/
    YYYYmmDD-HHMMSS/
    ...

interactive

ツールの起動毎に生成されるフォルダの下に、対話型インタフェースの実行結果がログに保存されます。

対象となる操作:

  • GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 対話型インタフェース
log/
    YYYYmmDD-HHMMSS/
        interactive/
            YYYYmmDD-HHMMSS/
                auto_play_YYYYmmDD-HHMMSS/
                    *.png
                    log.md
            YYYYmmDD-HHMMSS/
            ...

対話型インタフェースを実行する度に interactive フォルダの下に新しい YYYYmmDD-HHMMSS フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS フォルダが生成されます。

auto_play_YYYYmmDD-HHMMSS 配下のログは、ゲーム画面のスクリーンショット画像と、Markdown ファイルから構成されます。

Markdown ファイル (log.md)

自動プレイログの Markdown ファイルの内容について説明します。

Log

ログの先頭/開始時刻

User Input

ユーザー入力

LLM Settings

設定内容

Step {N} LLM Request

{N} 回目の LLM へのリクエストデータ(N: ログ内通番)

  • Time: 時刻
  • model: モデル
  • top_p: top_p パラメータ
  • temperature: temperature パラメータ
  • Action List: アクションリスト
  • Image: 画像
Step {N} LLM response(自動プレイの場合)

{N} 回目の LLM からのレスポンスデータ (N: ログ内通番)

  • time: 時刻
  • task_done: 完了判定
  • action_idx: 実行すべきアクションの ID
  • additional_info: 追加情報
  • summary: 要約
  • explain: 現状説明
  • plan: 目的達成のためのプラン
  • Tokens and Cost
    • prompt_tokens: プロンプトのトークン数
    • cached_tokens: プロンプトのトークン数のうちキャッシュされたトークン数
    • completion_tokens: レスポンスのトークン数
    • total_tokens: 送受信したトークン数
    • cost: 今回の送受信のコスト
    • total_cost: 今回の自動プレイ内での累積コスト
Step {N} LLM response(状況確認の場合)

{N} 回目の LLM からのレスポンスデータ (N: ログ内通番, 状況確認の場合は 0 固定)

  • time: 時刻
  • outcome: 判定結果 (True or False)
  • analysis: 分析内容

judge

ツールの起動毎に生成されるフォルダの下に、状況確認の実行結果がログに保存されます。

対象となる操作:

  • GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 状況確認
log/
    YYYYmmDD-HHMMSS/
        judge/
            YYYYmmDD-HHMMSS/
                auto_play_YYYYmmDD-HHMMSS/
                    *.png
                    log.md
            YYYYmmDD-HHMMSS/
            ...

状況確認を実行する度に judge フォルダの下に新しい YYYYmmDD-HHMMSS フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS フォルダが生成されます。

auto_play_YYYYmmDD-HHMMSS 配下のログは interactive と同様です。

test_sequence

ツールの起動毎に生成されるフォルダの下に、テストシーケンス(自動チェック)の実行結果がログに保存されます。

対象となる操作:

  • GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 自動チェック
  • CUI ツール (auto_check_cui)
log/
    YYYYmmDD-HHMMSS/
        test_sequence/
            YYYYmmDD-HHMMSS/
                auto_check/
                    check_result.md
                    *.png
                auto_play_YYYYmmDD-HHMMSS/
                    *.png
                    log.md
                auto_play_YYYYmmDD-HHMMSS/
                ...
            YYYYmmDD-HHMMSS/
            ...

テストシーケンスを実行する度に test_sequence フォルダの下に新しい YYYYmmDD-HHMMSS フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS 及び auto_check フォルダが生成されます。

配下の auto_play_YYYYmmDD-HHMMSS フォルダはテストシーケンスに含まれる AutoPlay または Judge が実行される度に生成されます。

auto_play_YYYYmmDD-HHMMSS 配下のログは interactive, judge と同様です。

program_log

ツールの起動毎に生成されるフォルダの下に、ツール開発者向けのログを作成します。
(このログはツールの不具合調査を円滑に行うためのもので、ツール起動毎に生成されます。)

GUI ツール (general_agent_mobile) と CUI ツール (auto_check_cui) のログは共に同じ名前のフォルダに (program_log) 保存されます。

log/
    YYYYmmDD-HHMMSS/
        program_log/
            graph.log
            llm.log
            main.log
            root.log

stats

ツールの起動毎に生成されるフォルダの下に、コスト計測用のログを作成します。
(このログはツール起動毎に生成されます。)

log/
    YYYYmmDD-HHMMSS/
        stats/
            stats.log