ログファイル
本ツールのログファイルについて説明します。
はじめに
本ツールが出力するログには以下のものがあります。
- interactive (対話型インタフェース)
- judge (状況確認)
- test_sequence (テストシーケンス=自動チェック)
- program_log (開発者向け)
- stats (コスト計測用)
ログファイルが保存されるディレクトリの構成は以下の通りです。
log/
    YYYYmmDD-HHMMSS/
        interactive/
        judge/
        test_sequence/
        program_log/
        stats/
各種ログファイル
以下に個々のログファイルについて説明します。
YYYYmmDD-HHMMSS は日時を示しています。
例:20250301-133045(2025年3月1日13時30分45秒)
log
ログのトップフォルダです。 全てのログが本フォルダの配下に保存されます。
log/
YYYYmmDD-HHMMSS
ログのトップフォルダの下に、ツールの起動毎にフォルダを生成します。
log/
    YYYYmmDD-HHMMSS/
    YYYYmmDD-HHMMSS/
    ...
interactive
ツールの起動毎に生成されるフォルダの下に、対話型インタフェースの実行結果がログに保存されます。
対象となる操作:
- GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 対話型インタフェース
log/
    YYYYmmDD-HHMMSS/
        interactive/
            YYYYmmDD-HHMMSS/
                auto_play_YYYYmmDD-HHMMSS/
                    *.png
                    log.md
            YYYYmmDD-HHMMSS/
            ...
対話型インタフェースを実行する度に interactive フォルダの下に新しい YYYYmmDD-HHMMSS フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS フォルダが生成されます。
auto_play_YYYYmmDD-HHMMSS 配下のログは、ゲーム画面のスクリーンショット画像と、Markdown ファイルから構成されます。
Markdown ファイル (log.md)
自動プレイログの Markdown ファイルの内容について説明します。
Log
ログの先頭/開始時刻
User Input
ユーザー入力
LLM Settings
設定内容
Step {N} LLM Request
{N} 回目の LLM へのリクエストデータ(N: ログ内通番)
- Time: 時刻
- model: モデル
- top_p: top_p パラメータ
- temperature: temperature パラメータ
- Action List: アクションリスト
- Image: 画像
Step {N} LLM response(自動プレイの場合)
{N} 回目の LLM からのレスポンスデータ (N: ログ内通番)
- time: 時刻
- task_done: 完了判定
- action_idx: 実行すべきアクションの ID
- additional_info: 追加情報
- summary: 要約
- explain: 現状説明
- plan: 目的達成のためのプラン
- Tokens and Cost - prompt_tokens: プロンプトのトークン数
- cached_tokens: プロンプトのトークン数のうちキャッシュされたトークン数
- completion_tokens: レスポンスのトークン数
- total_tokens: 送受信したトークン数
- cost: 今回の送受信のコスト
- total_cost: 今回の自動プレイ内での累積コスト
 
Step {N} LLM response(状況確認の場合)
{N} 回目の LLM からのレスポンスデータ (N: ログ内通番, 状況確認の場合は 0 固定)
- time: 時刻
- outcome: 判定結果 (TrueorFalse)
- analysis: 分析内容
judge
ツールの起動毎に生成されるフォルダの下に、状況確認の実行結果がログに保存されます。
対象となる操作:
- GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 状況確認
log/
    YYYYmmDD-HHMMSS/
        judge/
            YYYYmmDD-HHMMSS/
                auto_play_YYYYmmDD-HHMMSS/
                    *.png
                    log.md
            YYYYmmDD-HHMMSS/
            ...
状況確認を実行する度に judge フォルダの下に新しい YYYYmmDD-HHMMSS フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS フォルダが生成されます。
auto_play_YYYYmmDD-HHMMSS 配下のログは interactive と同様です。
test_sequence
ツールの起動毎に生成されるフォルダの下に、テストシーケンス(自動チェック)の実行結果がログに保存されます。
対象となる操作:
- GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 自動チェック
- CUI ツール (auto_check_cui)
log/
    YYYYmmDD-HHMMSS/
        test_sequence/
            YYYYmmDD-HHMMSS/
                auto_check/
                    check_result.md
                    *.png
                auto_play_YYYYmmDD-HHMMSS/
                    *.png
                    log.md
                auto_play_YYYYmmDD-HHMMSS/
                ...
            YYYYmmDD-HHMMSS/
            ...
テストシーケンスを実行する度に test_sequence フォルダの下に新しい YYYYmmDD-HHMMSS フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS 及び auto_check フォルダが生成されます。
配下の auto_play_YYYYmmDD-HHMMSS フォルダはテストシーケンスに含まれる AutoPlay または Judge が実行される度に生成されます。
auto_play_YYYYmmDD-HHMMSS 配下のログは interactive, judge と同様です。
program_log
ツールの起動毎に生成されるフォルダの下に、ツール開発者向けのログを作成します。
 (このログはツールの不具合調査を円滑に行うためのもので、ツール起動毎に生成されます。)
GUI ツール (general_agent_mobile) と CUI ツール (auto_check_cui) のログは共に同じ名前のフォルダに (
program_log) 保存されます。
log/
    YYYYmmDD-HHMMSS/
        program_log/
            graph.log
            llm.log
            main.log
            root.log
stats
ツールの起動毎に生成されるフォルダの下に、コスト計測用のログを作成します。
 (このログはツール起動毎に生成されます。)
log/
    YYYYmmDD-HHMMSS/
        stats/
            stats.log