ログファイル
本ツールのログファイルについて説明します。
はじめに
本ツールが出力するログには以下のものがあります。
- interactive (対話型インタフェース)
- judge (状況確認)
- test_sequence (テストシーケンス=自動チェック)
- program_log (開発者向け)
- stats (コスト計測用)
ログファイルが保存されるディレクトリの構成は以下の通りです。
log/
YYYYmmDD-HHMMSS/
interactive/
judge/
test_sequence/
program_log/
stats/
各種ログファイル
以下に個々のログファイルについて説明します。
YYYYmmDD-HHMMSS は日時を示しています。
例:20250301-133045(2025年3月1日13時30分45秒)
log
ログのトップフォルダです。 全てのログが本フォルダの配下に保存されます。
log/
YYYYmmDD-HHMMSS
ログのトップフォルダの下に、ツールの起動毎にフォルダを生成します。
log/
YYYYmmDD-HHMMSS/
YYYYmmDD-HHMMSS/
...
interactive
ツールの起動毎に生成されるフォルダの下に、対話型インタフェースの実行結果がログに保存されます。
対象となる操作:
- GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 対話型インタフェース
log/
YYYYmmDD-HHMMSS/
interactive/
YYYYmmDD-HHMMSS/
auto_play_YYYYmmDD-HHMMSS/
*.png
log.md
YYYYmmDD-HHMMSS/
...
対話型インタフェースを実行する度に interactive
フォルダの下に新しい YYYYmmDD-HHMMSS
フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS
フォルダが生成されます。
auto_play_YYYYmmDD-HHMMSS
配下のログは、ゲーム画面のスクリーンショット画像と、Markdown ファイルから構成されます。
Markdown ファイル (log.md)
自動プレイログの Markdown ファイルの内容について説明します。
Log
ログの先頭/開始時刻
User Input
ユーザー入力
LLM Settings
設定内容
Step {N} LLM Request
{N} 回目の LLM へのリクエストデータ(N: ログ内通番)
- Time: 時刻
- model: モデル
- top_p: top_p パラメータ
- temperature: temperature パラメータ
- Action List: アクションリスト
- Image: 画像
Step {N} LLM response(自動プレイの場合)
{N} 回目の LLM からのレスポンスデータ (N: ログ内通番)
- time: 時刻
- task_done: 完了判定
- action_idx: 実行すべきアクションの ID
- additional_info: 追加情報
- summary: 要約
- explain: 現状説明
- plan: 目的達成のためのプラン
- Tokens and Cost
- prompt_tokens: プロンプトのトークン数
- cached_tokens: プロンプトのトークン数のうちキャッシュされたトークン数
- completion_tokens: レスポンスのトークン数
- total_tokens: 送受信したトークン数
- cost: 今回の送受信のコスト
- total_cost: 今回の自動プレイ内での累積コスト
Step {N} LLM response(状況確認の場合)
{N} 回目の LLM からのレスポンスデータ (N: ログ内通番, 状況確認の場合は 0
固定)
- time: 時刻
- outcome: 判定結果 (
True
orFalse
) - analysis: 分析内容
judge
ツールの起動毎に生成されるフォルダの下に、状況確認の実行結果がログに保存されます。
対象となる操作:
- GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 状況確認
log/
YYYYmmDD-HHMMSS/
judge/
YYYYmmDD-HHMMSS/
auto_play_YYYYmmDD-HHMMSS/
*.png
log.md
YYYYmmDD-HHMMSS/
...
状況確認を実行する度に judge
フォルダの下に新しい YYYYmmDD-HHMMSS
フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS
フォルダが生成されます。
auto_play_YYYYmmDD-HHMMSS
配下のログは interactive と同様です。
test_sequence
ツールの起動毎に生成されるフォルダの下に、テストシーケンス(自動チェック)の実行結果がログに保存されます。
対象となる操作:
- GUI ツール (general_agent_mobile) > コントロールサブウィンドウ > 自動チェック
- CUI ツール (auto_check_cui)
log/
YYYYmmDD-HHMMSS/
test_sequence/
YYYYmmDD-HHMMSS/
auto_check/
check_result.md
*.png
auto_play_YYYYmmDD-HHMMSS/
*.png
log.md
auto_play_YYYYmmDD-HHMMSS/
...
YYYYmmDD-HHMMSS/
...
テストシーケンスを実行する度に test_sequence
フォルダの下に新しい YYYYmmDD-HHMMSS
フォルダが、さらにその下に auto_play_YYYYmmDD-HHMMSS
及び auto_check
フォルダが生成されます。
配下の auto_play_YYYYmmDD-HHMMSS
フォルダはテストシーケンスに含まれる AutoPlay または Judge が実行される度に生成されます。
auto_play_YYYYmmDD-HHMMSS
配下のログは interactive, judge と同様です。
program_log
ツールの起動毎に生成されるフォルダの下に、ツール開発者向けのログを作成します。
(このログはツールの不具合調査を円滑に行うためのもので、ツール起動毎に生成されます。)
GUI ツール (general_agent_mobile) と CUI ツール (auto_check_cui) のログは共に同じ名前のフォルダに (
program_log
) 保存されます。
log/
YYYYmmDD-HHMMSS/
program_log/
graph.log
llm.log
main.log
root.log
stats
ツールの起動毎に生成されるフォルダの下に、コスト計測用のログを作成します。
(このログはツール起動毎に生成されます。)
log/
YYYYmmDD-HHMMSS/
stats/
stats.log