agent-browser スキル設計書

Daemon常駐で warm start 178 ms

2 回目以降の screenshot は約 0.18 秒。AI エージェントが対話的にブラウザを操作する用途に最適。

CLIから直接操作

agent-browser open / snapshot / click / screenshot をシェルから即実行。Node.js スクリプト不要。

LLMフレンドリー要素参照

アクセシビリティツリー基準の @e1, @e2 参照で、LLM がスナップショットを読んでそのまま操作できる。

Playwrightフォールバック

agent-browser 未インストール環境では自動的に Playwright にフォールバック。段階的移行が可能。

背景と位置づけ

dev-workflow の /issue-test コマンドでは、E2E テスト・エビデンスキャプチャに Playwright を使用している。本スキルは Playwright を置き換えるのではなく、用途に応じて使い分けられる第 2 の選択肢 として位置づける。

当初の想定 vs 実測の結果

当初は「Rust 製だから Playwright より 100 倍軽い/速い」と考えていたが、実機ベンチマークの結果、下回りのブラウザは両者とも同じ chrome-headless-shell を使うため、性能は本質的に同等だと判明した（詳細はベンチマーク参照）。

agent-browser の真の価値は性能ではなく、AI エージェントとの親和性と運用形態にある:

daemon 常駐 → 2 回目以降の単発コマンドが 7 倍速い（warm start 178 ms vs cold start 1,229 ms）

CLI インタフェース → bash から直接呼べる、AI エージェントが Node.js スクリプトを書かなくて済む

アクセシビリティツリー基準の要素参照 @e1 → LLM がスナップショット出力から直接読んで操作できる

単体 Rust バイナリ → Node.js 非依存（Homebrew / Cargo 経由のインストール時）

スキルの位置づけ

dev-workflow スキル
  └── /issue-test コマンド
       ├── Playwright             ... 1 フロー内の連続 E2E、既存 Node.js エコシステム統合
       └── agent-browser（本スキル）... daemon 常駐 AI エージェント、CLI 統合、認証付き再利用

実測パフォーマンス比較

シナリオ	agent-browser	Playwright	どちらが速い？
Cold start (open+shot+close 1回)	1.21 s	1.23 s	≈ 同等
Warm start (daemon 常駐→shot のみ)	0.17 s	不可	agent-browser 専用
1 フロー内 5 連続 shot	1.86 s	1.30 s	Playwright 1.41x 速い
並列 3 セッション × 5 shot	1.86 s	—	—
メモリ (idle + 1 page)	290 MB	286 MB	≈ 同等
依存関係	単体バイナリ	Node.js + npm	agent-browser シンプル

シナリオ

agent-browser

Playwright

どちらが速い？

Cold start (open+shot+close 1回)

1.21 s

1.23 s

≈ 同等

Warm start (daemon 常駐→shot のみ)

0.17 s

不可

agent-browser 専用

1 フロー内 5 連続 shot

1.86 s

1.30 s

Playwright 1.41x 速い

並列 3 セッション × 5 shot

1.86 s

—

メモリ (idle + 1 page)

290 MB

286 MB

≈ 同等

依存関係

単体バイナリ

Node.js + npm

agent-browser シンプル

理由: 両者とも内部で同じ chrome-headless-shell を起動しているため、Chromium の性能に律速される。差が出るのは IPC オーバーヘッド（agent-browser は毎コマンド socket 経由 = +170ms）と Node.js 起動時間（Playwright は毎回のスクリプト起動 = +数百ms）だけ。

詳細な計測結果とシナリオ別のおすすめはベンチマークと使い分けガイドを参照。

agent-browser スキルAIエージェント向けCLIブラウザ自動化

Daemon常駐で warm start 178 ms

CLIから直接操作

LLMフレンドリー要素参照

Playwrightフォールバック

agent-browser スキル設計書

背景と位置づけ

当初の想定 vs 実測の結果

スキルの位置づけ

実測パフォーマンス比較

関連リンク

agent-browser スキルAIエージェント向けCLIブラウザ自動化

Daemon常駐で warm start 178 ms

CLIから直接操作

LLMフレンドリー要素参照

Playwrightフォールバック

agent-browser スキル設計書 ​

背景と位置づけ ​

当初の想定 vs 実測の結果 ​

スキルの位置づけ ​

実測パフォーマンス比較 ​

関連リンク ​

agent-browser スキル設計書

背景と位置づけ

当初の想定 vs 実測の結果

スキルの位置づけ

実測パフォーマンス比較

関連リンク