26
// 概要
Browser Harness は、軽量で編集可能な CDP インターフェースを使用して、LLM とブラウザを直接接続します。このシステムにより、エージェントは実行中に独自のヘルパー関数を作成および改善し、複雑なタスクを処理できます。ユーザーは、このフレームワークを活用してブラウザのワークフローを自動化しつつ、エージェントが生成した再利用可能なドメインスキルのライブラリを構築できます。
// 技術解説
Browser Harness は、LLM を実際のブラウザに直接接続し、完全な操作の自由を優先する、軽量で編集可能な CDP ベースのインターフェースとして設計されています。エージェントが実行中に独自のヘルパー関数やドメイン固有のスキルを作成できるようにすることで、このプロジェクトは手動介入の必要性を最小限に抑える自己改善ループを生み出します。このアーキテクチャは、ブラウザ自動化の負担を静的なスクリプトからエージェントが作成する動的なコードへと移行させ、従来の Web 自動化ツールに共通する脆弱性を効果的に解決します。
// 主要ハイライト
01
中間層を介さず、Chrome への直接的で軽量な WebSocket 接続を提供し、ブラウザを完全に制御します。
02
エージェントが不足している機能を処理するために、独自のカスタムヘルパー関数をリアルタイムで作成および改善できるようにします。
03
エージェントが成功したタスクフローを再利用可能なドメイン固有のモジュールとして保存する、自己改善型のスキルシステムを備えています。
04
ステルス性とデプロイメントのために、プロキシおよび CAPTCHA 解決機能を組み込んだリモートブラウザ統合をサポートします。
05
約 592 行の Python コードというコンパクトなコードベースを維持し、透明性とメンテナンスの容易さを確保しています。
06
ユーザーが一般的な Web プラットフォーム向けのエージェント生成スキルフォルダーを共有できるようにすることで、コミュニティ主導の成長を促進します。
// ユースケース
01
CDP を介した LLM からブラウザへの直接制御
02
自己改善型のエージェントヘルパースクリプト
03
再利用可能なドメイン固有の自動化スキル
// クイックスタート
開始するには、install.md の手順に従ってブラウザ接続をブートストラップし、リポジトリをローカルの Chrome インスタンスにリンクしてください。Claude Code のような LLM を活用したコーディングアシスタントを使用して提供されたセットアッププロンプトを実行し、初期設定を自動化します。インストールが完了したら、タスクを実行し、エージェントが agent-workspace ディレクトリにドメイン固有のスキルを自動的に生成および保存できるようにします。