ホームAI Agentsfluffypony/dothething
// archived 2026-05-02
fluffypony

dothething

GitHub で見る →
52

// 概要

Dothething は、リサーチやブラウザ自動化、コード実行といった複雑なタスクを自律的に処理するローカル AI エージェントです。自ら作業を計画してツールを管理し、カスタムスキルや MCP サーバーで機能を拡張できます。永続的なセッションやコスト追跡、複数のエージェントを並列管理するオーケストレーターモードをサポートしています。

// 技術解説

Dothething (DTT) は、複雑で多段階のタスクを管理可能なサブタスクに分解し、多様なツールを活用して自律的に実行するように設計されたローカル AI エージェントです。そのアーキテクチャは、主要な意思決定者として OpenRouter 経由の Claude Opus を活用しつつ、要約や oracle ベースの検証に特化したモデルを採用することで、パフォーマンスとコストを最適化しています。ブラウザ自動化、ファイル操作、カスタムスキルの注入を統合することで、このプロジェクトは手動ワークフロー実行の課題を解決し、ユーザーがリサーチ、コーディング、データ抽出といったタスクを、自身の進捗と構成を管理するエージェントに委任できるようにします。

// 主要ハイライト

01
自律的なタスク分解により、エージェントはユーザーの絶え間ない介入なしに作業の計画、進捗の追跡、適切なツールの選択を行うことができます。
02
高度な Web インタラクション機能は、Notte と Camoufox を活用してコンテンツのスクレイピング、CAPTCHA の解決、複雑な多段階ブラウザワークフローの処理を行います。
03
拡張可能なスキルシステムにより、ユーザーは Markdown ファイルを介してカスタム動作を定義でき、それらをエージェントのコンテキストに直接注入したり、独立したサブタスクとして実行したりすることが可能です。
04
Orchestrator モードは、複数の並列エージェントを管理するためのターミナル UI を提供し、同時セッション間で作業を分散させるスマートランチャーを備えています。
05
コスト意識の高い設計には、Anthropic のプロンプトキャッシング、トークン使用量の追跡、およびステートフルなチェックポイント機能を備えた厳格な支出制限の設定が含まれています。
06
既存のインフラストラクチャとのシームレスな統合は、MCP サーバーの互換性と、複雑なビルドやデバッグタスクのための永続的なシェル環境を通じてサポートされています。

// ユースケース

01
Notte や Camoufox を活用した自動 Web リサーチおよびブラウザ操作
02
ファイル編集やシェルコマンド実行、コード開発タスクの自動化
03
コストやループ制限を備えた複雑なプロジェクト向けのマルチエージェントオーケストレーション

// クイックスタート

開始するには、リポジトリをクローンし、タスクを記述したプロンプトを指定して dtt.sh スクリプトを実行してください。システムは自動的に Python の仮想環境をセットアップし、必要な API キーの入力を求めます。これらは ~/.dtt/env に安全に保存されます。その後、--orchestrator フラグを使用して並列タスクを実行したり、--resume フラグを使用して以前の作業を継続したりするなど、高度な機能を探索できます。