ホームAgentMininglamp-AI/Mano-P
Mininglamp-AI

Mano-P

AI🌱 NEW PROJECT BOOST#Agent#Computer Vision#Edge Computing#LLM#Automation
GitHub で見る →
1,264

// 概要

Mano-P は Mac mini や MacBook などのエッジデバイス上で自律的かつプライベートなタスク実行を実現するために設計された GUI-VLA エージェントプロジェクトです。高度な強化学習とエッジネイティブな推論を活用し、複雑な GUI 自動化、システム横断的なデータ統合、および長期的なタスク計画を実行します。本プロジェクトはクラウド API 呼び出しを不要にしつつ、様々なベンチマークで高いパフォーマンスを維持するセキュアなローカルファーストのソリューションを提供します。

// 技術解説

Mano-P は、エッジデバイス向けに特別に設計された GUI-VLA (Vision-Language-Action) エージェントフレームワークであり、Apple Silicon ハードウェア上でのローカル実行を可能にすることでプライバシーを優先しています。クラウドベースの API に依存することなく、自律的で安全かつ複雑な GUI 自動化を実現するという重要なニーズに対応し、従来の human-in-the-loop ワークフローにおけるボトルネックを解消します。このプロジェクトでは、高度な 「think-act-verify」 推論メカニズムと 3 段階のプログレッシブなトレーニング手法を採用し、高精度なタスク実行を達成しています。注目すべき技術的なトレードオフとして、エッジネイティブな最適化に重点を置いており、Mac mini のような制約のあるハードウェア上で高いパフォーマンスを維持するために、混合精度量子化と視覚トークン剪定を活用しています。

// 主要ハイライト

01
OSWorld ベンチマークで 58.2% の成功率を達成し、専門的な GUI エージェントモデルの中で 1 位にランクインしました。
02
Apple M4 チップ上での完全なローカル実行を可能にし、機密性の高いスクリーンショットやタスクデータがすべてデバイス内に留まることを保証します。
03
エンドツーエンドのソフトウェア構築パイプラインを含む、複雑で自律的なビジネスプロセス自動化をサポートします。
04
Cider SDK を含んでおり、W8A8/W4A8 アクティベーション量子化プリミティブを提供することで、Apple Silicon 上での大幅なプリフィル高速化を実現します。
05
高性能な推論を実証しており、4B モデルは Apple M5 Pro ハードウェア上で約 80 tokens/s に達します。
06
人間の介入なしに要件定義、コーディング、デプロイ、テストを処理するエンドツーエンドの自律型アプリケーション構築ループ (Mano-AFK) を提供します。

// ユースケース

01
自律的なインターフェース操作のための複雑な GUI 自動化
02
エンドツーエンドの自律的なソフトウェア構築パイプライン
03
プライベートかつローカル環境でのビジネスプロセスおよびタスク実行

// クイックスタート

Mano-P の利用を開始するには、まずプロジェクトの段階的なオープンソースロードマップを確認し、タスクワークフローを構築するための Mano-CUA Skills から着手してください。ローカルデプロイメントには、32GB 以上の RAM を搭載した Apple Silicon デバイス (M4 チップ以降) が必要です。今後のアップデートで、直接的なハードウェア使用およびコンピュートスティック統合の両方に対応した、具体的な SDK インストール手順とデプロイメントガイドが提供される予定です。