1,264
// 项目简介
Mano-P 是一个 GUI-VLA Agent 项目,旨在 Mac mini 和 MacBook 等边缘设备上实现自主且私密的任务执行。它利用先进的强化学习和边缘原生推理技术,执行复杂的 GUI 自动化、跨系统数据集成以及长任务规划。该项目提供了一种安全且优先本地化的解决方案,在无需云端 API 调用且保持跨基准测试高性能的同时,确保了数据隐私。
// 技术分析
Mano-P 是一个专为边缘设备设计的 GUI-VLA (Vision-Language-Action) 智能体框架,通过在 Apple Silicon 硬件上实现本地运行来优先保障隐私。它解决了对自主、安全且复杂的 GUI 自动化的迫切需求,无需依赖基于云的 API,从而克服了传统人机协作工作流中的瓶颈。该项目采用了复杂的“思考-行动-验证”推理机制和三阶段渐进式训练方法,以实现高精度的任务执行。一个显著的技术权衡是其对边缘原生优化的关注,利用混合精度量化和视觉 token 剪枝,在 Mac mini 等受限硬件上保持高性能。
// 核心亮点
01
在 OSWorld 基准测试中实现了 58.2% 的成功率,在专用 GUI 智能体模型中排名第一。
02
支持在 Apple M4 芯片上完全本地化运行,确保所有敏感截图和任务数据保留在设备端。
03
支持复杂的自主业务流程自动化,包括端到端的软件构建流水线。
04
包含 Cider SDK,提供 W8A8/W4A8 激活量化原语,从而在 Apple Silicon 上实现显著的预填充加速。
05
展示了高性能推理能力,4B 模型在 Apple M5 Pro 硬件上可达到约 80 tokens/s 的速度。
06
提供了一个端到端的自主应用构建循环 (Mano-AFK),无需人工干预即可处理需求、编码、部署和测试。
// 典型使用场景
01
用于自主界面操作的复杂 GUI 自动化
02
端到端的自主软件构建流水线
03
私密的本地化业务流程与任务执行
// 快速开始
要开始使用 Mano-P,开发者应首先探索该项目的分阶段开源路线图,从用于构建任务工作流的 Mano-CUA Skills 开始。对于本地部署,请确保您拥有至少 32GB 内存的 Apple Silicon 设备(M4 芯片或更高版本)。未来的更新将提供具体的 SDK 安装说明以及针对直接硬件使用和计算棒集成的部署指南。