pi-autoresearch

AIAI Agent AutomationOptimizationBenchmarking

近期趋势热门

总收藏数156

在 GitHub 上查看完整项目前往 GitHub →

项目简介

pi-autoresearch 是 pi AI 编码代理的一个扩展，旨在为各种性能指标实现自主优化循环。它允许代理迭代测试想法、基准测试结果并保持改进，同时自动回滚性能回归。该系统提供实时仪表板和置信度评分，帮助开发人员区分真实的性能提升与基准测试噪声。

技术分析

pi-autoresearch 是 pi AI 编码代理的一个扩展，它实现了一个自主优化循环，使代理能够根据特定的性能指标迭代地测试、基准测试和改进代码。通过将领域无关的基础设施与领域特定的技能解耦，该项目允许开发人员自动化处理诸如减小包大小或优化测试速度等复杂任务，同时在重启后保持会话状态。它通过引入基于 Median Absolute Deviation 的置信度评分系统来解决基准测试数据噪声大的问题，确保改进在最终确定之前具有统计学意义。

核心亮点

实现自主优化循环，持续编辑、基准测试和评估代码以改进特定的性能目标。

通过 autoresearch.md 和 autoresearch.jsonl 提供持久的会话状态，使 AI 代理能够在重启后无缝恢复工作。

具备强大的置信度评分系统，使用 Median Absolute Deviation 来区分真正的性能提升与基准测试噪声。

包含 finalize 技能，可自动将成功的实验归类为干净、独立且可审查的 git 分支。

支持通过 shell 脚本进行可选的背压检查，以确保性能优化不会损害代码正确性或类型安全。

提供全面的 UI，包含实时状态小部件、内联结果表以及用于监控实验进度的全屏仪表板。

典型使用场景

测试速度、构建时间和包大小的自动化优化

LLM 训练损失比率的持续监控与改进

使用 Lighthouse 分数对 Web 应用程序进行自主性能调优

快速开始

首先，使用命令 'pi install https://github.com/davebcn87/pi-autoresearch' 安装该扩展。安装完成后，在 pi 终端中运行 '/skill:autoresearch-create' 来启动会话，它将引导您配置优化目标、指标和目标命令。之后，您可以通过提供的仪表板快捷方式或 '/autoresearch export' 命令来监控自主循环。