115
// 项目简介
pi-autoresearch 是 pi AI 编码代理的一个扩展,通过测试、基准测试和优化代码变更来实现自主优化循环。它通过持久化会话工作流支持多种优化目标,例如测试速度、包大小和 LLM 训练指标。该工具包含一个实时仪表板、用于过滤噪声的置信度评分,以及将实验最终确定为干净且可审查分支的功能。
// 技术分析
pi-autoresearch 是 pi AI 编码代理的一个扩展,它通过基于特定性能指标进行迭代测试、基准测试和代码优化,从而促进自主优化循环。其架构将领域无关的基础设施与领域特定的技能分离开来,允许代理通过持久化日志文件和会话文档在重启后保持状态。这种设计通过自动化“尝试-测量-保留”循环解决了手动、重复基准测试的问题,尽管它需要仔细管理 API token 的使用和基准测试噪声,以确保结果的可靠性。
// 核心亮点
01
为测试速度、包大小和 LLM 训练指标等各种目标启用自主优化循环。
02
通过 autoresearch.jsonl 和 autoresearch.md 保持会话持久性,允许代理在重启或上下文重置后恢复工作。
03
提供使用中位数绝对偏差 (Median Absolute Deviation) 的置信度评分系统,以帮助区分真正的性能改进与基准测试噪声。
04
包含一个 finalize 功能,可将杂乱的实验分支整理为干净、独立且可审查的逻辑变更集。
05
支持通过 shell 脚本进行可选的背压检查,以确保性能优化不会损害代码的正确性。
06
提供带有键盘快捷键的实时仪表板和状态小部件,用于监控进度和管理实验状态。
// 典型使用场景
01
针对测试速度、构建时间和包大小的自动化性能优化
02
带有指标跟踪的自主 LLM 训练循环管理
03
具有自动化分支最终确定功能的系统化基准测试和回归测试
// 快速开始
要开始使用,请在终端运行 'pi install https://github.com/davebcn87/pi-autoresearch' 来安装该扩展。安装完成后,运行 '/skill:autoresearch-create' 命令启动会话,该命令将引导您配置优化目标、指标和目标文件。之后,您可以通过提供的仪表板或使用 '/autoresearch' 命令集来监控自主循环。