davebcn87

pi-autoresearch

AI🌱 NEW PROJECT BOOST#AI Agent #Automation#Optimization#Benchmarking

115

// 项目简介

pi-autoresearch 是 pi AI 编码代理的一个扩展，通过测试、基准测试和优化代码变更来实现自主优化循环。它通过持久化会话工作流支持多种优化目标，例如测试速度、包大小和 LLM 训练指标。该工具包含一个实时仪表板、用于过滤噪声的置信度评分，以及将实验最终确定为干净且可审查分支的功能。

// 技术分析

pi-autoresearch 是 pi AI 编码代理的一个扩展，它通过基于特定性能指标进行迭代测试、基准测试和代码优化，从而促进自主优化循环。其架构将领域无关的基础设施与领域特定的技能分离开来，允许代理通过持久化日志文件和会话文档在重启后保持状态。这种设计通过自动化“尝试-测量-保留”循环解决了手动、重复基准测试的问题，尽管它需要仔细管理 API token 的使用和基准测试噪声，以确保结果的可靠性。

// 核心亮点

为测试速度、包大小和 LLM 训练指标等各种目标启用自主优化循环。

通过 autoresearch.jsonl 和 autoresearch.md 保持会话持久性，允许代理在重启或上下文重置后恢复工作。

提供使用中位数绝对偏差 (Median Absolute Deviation) 的置信度评分系统，以帮助区分真正的性能改进与基准测试噪声。

包含一个 finalize 功能，可将杂乱的实验分支整理为干净、独立且可审查的逻辑变更集。

支持通过 shell 脚本进行可选的背压检查，以确保性能优化不会损害代码的正确性。

提供带有键盘快捷键的实时仪表板和状态小部件，用于监控进度和管理实验状态。

// 典型使用场景

针对测试速度、构建时间和包大小的自动化性能优化

带有指标跟踪的自主 LLM 训练循环管理

具有自动化分支最终确定功能的系统化基准测试和回归测试

// 快速开始

要开始使用，请在终端运行 'pi install https://github.com/davebcn87/pi-autoresearch' 来安装该扩展。安装完成后，运行 '/skill:autoresearch-create' 命令启动会话，该命令将引导您配置优化目标、指标和目标文件。之后，您可以通过提供的仪表板或使用 '/autoresearch' 命令集来监控自主循环。