2026-04 · 172 个项目 · 按 HubLens 评分排名
FlashMLA 是一个高性能 Attention Kernels 库,专为驱动 DeepSeek-V3 和 DeepSeek-V3.2 模型而设计。它为预填充和解码阶段的稀疏和密集 Attention 机制提供了优化实现。该库支持 FP8 KV cache 等高级功能,并兼容包括 SM90 和 SM100 在内的多种 GPU 架构。
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在促进跨不同工业领域的大规模模型训练与推理。
PaddleOCR 是一个综合性工具包,旨在将图像和 PDF 文档转换为 Markdown 和 JSON 等结构化、适配 LLM 的数据格式。它具备最先进的视觉语言模型和高性能文本识别引擎,支持超过 100 种语言。该平台被广泛集成到主流 AI Agent 和 RAG 框架中,可在各种硬件后端上提供高效的部署选项。
ncnn 是一个专为移动平台深度优化的高性能神经网络前向计算框架。该框架无第三方依赖且具备跨平台特性,在手机 CPU 上的运行速度优于目前所有已知的开源框架。开发者可以利用 ncnn 轻松将深度学习模型移植到移动端,从而构建各类智能应用程序。
ncnn 是一个专为移动平台深度优化的高性能神经网络前向计算框架。该框架无第三方依赖且具备跨平台特性,在手机 CPU 上的运行速度优于目前所有已知的开源框架。开发者可以利用 ncnn 轻松将深度学习模型移植到移动端,从而构建各类智能应用程序。
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在促进跨不同工业领域的大规模模型训练与推理。
Thinking with Visual Primitives 引入了一种通过将空间标记直接交织到推理过程中来处理多模态大语言模型的新方法。该方法通过将抽象语言锚定到具体的物理坐标,解决了复杂结构任务中的引用鸿沟。该框架在保持高视觉标记效率的同时,通过压缩架构实现了具有前沿竞争力的性能。
Page Agent 是一个客户端库,支持直接在浏览器内通过自然语言控制网页界面。它利用基于文本的 DOM 操作与元素交互,无需截图或复杂的 headless browser 设置。开发者可以轻松集成此工具来构建 AI copilot、自动化表单填写或增强网页可访问性。
OpenSandbox 是一个专为 AI 应用设计的通用沙箱平台,支持 Docker 和 Kubernetes 等多种运行时。它提供多语言 SDK 和统一 API,以简化代码执行、智能体评估和浏览器自动化等任务。该平台通过容器运行时确保安全隔离,同时提供强大的网络控制和生命周期管理功能。
Skills CLI 为管理跨多种编码代理的可重用指令集提供了一个统一的接口。它允许开发人员轻松地从 GitHub、GitLab 和本地目录等各种来源安装、更新和删除技能。通过基于 YAML 的 markdown 文件标准化技能定义,它能够在不同的开发环境中实现一致的代理行为。
World Monitor 是一个由 AI 驱动的平台,它将全球新闻、地缘政治数据和基础设施追踪整合到一个统一的态势感知界面中。它配备了具有 45 个数据层的双地图引擎,并支持通过 Ollama 进行本地 AI 处理以增强隐私保护。该项目在多个平台上提供原生桌面体验,并为金融、技术和商品监控提供了专门的变体。
TileKernels 提供了一系列专为使用 TileLang 框架进行大语言模型操作而设计的高性能 GPU Kernels。该项目包含了针对 Mixture of Experts 路由、高级量化技术以及流形超连接操作的专门实现。这些 Kernels 旨在最大化硬件性能,目前已被应用于内部的训练和推理工作流中。
OpenSandbox 是一个专为 AI 应用设计的通用沙箱平台,支持 Docker 和 Kubernetes 等多种运行时。它提供多语言 SDK 和统一 API,以简化代码执行、智能体评估和浏览器自动化等任务。该平台通过容器运行时确保安全隔离,同时提供强大的网络控制和生命周期管理功能。
MNN 是一个高性能、轻量级的深度学习框架,专为移动端和嵌入式设备上的高效模型推理与训练而设计。它支持多种神经网络架构,并提供用于模型转换、压缩和通用计算的多种工具。该框架已广泛应用于包括阿里巴巴各类应用在内的生产环境,以实现端云协同的机器学习。
Weft 是一种旨在将 LLM、人类交互和基础设施集成到统一可视化工作流中的编程语言。它具备持久化执行功能以确保程序在崩溃后仍能运行,并通过类型化的模块化节点系统支持复杂逻辑。开发者无需手动配置,即可通过连接原生节点来构建和管理复杂的智能体系统。
DeepEP 是一款专为现代机器学习训练和推理设计的高性能通信库,特别专注于专家并行技术。该库利用轻量级的 Just-In-Time 编译模块和 NCCL Gin 后端,提供高吞吐量、低延迟的 GPU kernels。它支持流水线并行和远程内存访问等高级功能,并与之前版本相比显著降低了 SM 资源消耗。
DeepGEMM 是一个统一的 CUDA 库,专门为现代大语言模型提供高性能 Tensor Core 内核。它具备轻量级的 Just-In-Time 编译模块,无需在安装过程中进行 CUDA 编译。该库为各种矩阵运算(包括 FP8、FP4 和 BF16 GEMM)以及融合的 MoE 和 MQA 评分提供了专家级优化性能。
DeerFlow 是一款开源超级智能体框架,旨在编排子智能体、记忆和沙盒以执行复杂任务。该平台在 2.0 版本中进行了彻底重构,通过模块化的技能和工具架构提供了更强的可扩展性。它支持多种部署环境,包括本地开发和基于 Docker 的生产环境,并集成了对多种消息渠道的支持。
WeKnora 是一个基于 LLM 的开源框架,专为企业级文档理解、语义检索和自主推理而设计。它配备了用于处理复杂多步任务的 ReAct 智能体,以及能将原始文档提炼为结构化互联知识库的 Wiki 模式。该平台支持多源数据摄入、多种 LLM 集成以及灵活的部署选项,以确保完整的数据主权。
RuView 是一个基于边缘的感知平台,利用 WiFi Channel State Information (CSI) 来检测人员存在、生命体征和活动,无需摄像头或可穿戴设备。该系统通过低成本的 ESP32 硬件处理无线电信号干扰,以提供实时的空间智能和环境映射。它支持诸如 3D point cloud 生成、pose estimation 以及使用本地神经网络进行持久化数据存储等高级功能。
Hermes WebUI 提供了一个轻量级的深色主题浏览器界面,与 Hermes Agent CLI 功能完全对等。它采用三面板布局,涵盖聊天、文件管理和会话导航,无需复杂的构建步骤或框架。用户可以通过 SSH 隧道或移动设备安全地访问自托管代理,同时保持持久化记忆和跨会话上下文。
Voicebox 是一个全面的本地优先语音合成工作室,允许用户使用七种不同的 TTS 引擎进行语音克隆和语音生成。该平台具有用于创建复杂叙事的多轨时间轴编辑器,并支持高级后期处理效果以优化音频输出。它专为隐私和性能而设计,可在主流操作系统上原生运行,同时为开发者集成提供了强大的 REST API。
skills-manage 是一款基于 Tauri 开发的桌面应用程序,旨在集中管理跨多个平台的 AI coding agent 技能。它利用单一事实来源通过 symlinks 驱动各种 AI 工具,并支持广泛的编码和 lobster 相关平台。该应用程序提供了一个全面的界面,用于浏览市场、组织集合以及对技能库进行本地发现。
CC Switch 是一款桌面应用程序,旨在集中管理 Claude Code、Codex、Gemini CLI、OpenCode 和 OpenClaw。它通过提供带有 50 多个内置提供商预设和系统托盘快速切换功能的图形界面,消除了手动编辑配置文件的需求。该工具还具备 MCP 服务器、提示词和技能的统一管理功能,并支持跨设备云同步。
CL4R1T4S 是一个综合性存储库,致力于揭示主流 AI 模型和智能体所使用的隐藏系统 Prompt、准则及工具。通过记录这些不可见的指令,该项目旨在让用户更清晰地理解塑造 AI 行为和决策的底层框架。该平台鼓励社区贡献,以维护一个包含来自各行业领先 AI 提供商的提取式系统 Prompt 的最新集合。
此仓库提供了一系列精选的 DESIGN.md 文件,用于定义热门网站的视觉识别和设计系统。这些基于 markdown 的文档使 AI 编码代理无需复杂的工具或 Figma 导出即可理解并复制特定的 UI 风格。每个条目都包含详细的设计令牌、排版规则和组件样式,以确保 AI 生成的界面保持一致且像素级完美。
RAG-Anything 是一个综合性框架,旨在处理和查询包括文本、图像、表格和数学公式在内的多种文档类型。它基于 LightRAG 构建,提供了一个端到端的流水线,将多模态内容整合到统一的知识图谱中以实现智能检索。该系统通过提供单一且连贯的复杂文档分析接口,消除了对多种专用工具的需求。
OpenClaude 是一个开源的编码代理 CLI,支持多种云端和本地模型提供商。它提供了一个以终端为先的统一工作流,具备文件管理、bash 执行和代理任务等工具。用户可以轻松集成包括 OpenAI、Ollama 和 Gemini 在内的各种后端,同时利用代理路由和 gRPC 支持等高级功能。
Claude Code Game Studios 将标准的 AI 编码会话转变为结构化、专业的游戏开发环境。它利用由 49 个专业智能体、72 种工作流技能和自动化验证钩子组成的层级体系来维护项目组织和质量。该系统确保开发者在保持控制权的同时,从设计、编程和生产阶段的专家级指导中受益。
AgentKit 代码工坊是火山引擎推出的 AI Agent 开发平台示例仓库,旨在帮助开发者快速掌握智能体的构建与部署。该项目提供了从基础入门到复杂场景的多种代码示例,涵盖了多智能体协作、RAG 检索增强及工具调用等核心功能。开发者可以通过这些教程深入理解 AgentKit 的开发工具链,并将其高效集成到各类业务应用中。
Slime 是一个专门设计的后训练框架,旨在扩展大语言模型的强化学习。它集成了 Megatron-LM 以实现高性能训练,并结合 SGLang 提供灵活且高效的数据生成工作流。该架构将训练和部署过程解耦,使研究人员能够构建并部署复杂的智能体 RL 系统。
Omi 是一个开源平台,通过实时捕获并转录您的屏幕和对话内容,充当您的第二大脑。它提供 AI 驱动的摘要、待办事项以及一个能够记住您所见所闻的聊天界面。该系统支持跨平台集成,涵盖桌面端、移动设备以及专业的 AI 可穿戴设备。
ANOLISA 是 Anolis OS 的演进版本,专为在服务器端操作系统层面支持 AI agent 工作负载而设计。该项目提供了一套全面的组件,包括 AI 驱动的终端、安全内核以及可观测性工具。用户可以通过标准的 RPM 包安装方式,轻松地将这些功能集成到他们的系统中。
Toonflow-app 是一款面向短剧生产的 AI 工作台,通过无限画布和三层 Agent 协作体系实现从剧本到视频的全流程自动化。该平台支持章节事件图谱驱动的改编,并提供可编程的供应商系统以灵活接入多种 AI 模型。用户可利用其持久化记忆系统和模块化技能配置,大幅提升短剧创作的效率与一致性。
PaddleX 3.0 是基于飞桨框架构建的低代码开发工具,集成了大量开箱即用的预训练模型以支持全流程开发。该工具通过极简的 Python API 和图形界面,实现了从模型训练到推理部署的快速落地。此外,它还广泛兼容国内外主流硬件,助力开发者高效完成产业实践。
ROLL 是一个高效且易于使用的库,旨在为大规模 GPU 集群上的大语言模型扩展强化学习工作流。它支持包括 RLVR、智能体交互和蒸馏在内的多种训练范式,同时集成了 Megatron-Core、vLLM 和 SGLang 等先进后端。该框架提供强大的可观测性和灵活的资源管理,以提升复杂推理和人类偏好对齐任务中的性能。
Hermes Agent 是由 Nous Research 设计的一款自我提升 AI 助手,通过内置的学习循环来创建并优化技能。它支持多种 LLM 提供商,并可部署在 Telegram、Discord 和本地终端环境等各种平台。该系统具备持久化记忆、定时自动化功能,并能够为复杂的并行任务生成子 Agent。
FastDeploy 是基于飞桨的大语言模型与视觉语言模型推理部署工具包,旨在提供开箱即用的生产级部署方案。该工具支持多种主流硬件平台,并集成了负载均衡式PD分解、统一KV缓存传输及多种高级加速技术。开发者可通过兼容 OpenAI API 的接口实现快速部署,并利用全量化格式支持优化推理性能。
RTP-LLM 是由阿里巴巴基础模型推理团队开发的高性能大模型推理加速引擎。该引擎已在淘宝、天猫等多个阿里业务场景中广泛应用,支持多种主流模型格式与硬件后端。它通过集成先进的算子优化、量化技术及分布式推理能力,为大规模语言模型提供高效的生产级服务。
OpenAI Agents SDK 是一个专为构建复杂多智能体工作流而设计的轻量级框架。它支持多种 LLM,并提供工具集成、护栏机制和人机协作等核心功能。开发者还可以利用沙盒智能体处理长时间运行的任务,并借助内置的追踪功能来调试和优化智能体应用。
Claude Code Local 提供了一套高性能 AI 模型,可完全在 Apple Silicon 硬件上运行,无需连接云端。该项目具备原生 MLX 服务器,支持在本地执行 Claude Code、浏览器自动化及语音交互,同时确保数据完全隐私。通过消除出站网络调用和遥测,它为处理敏感专业任务提供了一个安全的离线环境。
Protenix 是一个专为高精度生物分子结构预测而设计的开源框架,其提供的模型性能可与最先进的方法相媲美。该项目提供了多个版本,包括增强版的 Protenix-v2,它在抗体-抗原结构预测和配体相关合理性方面展现了显著的改进。该项目基于 Apache 2.0 许可证发布,可免费用于学术和商业研究应用。
MedgeClaw 是一个开源的生物医学研究助手,它集成了 OpenClaw 和 Claude Code 以自动化复杂的科学工作流程。用户可以通过 WhatsApp、Slack 或 Discord 等消息平台与系统交互,从而在 R 和 Python 环境中触发分析。该平台提供了一个实时研究仪表板,用于监控进度、查看代码以及访问交互式输出。
Open Agents 是一个开源参考应用程序,旨在 Vercel 平台上构建和运行后台编码代理。该系统采用三层架构,将 Web 界面、持久化代理工作流和隔离的沙盒执行环境分离开来。这种模块化设计使开发人员能够执行复杂的编码任务(如存储库管理和自动拉取请求),而无需本地机器的持续参与。
EvoCUA 是一款高性能开源多模态模型,专为跨各种桌面应用程序的端到端计算机自动化而设计。它目前在 OSWorld 基准测试中排名第一,并展现出卓越的跨操作系统泛化能力。此外,该模型以其强大的安全配置而闻名,在领先的计算机使用智能体中表现出最低的非预期行为率。
AngelSlim 是一款高度集成的工具包,旨在为大型语言模型、视觉模型和扩散模型提供高效的压缩解决方案。它支持包括高级量化、投机采样和 Token 剪枝在内的多种技术,以优化模型性能。该框架为开发者提供了一个统一的接口,用于在各种硬件环境下进行模型训练、部署和性能评估。
Humanizer-zh 是一个专为 Claude Code 设计的技能工具,旨在帮助用户识别并去除文本中常见的 AI 生成痕迹。该项目通过分析 24 种 AI 写作模式,指导用户将机械化的内容改写得更具人类表达的自然感与个性。它不仅提供自动化改写功能,还通过具体的写作原则帮助创作者提升文章的真实质量与可读性。
Tair KVCache 是阿里云开发的一套系统,旨在通过分布式内存池和动态多级缓存技术加速大语言模型推理。该项目提供了一个用于全局 KVCache 元数据和存储容量的集中式管理器,确保了高效的数据可靠性和资源利用率。此外,它还包含一个高保真仿真工具,允许开发者在无需实际 GPU 资源的情况下预测性能指标。
Chrome DevTools for Agents 是一个 MCP server,旨在让 AI coding assistants 能够控制并检查运行中的 Chrome 浏览器实例。它提供了一套全面的工具,用于浏览器自动化、性能分析以及深度调试。该项目支持与各种 AI coding platforms 无缝集成,通过可靠的浏览器交互来增强开发者的工作流程。
MedgeClaw 是一个开源的生物医学研究助手,它集成了 OpenClaw 和 Claude Code 以自动化复杂的科学工作流程。用户可以通过 WhatsApp、Slack 或 Discord 等消息平台与系统交互,从而在 R 和 Python 环境中触发分析。该平台提供了一个实时研究仪表板,用于监控进度、查看代码以及访问交互式输出。
OpenCLI 将网站、浏览器会话和桌面应用程序转换为面向人类和 AI Agent 的确定性命令行界面。它利用现有的浏览器身份验证来提供安全可靠的自动化,而无需额外的凭据。用户可以使用 90 多种内置适配器或创建自定义适配器,以简化工作流程并将外部工具集成到统一的 CLI 中心。
Agent Sprite Forge 是一款旨在利用 Codex 将自然语言提示词转换为游戏就绪的 2D 精灵图和分层地图的工具。它通过结合 AI 图像生成与确定性的本地后处理技术进行清理和导出,从而实现了资产流水线的自动化。该系统支持多种输出格式,包括动画序列图、透明 GIF、碰撞数据以及复杂的场景布局。
Harmonist 是一个便携式多 Agent 框架,它通过机械化的 IDE 级钩子而非依赖 LLM 提示词来强制执行开发协议。它提供了一个结构化且经过验证的内存系统以及供应链验证,以确保代码变更符合不可妥协的质量和安全标准。该框架可与 Cursor 和 Claude Code 等主流 AI 编程助手无缝集成,提供 186 个专用 Agent 目录,且无需外部运行时或数据库。
Pipcook 是一个模块化的 JavaScript 应用框架,旨在帮助前端工程师将机器学习集成到他们的工作流程中。它提供了一个全面的流水线系统,允许用户直接在 Node.js 环境中训练、验证和部署机器学习模型。通过桥接对 Python 包的访问,该框架使开发人员能够利用强大的机器学习工具,而无需具备该领域的深厚专业知识。
本教程为用户提供从零开始打造AI工作助手的全面指南,涵盖安装配置、核心功能实战及进阶技巧。内容基于OpenClaw v2026.4.14稳定版进行校对,并提供多种部署方案以满足不同场景需求。通过丰富的实战案例与详细的命令速查,帮助用户实现个人效率的显著提升。
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统具备全面的数据处理流水线、带有时空掩码的可控生成模型以及专门的评估基准。它支持多种创意任务,包括角色 3D 生成、视频风格迁移以及用于精确运动控制的多模态引导。
Humanizer-zh 是一个专为 Claude Code 设计的技能工具,旨在帮助用户识别并去除文本中常见的 AI 生成痕迹。该项目通过分析 24 种 AI 写作模式,指导用户将机械化的内容改写得更具人类表达的自然感与个性。它不仅提供自动化改写功能,还通过具体的写作原则帮助创作者提升文章的真实质量与可读性。
OpenMontage 是一个开源的智能体系统,它将 AI 编程助手转变为功能全面的视频制作工作室。它实现了整个创作工作流的自动化,涵盖了研究、脚本编写、素材生成、剪辑以及最终合成。该平台支持使用多种免费和付费工具来制作 AI 生成的视觉内容以及真实素材的纪录片蒙太奇。
OpenDataLoader PDF 是一款高性能开源解析器,旨在将 PDF 文档转换为 Markdown、JSON 和 HTML 等结构化格式,以供 AI 和 RAG 流水线使用。它采用混合处理模式,结合确定性本地解析与 AI 驱动分析,为复杂表格、公式和扫描文档实现行业领先的提取精度。此外,该项目还提供自动化无障碍解决方案,包括符合国际标准的端到端 Tagged PDF 生成功能。
AutoFlow 是一款开源知识库工具,利用基于 TiDB Vector、LlamaIndex 和 DSPy 构建的 Graph RAG 技术。该平台提供由内置高级网站爬虫驱动的 Perplexity 风格对话式搜索体验。用户还可以使用简单的 JavaScript 代码片段将可自定义的搜索小部件集成到自己的网站中。
ROCK 是一个专为智能体强化学习应用设计的可扩展环境管理框架。它利用具有强大隔离机制的客户端-服务器架构,以确保沙箱运行的稳定与安全。该平台提供统一的 SDK,并完全兼容 GEM 协议,从而实现环境交互的标准化。
Xiaomi Miloco 是一款开源智能家居解决方案,利用端侧大语言模型来集成和控制 IoT 设备。通过利用摄像头数据流,该系统能够实现复杂的家庭自动化和事件分析的自然语言交互。它通过在用户硬件上本地执行视觉理解和任务规划,优先保障用户隐私。
GBrain 提供了一个持久化的自连接知识图谱,使 AI Agent 能够跨会议、电子邮件和文档存储并检索复杂信息。该系统自动提取实体关系并维护结构化时间线,从而使 Agent 能够回答标准向量搜索无法处理的查询。通过利用持久化任务队列和模块化技能系统,它确保了 Agent 能够随着时间的推移变得更加智能和可靠。
VoxCPM2 是一款无需分词器、拥有 2B 参数的语音合成系统,利用扩散自回归架构生成高质量且富有表现力的音频。该模型支持 30 种语言,并提供语音设计、可控语音克隆以及录音室级别的 48kHz 输出等高级功能。它在 Apache-2.0 许可下完全开源,并通过 vLLM-Omni 和 Nano-vLLM 提供生产就绪的部署选项。
pi-autoresearch 是 pi AI 编码代理的一个扩展,通过测试、基准测试和优化代码变更来实现自主优化循环。它通过持久化会话工作流支持多种优化目标,例如测试速度、包大小和 LLM 训练指标。该工具包含一个实时仪表板、用于过滤噪声的置信度评分,以及将实验最终确定为干净且可审查分支的功能。
TimesFM 是由 Google Research 专门为时间序列预测任务开发的仅解码器基础模型。最新的 2.5 版本采用了 200M 参数架构,支持高达 16k 的上下文长度和连续分位数预测。该存储库提供了用于推理、使用 LoRA 进行微调以及与代理工作流集成的全面工具。
Caveman 是一款专为 AI agent 设计的插件,通过强制执行简洁的电报式沟通风格,显著降低输出 token 的使用量。它在保持技术准确性的同时,利用其压缩工具减少了约 75% 的输出 token 和 46% 的输入 token。该项目支持包括 Claude Code、Cursor 和 Gemini 在内的多种 agent,并提供多种强度级别以及如文言文等专业模式。
OpenClaw 汉化发行版为开源个人 AI 助手平台提供了完整的中文界面支持,涵盖了 CLI 命令行工具及 Dashboard 网页控制台。该项目每小时自动同步官方更新,确保用户能及时体验最新功能并享受深度汉化体验。此外,项目还配套了 ClawPanel 管理面板与 ClawApp 手机端,极大提升了 AI 助手的易用性与跨平台交互能力。
Cua 提供了一个统一的生态系统,用于构建、基准测试和部署能够与计算机界面交互的自主智能体。该平台包含用于后台 macOS 自动化、跨平台沙箱和高性能虚拟化的专业工具。开发人员可以利用这些组件创建能够无缝执行任务、运行代码并导航复杂 GUI 环境的智能体。
OpenSpec 是一个轻量级规范框架,旨在实现实施前人类意图与 AI 编码助手的对齐。它将开发变更组织为包含提案、技术设计和实施任务的结构化文件夹。该工具与 20 多种现有的 AI 编码助手集成,以提供可预测且流畅的开发工作流程。
EvoCUA 是一款高性能开源多模态模型,专为跨各种桌面应用程序的端到端计算机自动化而设计。它目前在 OSWorld 基准测试中排名第一,并展现出卓越的跨操作系统泛化能力。此外,该模型以其强大的安全配置而闻名,在领先的计算机使用智能体中表现出最低的非预期行为率。
Web-Bench 是一项综合性基准测试,旨在评估大语言模型处理现实世界 Web 开发任务的有效性。它包含 50 个具有顺序依赖关系的复杂项目,模拟了专业的工程工作流程。该基准测试提供了一个极具挑战性的环境,即使是目前最先进的模型也显示出巨大的改进空间。
PaddleCustomDevice 是飞桨框架提供的自定义硬件接入实现方案。该项目通过标准化的接口设计,支持开发者将多种第三方硬件后端集成到飞桨生态中。目前已涵盖昇腾、寒武纪、英特尔GPU及苹果MPS等多种主流硬件平台的接入支持。
Rowboat 是一款开源 AI 同事,它与您的电子邮件和会议记录集成,以构建持久的本地知识图谱。它利用此上下文来协助起草文档、准备会议和跟踪项目等任务,同时将所有数据保持为可编辑的 Markdown 格式。通过在您的机器上维护长期记忆,它实现了随时间推移而不断改进的复合上下文,且无需依赖外部云存储。
LiteRT-LM 是由 Google 设计的一款高性能、生产就绪型推理框架,旨在边缘设备上部署大型语言模型。它支持包括 Android、iOS、桌面端和 IoT 在内的多种平台,同时利用 GPU 和 NPU 硬件加速以实现最佳性能。该框架支持多模态和函数调用等高级功能,为各类 Google 产品中的端侧 AI 体验提供支持。
JaQMC 是一个基于 JAX 的模块化框架,专为执行神经网络量子蒙特卡洛模拟而设计。它利用深度神经网络作为变分波函数来求解电子 Schrödinger 方程,而无需依赖传统的基组。该项目通过高度可配置和可扩展的架构,支持包括分子、固体和分数量子霍尔态在内的多种量子系统。
fireworks-tech-graph 使用户能够直接从自然语言描述中生成专业的 SVG 和 PNG 技术图表。该工具支持 14 种 UML 图表类型,并包含 7 种专为各种文档需求量身定制的独特视觉风格。它专门针对 AI 和基于 agent 的领域模式进行了优化,无需手动绘图即可实现快速可视化。
oh-my-claudecode 提供了一个多智能体编排层,旨在以零学习成本增强 Claude Code 的使用体验。它直接在终端内实现了团队协作任务执行、智能模型路由和持久化自主工作流等高级功能。该工具通过自动化任务委派、并行处理和苏格拉底式的需求澄清,简化了复杂的开发任务。
Qwen Code 是一款开源 AI Agent,旨在直接在终端中运行,帮助开发者理解代码库并实现任务自动化。它支持多种身份验证方法,包括 Qwen OAuth 和各种兼容 OpenAI 的 API 提供商,以提供灵活的模型集成。该工具提供了功能丰富的 agentic 工作流,并可集成到 VS Code、Zed 和 JetBrains 等主流 IDE 中。
Pipcook 是一个模块化的 JavaScript 应用框架,旨在帮助前端工程师将机器学习集成到他们的工作流程中。它提供了一个全面的流水线系统,允许用户直接在 Node.js 环境中训练、验证和部署机器学习模型。通过桥接对 Python 包的访问,该框架使开发人员能够利用强大的机器学习工具,而无需具备该领域的深厚专业知识。
Thunderbolt 是一款开源、跨平台的 AI 客户端,专为本地部署和数据所有权而设计。它支持在桌面和移动环境中运行各种前沿模型、本地模型及私有化部署模型。该项目目前处于活跃开发阶段,重点关注企业级就绪能力与安全性。
JoyAI-Image 是一个统一的多模态基础模型,它集成了 8B Multimodal Large Language Model 和 16B Multimodal Diffusion Transformer,以支持图像理解、生成和编辑。该模型利用理解与生成之间的闭环协作,增强了空间推理和可控编辑能力。它提供了一个可扩展的训练流水线,并支持多视图生成和精确空间操作等高级功能。
Goose 是一个通用 AI Agent,旨在您的本地机器上运行,用于处理从编码和研究到自动化和数据分析等各种任务。它使用 Rust 构建,以确保通过桌面、CLI 和 API 接口在 macOS、Linux 和 Windows 上实现高性能和可移植性。该项目支持超过 15 个 AI 提供商,并通过 Model Context Protocol 集成了 70 多个扩展。
Awesome-finance-skills 是一个为大语言模型提供金融分析能力的插件式技能集合。它支持实时新闻聚合、股票数据查询、情感分析及市场预测等多种专业金融功能。用户可以通过简单的安装方式将这些技能集成到主流AI Agent框架中,快速提升其金融分析水平。
Magika 是一款利用深度学习提供高精度文件类型识别的 AI 工具,支持超过 200 种内容类型。它配备了高度优化的模型,能够在毫秒级时间内提供推理结果,同时保持约 99% 的准确率。该项目提供通用的命令行界面以及 Python、JavaScript 和 Rust 语言绑定,以支持多样化的开发者工作流程。
Archon 是一个开源工作流引擎,允许开发人员使用确定性的 YAML 工作流来定义 AI 编程流程。通过对规划、实现和验证等任务进行结构化,它确保了 AI 驱动的开发在各个项目中都是可重复、隔离且可靠的。用户可以组合将确定性操作与 AI 驱动步骤混合的工作流,以自动化复杂的软件开发任务。
Awesome-finance-skills 是一个为大语言模型提供金融分析能力的插件式技能集合。它支持实时新闻聚合、股票数据查询、情感分析及市场预测等多种专业金融功能。用户可以通过简单的安装方式将这些技能集成到主流AI Agent框架中,快速提升其金融分析水平。
OpenClaw 汉化发行版为开源个人 AI 助手平台提供了完整的中文界面支持,涵盖了 CLI 命令行工具及 Dashboard 网页控制台。该项目每小时自动同步官方更新,确保用户能及时体验最新功能并享受深度汉化体验。此外,项目还配套了 ClawPanel 管理面板与 ClawApp 手机端,极大提升了 AI 助手的易用性与跨平台交互能力。
Vibe-Trading 是一个 AI 驱动的多智能体工作空间,可将自然语言请求转换为可执行的交易策略和投资组合分析。它具备 71 种专业金融技能和 29 个预构建的群体工作流,旨在自动化全球市场的研究、回测和风险管理。用户只需一条指令,即可将生成的策略轻松导出至 TradingView、TDX 和 MetaTrader 5 等平台。
Recursive Language Models (RLMs) 提供了一种任务无关的推理范式,使语言模型能够通过程序化分解和递归自调用来处理近乎无限的上下文。该框架用特定的 RLM 接口取代了标准的补全调用,将上下文卸载到 REPL 环境中进行交互式执行。本仓库提供了一个可扩展的引擎,支持各种本地和基于云的沙箱环境,以促进复杂的多步语言模型推理。
PersonaPlex 是一款基于 Moshi 架构构建的实时全双工语音到语音模型,能够通过文本提示和音频语音调节实现精确的角色控制。该模型在合成和真实对话数据的混合集上进行训练,以提供自然、低延迟的交互体验。用户可以通过提供的服务器接口部署该模型,或使用特定的语音嵌入和基于角色的提示进行离线评估。
Chinese-novelist 是一个专为 Claude Code 设计的技能插件,旨在帮助用户通过简单的交互完成中文小说的全流程创作。用户只需回答五个核心问题,AI 即可自动生成详细的大纲、人物档案及连贯的章节内容。该工具内置了专业的创作法则与质量检查清单,能够确保小说情节的连贯性与吸引力。
AI Daily Digest 是一款通过抓取 Hacker News 顶级技术博客,利用 AI 进行多维评分与摘要生成的自动化工具。它支持通过命令行或交互式界面快速筛选文章,并自动归纳当日技术圈的宏观趋势。该项目采用纯 TypeScript 编写,支持 Gemini 及多种 OpenAI 兼容的 API 模型。
本仓库汇集了 49 个经过验证的 OpenClaw 个人 AI 智能体真实使用场景,旨在帮助用户通过自动化手段提升工作与生活效率。内容涵盖了从国内生态适配到国际通用场景的广泛应用,并提供了详细的配置指南与可复制的提示词。无论你是新手还是开发者,都能通过这些结构化的案例快速上手并构建属于自己的 AI 智能体。
Memvid是一个无需数据库的单文件内存层,旨在为AI智能体提供即时检索和长期记忆功能。它通过创新的“智能帧”设计,将数据、嵌入和索引封装在单个文件中,实现了高效的压缩与并行读取。该系统具有模型无关、基础设施零依赖的特点,支持在各种离线或在线场景中实现持久化记忆。
Reversa 是一个协调专业 AI 代理的框架,旨在分析遗留代码库并生成全面且可追溯的技术规范。它通过创建操作契约作为现有系统与现代编码代理之间的桥梁,从而确保开发过程的安全与信息透明。该工具在运行过程中严格遵守不可变性保证,确保在分析过程中不会修改或删除任何现有的项目文件。
dot-skill 是一个多功能的 AI 框架,通过分析个人的独特思维模式和沟通风格,将其提炼为交互式的数字技能。该平台支持三种不同的角色系列,包括专业同事、个人关系和公众人物。它与多个 AI agent 主机无缝集成,为创建和调用个性化 AI 角色提供统一的自动化体验。
OmniVoice 是一款基于扩散语言模型架构的先进大规模多语言零样本语音合成模型,支持超过 600 种语言。该模型具备卓越的推理速度,能够实现高质量的语音克隆与语音设计功能。用户可以通过 Python API 或命令行工具轻松进行语音生成,并支持细粒度的非语言符号及发音控制。
本项目提供了一套系统化且小白友好的中文教程,涵盖了 Anthropic 官方编程工具 Claude Code 和开源 AI 助手框架 OpenClaw。教程包含 25 篇深度指南、70 多个可运行代码示例以及 170 多个常见问题解答,旨在帮助开发者快速掌握 AI 编程与自动化工作流。内容紧跟最新版本,通过双线学习路径助力用户从零基础进阶至企业级实战应用。
MemPalace 是一个本地优先的 AI 记忆系统,它将对话历史记录存储为逐字文本,以实现高精度的语义检索。它利用带有可插拔后端的结构化索引方法,将内容组织为侧翼、房间和抽屉,而无需进行外部 API 调用。该平台还具有时间知识图谱、MCP 工具和特定于代理的日记,以提供全面的上下文管理。
Evolver 是一款基于 GEP 的自进化引擎,旨在将临时的 AI Agent 提示词转化为可审计且可复用的进化资产。它通过扫描运行时日志来识别模式,并发布受协议约束的提示词,引导 Agent 完成结构化的自我修复与优化循环。该系统支持多种宿主运行时,并提供可选的网络功能,以实现协作式技能共享与去中心化验证。
Paseo 提供了一个统一的接口,用于在本地机器上管理和运行 Claude Code、Codex 和 OpenCode 等各种编码代理。它支持跨设备工作流,允许用户通过桌面端、移动端、Web 或 CLI 应用程序与代理进行交互。该平台优先考虑隐私,在无需遥测或强制登录的情况下运行,同时具备强大的代理编排功能。
Claude-Mem 是一个专为 Claude Code 及类似 CLI 工具设计的持久化记忆压缩系统,旨在跨会话保持上下文。它能自动捕获工具使用情况并生成语义摘要,以确保项目知识的连续性。该系统包含一个 Web 查看器、混合搜索功能以及为开发者提供的细粒度隐私控制。
Camofox-browser 是一款专为 AI Agent 提供可靠网页浏览能力的服务器,利用 Camoufox 引擎实现 C++ 级别的指纹伪装。它提供 REST API,通过可访问性快照、稳定的元素引用和内置搜索宏简化了交互过程。该系统针对效率和部署进行了优化,具备自动空闲关闭和会话隔离功能,以支持可扩展的 Agent 操作。
Onyx 是一个功能丰富的开源 AI 平台,旨在为大语言模型提供易于部署的应用层接口。该平台支持 RAG、深度研究、代码执行及多种 AI 代理功能,并兼容主流的自托管和专有大模型。用户可以通过标准版或轻量版进行部署,以满足从个人使用到企业级协作的不同需求。
ROCK 是一个专为智能体强化学习应用设计的可扩展环境管理框架。它利用具有强大隔离机制的客户端-服务器架构,以确保沙箱运行的稳定与安全。该平台提供统一的 SDK,并完全兼容 GEM 协议,从而实现环境交互的标准化。
Chinese-novelist 是一个专为 Claude Code 设计的技能插件,旨在帮助用户通过简单的交互完成中文小说的全流程创作。用户只需回答五个核心问题,AI 即可自动生成详细的大纲、人物档案及连贯的章节内容。该工具内置了专业的创作法则与质量检查清单,能够确保小说情节的连贯性与吸引力。
Claude Context 是一个 MCP 插件,通过将整个代码库索引到向量数据库中,为 AI 编程 Agent 提供语义代码搜索功能。它通过仅向 AI 提供相关的代码片段而非整个目录,显著降低了成本并提高了检索质量。该工具支持增量索引、基于 AST 的代码分块,并能与各种 AI 助手和 IDE 无缝集成。
Clicky 是一款开源 AI 教学助手,可直接集成到您的 macOS 环境中以提供实时指导。该应用程序利用屏幕录制、语音交互和光标控制功能,充当能够观察并与您的桌面进行交互的虚拟导师。用户可以通过配置 Cloudflare Worker 代理并使用 Xcode 构建基于 Swift 的应用程序,从而在本地部署该项目。
Waza 提供了一系列 Claude Code 技能,旨在将核心工程习惯转化为可执行的 AI 工作流。通过专注于特定的高影响力技术而非臃肿的配置,它帮助开发者在设计、调试和文档编写方面保持高标准。这些技能基于真实项目数据构建,确保 Claude 能够以经验丰富的工程师般的精确度和意图进行操作。
ANOLISA 是 Anolis OS 的演进版本,专为在服务器端操作系统层面支持 AI agent 工作负载而设计。该项目提供了一套全面的组件,包括 AI 驱动的终端、安全内核以及可观测性工具。用户可以通过标准的 RPM 包安装方式,轻松地将这些功能集成到他们的系统中。
Open CoDesign 是一款开源的桌面原生应用程序,允许用户在本地将提示词转化为精美的原型和设计产物。它通过自带 API Key 的方式支持多种 AI 模型,消除了对云端订阅服务的依赖。该工具具备交互式编辑、响应式预览和多格式导出功能,旨在简化专业设计工作流。
Claudian 是一款 Obsidian 插件,可将 Claude Code 和 Codex 等 AI 编程代理直接集成到您的知识库中。它将您的知识库转变为一个活跃的工作目录,代理可以在其中读取、写入、搜索并执行 bash 命令。用户可以通过聊天侧边栏、内联编辑以及对 Model Context Protocol 服务器的支持与这些代理进行交互。
LLM Wiki 是一款跨平台桌面应用程序,利用增量式 LLM 驱动的流水线将您的文档转换为有组织的互联知识库。它具备复杂的两步摄入流程、持久化知识图谱以及深度研究能力,旨在维护和扩展您的个人资料库。该系统通过来源可追溯性、人机协作审查以及与 Obsidian 等工具的无缝集成,确保了高质量的输出。
VibeVoice 是一系列利用连续语音分词器和下一标记扩散技术来实现高保真音频处理的开源语音 AI 模型。该框架包含用于长文本语音识别和实时流式文本转语音生成的先进工具。这些模型专为研究目的而设计,旨在促进语音合成社区内的协作与创新。
NeuTTS 是一套开源的端侧文本转语音模型,专为实时性能和高质量语音合成而设计。该框架利用轻量级 LLM 主干和神经音频编解码器,仅需三秒音频即可实现即时语音克隆。这些模型针对移动和嵌入式设备进行了部署优化,支持包括英语、西班牙语、德语和法语在内的多种语言。
Pairec 是一个基于 Go 的 Web 框架,旨在加速在线推荐服务的开发。它利用基于 JSON 的配置来简化复杂推荐逻辑的设置和部署。该框架包含多种内置模型功能,以简化高效推荐系统的创建。
此仓库提供了一份精选的 LLM API 提供商列表,这些服务为文本推理提供永久免费层级。它将服务分类为直接提供商 API 和第三方推理平台,并详细说明了模型能力、上下文窗口和速率限制。该集合为寻求以经济高效方式访问各种大语言模型的开发者提供了全面的资源。
get-shit-done 是一个规范驱动的开发系统,旨在通过防止 AI 编程助手中的上下文衰减来保持高质量的代码。它协调子代理来处理项目规划、研究和执行,同时保持清晰的 git 历史记录和原子提交。该系统为开发人员提供了一个结构化的工作流程,无需企业级项目管理的开销即可持续构建复杂功能。
QMD 是一款设备端搜索引擎,用于索引 Markdown 笔记、文档和转录内容,以实现高效的本地检索。它采用混合方法,结合了 BM25 全文搜索、向量语义搜索和基于 LLM 的重排序,从而提供高质量的搜索结果。该工具专为 Agent 工作流设计,提供命令行界面和 MCP 服务器,以便与 AI Agent 无缝集成。
Paperclip 是一个开源平台,提供 Node.js 服务器和 React UI,用于将 AI Agent 团队编排为一个有凝聚力的商业实体。它类似于任务管理器,提供组织架构图、预算执行和目标对齐等功能,以管理自主运营。用户可以集成自己的 Agent 来 24/7 全天候运营业务,同时通过集中式仪表板保持监督。
本项目通过解析 npm 包中遗留的 source map 文件,成功还原了 Claude Code 2.1.88 版本的完整源代码。开发者可以借此深入研究该 CLI 工具的命令系统、React 与 Ink 构建的终端 UI 以及 MCP 协议的集成实现。该项目旨在提供一个学习和分析 Claude Code 内部架构的参考,仅供技术研究与归档使用。
MiroFish 是一个基于多智能体技术的下一代 AI 预测引擎,通过提取现实世界的种子信息构建高保真数字平行世界。用户可以在该沙盒中通过注入变量进行模拟,从而对未来轨迹进行精确推演。该平台旨在为决策者提供零风险的测试实验室,同时为个人用户提供创意模拟空间。
Dothething 是一个本地 AI Agent,能够自主处理研究、浏览器自动化和代码执行等复杂任务。它能够规划自身工作、管理工具,并支持通过自定义技能或 MCP servers 进行扩展。该系统支持持久化会话、成本跟踪以及用于管理多个并行 Agent 的 orchestrator 模式。
Scout 是一款开源智能代理,旨在从 Slack、Drive 和 CRM 系统等碎片化的公司来源中导航并整合信息。它充当中央大脑,通过学习用户交互和上下文提供程序来构建自己的 wiki 和 CRM。该系统利用子代理来管理特定来源的特性,从而确保高效的数据检索和组织知识的持久记忆。
CLIProxyAPI 是一款多功能代理服务器,为各种命令行工具提供兼容 OpenAI、Gemini 和 Claude 的 API 接口。它支持主流 AI 服务的 OAuth 认证,使用户能够通过轮询负载均衡管理多个账号。该项目还包含一个可复用的 Go SDK,并为 IDE 扩展和 AI 编程助手提供了广泛支持。
Google AI Edge Gallery 是一款旨在直接在您的设备上运行强大的开源 Large Language Models 的移动应用程序。它为用户提供了一个完全离线且私密的环境,以体验先进的生成式 AI 功能,包括最新的 Gemma 4 系列。该应用程序提供了一套全面的工具,用于模型管理、基准测试和交互式 AI 功能。
Verified Agent Identity 是一个去中心化工具包,旨在让 AI Agent 使用 iden3 协议创建、管理和验证去中心化身份。它通过加密签名实现安全的人机关联,并支持强大的身份管理功能。该系统通过将敏感加密材料存储在 Agent 工作区之外并提供可选的 AES-256-GCM 加密来确保安全性。
Toprank 是一款 Claude Code 插件,为 AI 智能体提供对 Google Search Console 和 Google Ads 的直接访问权限,以实现数据驱动的优化。它使用户能够通过简单的 CLI 命令执行自动化审计、识别浪费的广告支出并实施技术性 SEO 改进。该工具还支持通过 Gemini 进行跨模型审查,并与各种 CMS 平台集成,以简化内容和性能管理。
last30days 工具是一款由 AI Agent 主导的搜索引擎,它整合了来自社交媒体、开发者平台和预测市场的实时数据,以提供最新的见解。通过连接 Reddit、X、GitHub 和 YouTube 等相互独立的平台,该 Agent 根据实际的人类参与度而非传统的 SEO 指标来对信息进行评分。它就像一位专业的科研助理,能够针对过去一个月内任何主题、人物或公司提供简洁且基于证据的简报。
vLLM Kunlun 是一个由社区维护的硬件插件,旨在实现 vLLM 在 Kunlun XPU 硬件上的无缝运行。它利用硬件可插拔接口来解耦集成过程,从而确保与多种开源模型的兼容性。该项目支持在 Kunlun3 P800 平台上运行包括基于 Transformer、混合专家模型 (MoE) 和多模态 LLM 在内的多种架构。
该仓库包含了官方 PaddlePaddle 文档平台的源代码文件。它将内容组织到 API 参考、用户指南和教程的特定目录中,以支持开发者使用。该项目还提供了 CI 脚本和构建说明,以促进本地文档生成和社区贡献。
Beads 是一个由 Dolt 驱动的分布式问题追踪系统,旨在为 AI 编程 Agent 提供持久化且结构化的记忆。它利用依赖感知图结构来帮助 Agent 管理复杂的长周期任务,而不会丢失关键上下文。该工具提供灵活的存储模式,并能无缝集成到使用或不使用 Git 的开发工作流中。
Open Generative AI 是一个免费的开源平台,为商业 AI 媒体工具提供了一种无限制的替代方案。它支持超过 200 种用于图像、视频和唇形同步生成的尖端模型,且没有任何内容过滤器或订阅费用。用户可以通过基于 Web 的界面或支持本地及远程推理的桌面应用程序来访问这些功能。
本综合指南详细介绍了由 Nous Research 开发的 Hermes Agent 框架。书中分十七章涵盖了自我改进学习循环、记忆系统和自动化技能演进等核心机制。对于希望实现并定制自己智能代理的开发者和 AI 爱好者而言,本书是一份实用的参考资源。
Ghost Pepper 是一款注重隐私的 macOS 应用程序,无需依赖云端 API 即可提供本地语音转文字转录功能。用户只需按住 Control 键即可录制音频,录音随后会被转录并自动粘贴到任何文本输入框中。该应用利用本地模型进行语音识别和文本清理,确保没有任何数据离开用户的设备。
该项目提供了一个可复用的模板,用于利用 AI coding agents 将网站逆向工程为现代 Next.js 代码库。它通过提取设计 tokens、资源和组件规范来自动化处理流程,从而并行重构各个部分。该模板支持多种 AI 平台,并内置了用于组装和视觉质量保证的工具。
OfficeCLI 是一款开源命令行工具,使 AI Agent 能够在无需本地安装 Office 的情况下创建、读取和修改 Microsoft Office 文档。它采用三层架构,支持简单的语义视图、结构化元素操作以及直接的 XML 访问。该工具通过内置的 MCP 服务器和自动技能配置,实现了与 AI 编码 Agent 的无缝集成。
Ralph 是一个自主 AI Agent 循环,它使用 Amp 或 Claude Code 等工具重复执行编码任务,直到满足所有项目需求。每次迭代都在全新的上下文中运行,通过 git 历史记录、进度日志和结构化的 JSON 任务列表来维护项目状态。该系统通过将大型功能分解为可通过自动化质量检查验证的可管理用户故事,确保项目持续推进。
OpenCode 是一门面向零基础用户的免费开源 AI 实战课程,旨在帮助用户在 4 小时内掌握利用 AI 提升工作效率的方法。该教程提供深度中文内容,支持国内主流模型直连,无需复杂的网络配置。课程涵盖从快速起步到深度定制的五个阶段,并提供丰富的实战项目与 Prompt 模板供学习者使用。
PaddleCustomDevice 是飞桨框架提供的自定义硬件接入实现方案。该项目通过标准化的接口设计,支持开发者将多种第三方硬件后端集成到飞桨生态中。目前已涵盖昇腾、寒武纪、英特尔GPU及苹果MPS等多种主流硬件平台的接入支持。
agent-browser 是一个基于 Rust 构建的高性能浏览器自动化命令行工具,专为 AI 代理设计。它支持通过简单的命令进行网页交互、元素定位和状态管理,无需复杂的 Playwright 或 Node.js 环境。该工具提供了丰富的会话持久化、身份验证管理及调试功能,以确保 AI 代理能够安全且高效地运行。
Shimmy 是一个轻量级的单二进制文件服务器,为在本地运行 GGUF 模型提供了 100% 兼容 OpenAI 的 API。它具备零配置模型发现、自动 GPU 后端检测以及针对大模型的高级 CPU/GPU 混合处理功能。该工具专为隐私和性能而设计,允许开发者无需更改代码即可将本地 LLM 集成到现有工具中。
Feynman 是一个开源的 AI 研究代理,旨在协助处理文献综述、论文审计和实验复现等复杂任务。该平台利用多代理系统来收集证据、执行模拟同行评审并起草结构化的研究结果。用户可以通过终端界面与该工具进行交互,并支持本地和基于云的执行环境。
DeepTutor 是一个原生智能体平台,旨在通过统一的聊天工作区和多智能体架构提供个性化的智能辅导。它具备诸如用于交互式学习的 Book Engine、AI Co-Writer 以及用于根据个人用户资料定制体验的持久记忆等高级功能。用户可以通过引导式 CLI 设置或 Docker 轻松部署该系统,并支持广泛的 LLM 和嵌入提供商。
Claude Cookbooks 提供了一系列全面的代码片段和指南,旨在帮助开发者将 Claude 集成到自己的应用程序中。该存储库涵盖了广泛的主题,包括工具使用、多模态功能以及提示词缓存等高级技术。这些资源旨在方便开发者根据不同的编程语言和项目需求进行灵活调整。
T3 Code 提供了一个专为与编码代理交互而设计的极简 Web 图形用户界面。该平台目前支持与 Codex 和 Claude 集成,并计划在未来扩展对更多提供商的支持。用户可以通过桌面应用程序访问该工具,也可以直接使用 npx 运行以实现快速部署。
该插件允许 Claude Code 用户直接在工作流中调用 Codex 进行代码审查或任务委派。用户可以通过一系列斜杠命令执行只读审查、对抗性审查以及后台任务管理。该工具利用本地安装的 Codex CLI 和现有的身份验证配置,确保了与用户现有开发环境的无缝集成。
该工具由Paddle官方维护,旨在实现PyTorch代码到PaddlePaddle代码的高效自动化迁移。它支持超过1600个PyTorch API及200个torchvision API的一键转换,在测试中保持了95%以上的平均转换率。转换过程通过命令行操作,能够保持原代码的风格与结构,并提供详细的转换日志与总结。
k-skill 是一套专为 AI Agent 设计的自动化工具,用于执行与 SRT、KTX、Coupang 和 KakaoTalk 等热门韩国服务相关的各种任务。它支持与主流 coding agents 集成,并允许用户在无需额外 client API 层的情况下执行任务。用户可以通过安装完整套件并通过提供的设置工具配置凭据来开始使用。
AI Hedge Fund 是一个教育性的概念验证项目,旨在探索如何利用人工智能进行交易决策。它采用多智能体系统,模拟各种著名的投资策略和分析方法来评估股票。该系统仅用于研究目的,不执行任何现实世界的金融交易。
llmfit 是一款基于终端的实用程序,用于分析您的系统硬件,以确定哪些大型语言模型可以在您的特定配置上有效运行。它提供交互式 TUI 和 CLI,根据质量、速度和内存适配度对模型进行评分,同时支持 Ollama、llama.cpp 和 MLX 等多种后端。用户还可以执行硬件模拟,以测试不同模型配置在目标系统规格上的表现。
本项目提供了一套结构化的指南,旨在通过解决过度复杂化和错误假设等常见陷阱来改善 LLM 的编码行为。它实施了四个核心原则——先思考后编码、简洁至上、外科手术式修改和目标驱动执行——以确保生成更精确且可验证的代码。用户可以通过 Claude Code 插件、CLAUDE.md 文件或 Cursor 项目规则将这些规则集成到开发工作流中。
Claude Ads 是一款专为 Claude Code 设计的综合审计与优化工具,旨在提升付费广告的表现。它利用并行子代理委派功能,在 Google、Meta、LinkedIn 和 TikTok 等主流平台上提供超过 250 项审计检查。用户可以生成专业的 PDF 报告、执行 PPC 财务建模,并获取特定行业的战略规划模板。
本项目包含了 Anthropic 官方 Claude Code CLI 工具的完整泄露源代码,该代码于 2026 年 3 月 31 日通过 npm 包中的映射文件被发现。仓库提供了基于 TypeScript 和 Bun 构建的原始源码,并附带了详细的架构文档和探索指南。用户可以通过内置的 MCP 服务器以交互方式深入研究该工具的内部实现与设计模式。
Obsidian Mind 是一个专为 Claude Code 设计的 Obsidian 知识库模板,旨在通过自动化的会话钩子和结构化存储解决 AI 长期记忆缺失的问题。它通过将工作笔记、决策记录、会议纪要和绩效证据自动链接到知识图谱中,确保 Claude 在每次会话开始时都能获取完整的上下文。该系统支持通过自然语言交互进行日常工作流管理,并能自动生成绩效评估简报和项目总结。
PaddlePaddle 社区是开发者通过代码改进、文档编写和技术分享为框架做出贡献的核心枢纽。它提供结构化的治理机制、专门的工作组以及各类导师计划,以支持开发者的积极参与。贡献者将通过官方认证、发布说明以及项目作者记录获得认可。
Kronos 是一个开源的仅解码器基础模型,专门用于分析和预测金融 K 线序列。它利用两阶段框架,将多维市场数据量化为分层 Token,随后通过自回归 Transformer 进行处理。该项目提供了一套完整的预训练模型和工具,支持直接预测以及特定领域的微调。
AI Engineering from Scratch 是一个包含 320 小时的综合课程,引导学生从基础的线性代数学习到构建自主智能体集群。该课程强调 AI-native 的学习方法,学生在 20 个不同的阶段中使用 AI coding agents 来测试知识并构建可复用的工具。通过使用 Python、TypeScript、Rust 和 Julia 进行开发,学习者可以建立一个包含 prompts、技能和 agents 的专业作品集,并将其部署到实际环境中。
AI Marketing Skills 是一个为营销和销售团队设计的开源项目,提供了一系列可直接运行的自动化工作流和脚本。这些工具旨在与 Claude Code 或其他 AI 编程代理集成,通过专家面板、评分算法和自动化管道优化业务流程。该项目涵盖了从增长实验、销售线索挖掘到内容运营和财务分析等多个领域的专业技能。
TradingAgents 是一个基于多智能体的大模型金融交易框架,旨在模拟真实交易公司的运作流程。该框架通过部署包括基本面、情绪、新闻和技术分析在内的专业智能体,协同评估市场状况并制定交易策略。系统利用 LangGraph 构建,支持多种主流大模型提供商,并提供交互式命令行界面及 Python 开发接口。
ACE-Step UI 为开源的 ACE-Step 1.5 AI 音乐生成模型提供了一个专业且类似 Spotify 的操作界面。它允许用户完全在本地生成高质量的歌曲、纯音乐和歌词,无需支付订阅费用或受云端限制。该平台包含音频编辑、音轨分离和批量处理等高级工具,让创作者能够全面掌控自己的音乐制作过程。
oh-my-codex 是一个旨在提升 OpenAI Codex CLI 功能和一致性的工作流增强层。它提供了专门的角色、可重用的技能以及结构化的项目状态管理,以简化复杂的开发任务。该工具针对 macOS 和 Linux 环境进行了优化,提供了诸如基于团队的并行执行和持久化补全循环等高级功能。
本仓库提供了一个构建 Agent Harness 的综合教育框架,这是 AI 模型感知和行动所必需的基础环境。它认为真正的代理能力是在模型训练期间习得的,而开发者的角色是构建工具、知识和上下文管理系统以支持这些模型运行。通过十二个进阶课程,用户将学习通过逆向工程 Claude Code 背后的原理来构建稳健且可扩展的 Agent 架构。
Oh My OpenCode 是一个旨在打破单一模型锁定、通过编排多种AI模型实现高效开发的开源代理工具。它通过引入 Discipline Agents 和 ultrawork 命令,实现任务的并行处理与自动化执行,无需手动切换模型。该工具通过哈希锚定编辑工具和深度初始化功能,显著提升了代码修改的准确性与开发体验。
Humanizer 是一款专为 Claude Code 和 OpenCode 设计的专业技能,旨在消除 AI 生成文本中常见的特征。它能够识别并修正 29 种不同的模式,例如意义夸大和过度委婉,从而生成更自然的文本。用户还可以提供个人写作样本,以校准该工具,使其匹配其独特的语调和节奏。
Marketing Skills for AI Agents 是一个基于 markdown 的综合工作流集合,旨在为 AI 编码助手提供专业的营销知识。这些技能涵盖了转化率优化、SEO、文案写作和增长工程等广泛领域,以帮助代理执行复杂的营销任务。通过引用共享的 product-marketing-context,这些技能协同工作,确保所有营销活动输出的一致性和战略性。
TranslateBooksWithLLMs 是一款多功能工具,旨在利用各种本地或云端 AI 模型翻译书籍、字幕和任意长度的文档。它具备智能分块系统,可在保留原始格式、样式和结构的同时,通过自动检查点功能允许用户恢复中断的任务。该软件支持 EPUB、SRT、DOCX 和 TXT 等多种文件格式,并同时提供用户友好的 Web 界面和强大的命令行工具。
Claude Code Templates 提供了一套全面的代理、自定义命令和集成方案,旨在优化您的 Anthropic Claude Code 工作流。用户可以通过交互式 Web 界面或命令行工具浏览并安装超过 100 个组件。该项目还包含用于会话分析、实时对话监控和系统健康诊断的高级实用程序。
本仓库提供了在智能体工程工作流中利用 Claude Code 的全面最佳实践与实施指南。它详细介绍了子智能体、命令、技能和编排模式等核心概念,以优化开发任务。开发者可以探索云端例程、ultrareview 和自动化测试等高级功能,从而提升编码生产力。
Taste Skill 提供了一系列专门设计的指令,旨在提升 AI 编码代理的视觉质量和设计输出。该工具包包含多种技能,涵盖从通用前端生成到极简主义或粗野主义等特定风格的任务。这些与框架无关的文件可以轻松集成到主流 AI 编码代理中,以确保获得优质、专业级的界面效果。
Claude How To 提供了一条结构化且可视化的学习路径,旨在帮助开发者全面掌握 Claude Code 的各项功能。本指南包含十个教程模块、可直接复制的模板以及互动测验,旨在填补基础使用与高级自动化之间的鸿沟。它通过有效地结合 slash commands、memory、subagents 和 MCP servers,使用户能够构建复杂的工作流。