首页排行榜AI · 2026-04

AI 排行榜

2026-04 · 173 个项目 · 按 HubLens 评分排名

1
KittenTTS
KittenTTS 是一个开源的轻量级文本转语音库,利用 ONNX 实现高效的语音合成。该库提供从 15M 到 80M 参数的多种模型尺寸,可在标准 CPU 上实现高质量的音频输出。它内置了文本预处理功能并支持八种不同的音色,非常适合各种边缘部署场景。
13,62292
2
litellm
LiteLLM 是一个开源 AI 网关,它提供了一个使用标准 OpenAI 格式调用 100 多种不同 LLM 提供商的统一接口。它可以作为 Python SDK 进行直接集成,也可以部署为代理服务器来管理负载均衡和支出跟踪等企业级功能。通过抽象化特定提供商的复杂性,它使开发人员无需重写现有代码即可在不同模型之间无缝切换。
43,84692
3
pygwalker
PyGWalker 是一个 Python 库,可将 pandas DataFrames 转换为用于探索性数据分析的交互式用户界面。它将 Graphic Walker 可视化工具直接集成到 Jupyter Notebooks 中,允许用户通过简单的拖放操作创建图表。该库支持各种数据清洗、转换和可视化任务,为数据科学家提供了无缝的工作流程。
15,74992
4
FlashMLA
FlashMLA 是由 DeepSeek 开发的高性能注意力内核库,旨在为其 V3 和 V3.2-Exp 模型提供动力。它为预填充和解码阶段的稀疏和密集注意力机制提供了专门的实现。该库支持 FP8 KV 缓存等高级功能,并针对现代 GPU 架构进行了优化,以最大限度地提高计算吞吐量。
12,55592
5
DeepEP
DeepEP 是一款专为优化 Mixture-of-Experts 和专家并行而设计的通信库,通过高吞吐量、低延迟的 GPU kernels 实现性能提升。它通过提供非对称域带宽转发和基于 hook 的通信计算重叠等高级功能,全面支持训练和推理工作负载。该库针对 NVLink 和 RDMA 环境进行了深度优化,为大规模分布式模型操作提供了显著的性能增益。
9,13692
6
DeepGEMM
DeepGEMM 是一个统一的 CUDA 库,专门为现代大型语言模型提供高性能 Tensor Core 内核。它具备轻量级的 Just-In-Time 编译模块,无需进行复杂的 CUDA 安装构建。该库支持包括 FP8/FP4 GEMMs、融合 Mega MoE 以及用于高效 GPU 计算的 MQA 评分内核在内的高级操作。
6,62192
7
deer-flow
DeerFlow 是一个开源的超级智能体框架,旨在编排子智能体、记忆和沙盒环境以执行复杂任务。该平台在 2.0 版本中进行了彻底重写,通过模块化的基于技能的架构提供了增强的可扩展性。它支持多种部署选项,包括本地开发和基于 Docker 的生产环境,并集成了对各种 LLM 提供商和消息渠道的支持。
62,64292
8
Claude-Code-x-OpenClaw-Guide-Zh
本项目提供了一套系统化且小白友好的中文教程,涵盖了 Anthropic 官方编程工具 Claude Code 和开源 AI 助手框架 OpenClaw。教程包含 25 篇深度指南、70 多个可运行代码示例及 170 多个常见问题解答,旨在帮助开发者快速掌握 AI 编程与自动化工作流。内容实时更新以适配最新版本,为用户提供从零基础到企业级实战的学习路径。
3,37292
9
OpenSandbox
OpenSandbox 是一个专为 AI 应用设计的通用平台,提供统一的 API 和多语言 SDK 来管理沙箱环境。它支持 Docker 和 Kubernetes 运行时,使开发者能够在隔离的容器中执行代码、管理文件并运行命令。该平台还具备强大的安全选项,包括对 gVisor 和 Firecracker 的支持,以确保各种 AI 智能体和训练工作负载的安全执行。
10,07292
10
deer-flow
DeerFlow 是一个开源的超级智能体框架,旨在编排子智能体、记忆和沙盒环境以执行复杂任务。该平台在 2.0 版本中进行了彻底重写,通过模块化的基于技能的架构提供了增强的可扩展性。它支持多种部署选项,包括本地开发和基于 Docker 的生产环境,并集成了对各种 LLM 提供商和消息渠道的支持。
58,26892
11
PaddleOCR
PaddleOCR 是一个综合性工具包,旨在将图像和 PDF 文档转换为 Markdown 和 JSON 等结构化、适配 LLM 的数据格式。它具备最先进的视觉语言模型和高性能文本识别引擎,支持超过 100 种语言。该平台被广泛集成到主流 AI Agent 和 RAG 框架中,可在各种硬件后端上提供高效的部署选项。
75,51091
12
zhangxuefeng-skill
该项目基于张雪峰的著作、采访及决策记录,构建了一套可运行的思维框架而非简单的语录合集。它通过提炼核心心智模型与决策启发式,为用户提供针对专业选择、考研规划及职业发展的深度分析。用户可将其集成至Claude Code中,以张雪峰的视角获取具有实战价值的建议。
6,17789
13
willow
Willow Inference Server 允许用户为各种应用程序自托管闪电般的语言推理任务。它支持包括 speech-to-text、text-to-speech 和大型语言模型处理在内的一系列功能。用户可以访问官方文档和社区讨论,以优化他们在该平台上的使用体验。
3,00988
14
secret-llama
Secret Llama 是一款完全在浏览器中运行的聊天机器人,允许用户在本地运行 Llama 3 和 Mistral 等开源模型。由于该应用程序直接在浏览器内运行,因此没有任何对话数据会离开用户的计算机。它提供了类似于 ChatGPT 的用户友好界面,同时完全离线运行,无需进行任何服务器安装。
2,67688
15
tabby
Tabby 是一款开源、自托管的 AI 编程助手,旨在作为 GitHub Copilot 的私有替代方案。它完全在本地运行,无需外部云服务或复杂的数据库管理。该平台支持消费级 GPU,并通过 OpenAPI 接口与现有基础设施无缝集成。
33,44788
16
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、具有时空掩码的可控生成模型以及专门的评估基准。它支持多种创意任务,包括图像到视频生成、角色 3D 建模、风格迁移和多模态引导。
2,41288
17
xiaomi-miloco
Xiaomi Miloco 是一款开源智能家居解决方案,利用端侧大语言模型来集成并控制 IoT 设备。它通过利用家庭摄像头的视觉数据,实现自然语言交互以进行复杂的任务规划和场景理解。该框架通过在本地处理视频信息,同时与更广泛的 Xiaomi Home 生态系统无缝连接,从而优先保障用户隐私。
2,52688
18
ncnn
ncnn 是一个专为移动平台深度优化的高性能神经网络前向计算框架。该框架无第三方依赖且具备跨平台特性,在手机 CPU 上的运行速度优于目前所有已知的开源框架。开发者可以利用 ncnn 轻松将深度学习模型移植到移动端,从而构建各类智能应用程序。
23,11788
19
slime
Slime 是一个 LLM 后训练框架,旨在通过集成 Megatron 和 SGLang 来促进强化学习的扩展。它提供了高性能的训练能力,以及用于自定义工作流的灵活数据生成接口。该框架已成功应用于支持各种研究项目和生产系统,包括高级推理模型和智能体模型。
5,36888
20
awesome-openclaw-tutorial
本教程为用户提供从零开始掌握 OpenClaw 的全面指南,涵盖安装部署、核心功能实战及进阶自动化技巧。内容基于 OpenClaw v2026.4.14 稳定版进行校对,并提供丰富的实战案例与避坑指南。通过本教程,用户可以快速构建个人 AI 工作助手,实现个人效率的显著提升。
4,17988
21
ai-daily-digest
AI Daily Digest 是一款通过抓取 Hacker News 顶级技术博客并利用 AI 进行多维评分与摘要的自动化工具。它支持通过命令行或交互式对话生成结构化的每日技术日报,并提供趋势总结与可视化统计功能。该项目采用纯 TypeScript 编写且零依赖,支持灵活切换 Gemini、OpenAI 及其他兼容 API 的模型。
1,54488
22
claude_code_src
本项目通过还原 Claude Code 2.1.88 版本的 source map,成功恢复了包含 70 万行代码的可读源码目录。开发者可以借此深入研究该 CLI 工具的命令系统、React 与 Ink 构建的终端 UI 以及 MCP 协议的实现细节。项目旨在提供架构分析与归档参考,帮助技术人员理解其核心业务逻辑与工程设计。
2,17388
23
openocta
OpenOcta 是一款开源的企业级 AI Agent 运行时与控制面,采用单一 Go 二进制文件设计以实现随处部署。该项目集成了 Gateway、Agent、Channels 及 Cron 等核心模块,支持与业务系统、API 和 MCP 工具的无缝对接。开发者可通过内置的 Control UI 或 CLI 快速进行任务编排与自动化集成。
2,41188
24
tong-jincheng-skill
童锦程.skill 是一个基于约20万字一手视频素材构建的 Claude Code 插件,旨在通过“深情祖师爷”的独特视角分析人际关系与情感问题。该工具并非简单的语录复读,而是通过提炼其街头智慧与认知框架,帮助用户以直接且真诚的方式剖析生活困境。用户可以通过简单的指令激活该插件,从而获得关于恋爱、成长及人际交往的决策启发。
1,69888
25
hermes-agent-orange-book
本综合指南详细介绍了由 Nous Research 开发的 Hermes Agent 框架。书中通过十七章内容涵盖了自我改进学习循环、三层记忆系统以及自动化技能演进等核心机制。对于希望实现和定制自主 AI 智能体的开发者及 AI 爱好者而言,本书是一份实用的参考资源。
2,72688
26
Awesome-finance-skills
Awesome-finance-skills 是一个即插即用的金融技能集合,旨在为大语言模型提供实时新闻、股票数据、情感分析及市场预测能力。该项目支持多种主流 Agent 框架,用户可通过简单的命令行操作快速集成金融分析功能。此外,它还提供逻辑链路可视化与专业研报生成工具,助力 AI 智能体实现深度市场洞察。
1,85688
27
khazix-skills
Khazix Skills 是一个开源的 AI 工具集合,旨在将作者积累的方法论转化为可复用的 Prompts 和 Skills。该项目提供轻量级的提示词模板以及遵循 Agent Skills 开放标准的结构化指令集。用户可以通过直接安装或手动配置的方式,将这些工具集成到支持的 AI Agent 中以提升工作效率。
5,30588
28
awesome-openclaw-usecases-zh
本仓库汇集了 46 个经过验证的 OpenClaw AI 智能体真实应用场景,旨在帮助用户通过自动化手段提升工作与生活效率。内容涵盖了从新手入门指南到针对国内生态(如飞书、钉钉、企业微信)的深度适配用例。每个案例均提供详细的设置步骤与可直接复制的提示词,确保用户能够快速上手并实现个性化智能体部署。
3,83188
29
OpenClawChineseTranslation
OpenClaw 汉化发行版为开源个人 AI 助手平台提供了完整的中文界面支持,涵盖 CLI 命令行及 Dashboard 网页控制台。该项目每小时自动同步官方更新,确保用户能及时体验最新功能。用户可通过简单的安装向导快速部署,并利用内置的生态工具实现高效的 AI 交互管理。
3,71788
30
ArcReel
ArcReel 是一款由 AI Agent 驱动的开源视频生成工作台,旨在实现从小说剧本到短视频成片的自动化生产。该平台通过多智能体架构编排任务,支持 Gemini、火山方舟、Grok 及 OpenAI 等多种主流供应商的图像与视频生成能力。用户可通过可视化界面管理项目,并利用异步任务队列与版本回滚功能,高效完成高质量的视频创作。
1,82088
31
Humanizer-zh
Humanizer-zh 是一个专为 Claude Code 设计的技能工具,旨在帮助用户识别并去除文本中常见的 AI 生成痕迹。该项目通过分析 24 种 AI 写作模式,指导用户将机械化的内容改写得更具人类表达的自然感与个性。它不仅提供自动化改写功能,还通过具体的写作原则帮助创作者提升文章的真实质量与可读性。
6,23388
32
FlashMLA
FlashMLA 是由 DeepSeek 开发的高性能注意力内核库,旨在为其 V3 和 V3.2-Exp 模型提供动力。它为预填充和解码阶段的稀疏和密集注意力机制提供了专门的实现。该库支持 FP8 KV 缓存等高级功能,并针对现代 GPU 架构进行了优化,以最大限度地提高计算吞吐量。
12,55286
33
ncnn
ncnn 是一个专为移动平台深度优化的高性能神经网络前向计算框架。该框架无第三方依赖且具备跨平台特性,在手机 CPU 上的运行速度优于目前所有已知的开源框架。开发者可以利用 ncnn 轻松将深度学习模型移植到移动端,从而构建各类智能应用程序。
23,05086
34
VoxCPM
VoxCPM2 是一款无需分词器、拥有 2B 参数的语音合成系统,利用扩散自回归架构生成高质量且富有表现力的音频。该模型支持 30 种语言,并提供语音设计、可控语音克隆以及录音室级别的 48kHz 输出等高级功能。它在 Apache-2.0 许可下完全开源,并通过 vLLM-Omni 和 Nano-vLLM 提供生产就绪的部署选项。
9982
35
EvoCUA
EvoCUA 是一款高性能、开源的多模态模型,专为端到端计算机自动化任务而设计。它在 OSWorld 基准测试中取得了顶级成果,并展示了在 Windows 系统上强大的跨操作系统泛化能力。该模型以其卓越的安全性而闻名,在主流计算机使用智能体中保持着最低的非预期行为发生率。
31082
36
hermes-agent
Hermes Agent 是由 Nous Research 设计的一款自我提升 AI 助手,通过内置的学习循环来创建并优化技能。它支持多种 LLM 提供商,并可部署在 Telegram、Discord 和本地终端环境等各种平台。该系统具备持久化记忆、定时自动化功能,并能够为复杂的并行任务生成子 Agent。
46882
37
page-agent
Page Agent 是一款客户端工具,使用户能够通过自然语言指令控制网页界面。它通过基于文本的 DOM 操作直接在网页内运行,无需浏览器扩展、无头浏览器或多模态 LLM。该库支持灵活的 LLM 集成,并为多页面任务自动化提供了可选扩展。
16,92682
38
WeKnora
WeKnora 是一个智能知识管理与问答框架,利用 LLM 提供企业级的文档理解和语义检索功能。该平台提供基于 RAG 的 Quick Q&A 模式以实现快速查询,以及用于复杂多源推理任务的 ReACT Agent 引擎。它具有高度模块化的架构,支持多种文档格式、多个 LLM 提供商,并可与主流 IM 渠道无缝集成,适用于私有化或本地部署。
13,84582
39
DeepEP
DeepEP 是一款专为优化 Mixture-of-Experts 和专家并行而设计的通信库,通过高吞吐量、低延迟的 GPU kernels 实现性能提升。它通过提供非对称域带宽转发和基于 hook 的通信计算重叠等高级功能,全面支持训练和推理工作负载。该库针对 NVLink 和 RDMA 环境进行了深度优化,为大规模分布式模型操作提供了显著的性能增益。
9,09982
40
OpenSandbox
OpenSandbox 是一个专为 AI 应用设计的通用平台,提供统一的 API 和多语言 SDK 来管理沙箱环境。它支持 Docker 和 Kubernetes 运行时,使开发者能够在隔离的容器中执行代码、管理文件并运行命令。该平台还具备强大的安全选项,包括对 gVisor 和 Firecracker 的支持,以确保各种 AI 智能体和训练工作负载的安全执行。
9,74282
41
khoj
Khoj 是一款多功能的个人 AI 应用程序,旨在通过先进的语义搜索和文档集成来扩展用户能力。它支持多种本地和在线 LLM,同时提供从设备端到云端企业级解决方案的灵活部署选项。用户可以创建自定义 Agent,并在包括 Obsidian、Emacs 和移动设备在内的各种平台上自动化研究任务。
34,15578
42
code-review-graph
code-review-graph 使用 Tree-sitter 构建代码库的结构图,为 AI 助手提供精确且具备上下文感知的信息。通过增量跟踪变更并计算编辑的影响范围,它显著降低了代码审查过程中的 Token 消耗。该工具通过 Model Context Protocol 与各种 AI 编码平台无缝集成,确保仅分析相关的代码。
9478
43
Kronos
Kronos 是一个开源的仅解码器基础模型,专门用于解读和预测金融 K 线序列。它采用两阶段框架,将多维市场数据量化为分层 Token,随后通过自回归 Transformer 进行处理。该项目提供了预训练模型、专门的预测器类以及用于在自定义金融数据集上进行微调的完整流水线。
8878
44
graphify
graphify 是一款 AI 编程助手技能,能够从代码库、文档、图像和媒体文件中构建持久化的知识图谱。它利用 tree-sitter 进行确定性的代码结构提取,并使用多模态 LLM 代理来识别不同文件类型之间的概念和关系。生成的图谱提供了一份交互式地图和审计报告,帮助 AI 助手在显著降低 Token 使用量的情况下导航复杂的项目。
21778
45
rtk
RTK 是一款高性能 CLI 代理,通过过滤和压缩命令输出来显著降低 LLM 的 Token 消耗。它支持超过 100 种常用命令,并可通过自动重写钩子与主流 AI 编程工具无缝集成。通过应用智能过滤、分组和截断技术,它能帮助开发者在 AI 辅助开发过程中节省高达 90% 的 Token 成本。
19178
46
openai-agents-python
OpenAI Agents SDK 是一个轻量级框架,旨在构建复杂的多智能体工作流。它支持多种 LLM,并提供工具集成、护栏机制和人机协作等核心功能。开发者还可以利用沙盒智能体处理长时间运行的任务,并借助内置的追踪功能来调试和优化智能体应用。
18978
47
claude-code-local
Claude Code Local 提供了一套高性能 AI 模型,可完全在 Apple Silicon 硬件上运行,无需连接云端。该项目具备原生 MLX 服务器,支持在本地执行 Claude Code、浏览器自动化及语音交互,同时确保数据完全隐私。通过消除出站网络调用和遥测,它为处理敏感专业任务提供了一个安全的离线环境。
8378
48
multica
Multica 是一个开源平台,旨在将 coding agents 集成到人类团队中作为自主队友。它提供了一个统一的仪表板,用于跨各种 agent runtimes 进行任务分配、执行监控和技能复合。该系统支持多工作区协作,并允许团队管理 AI 驱动的开发任务的全生命周期。
17578
49
worldmonitor
World Monitor 是一个由 AI 驱动的平台,它将全球新闻、地缘政治数据和基础设施追踪整合到一个统一的态势感知界面中。它配备了双地图引擎和全面的情报指数,旨在提供跨行业的流数据关联分析。该项目支持通过 Tauri 进行原生桌面部署,并为金融、技术和商品监控提供了多种专业变体。
8278
50
voicebox
Voicebox 是一个全面的本地优先语音合成工作室,允许用户使用七种不同的 TTS 引擎进行语音克隆和语音生成。该平台支持 23 种语言,并包含一个多轨时间轴编辑器,用于创建带有后期处理效果的复杂音频叙事。它专为隐私和性能而设计,可在 macOS、Windows 和 Linux 上原生运行,同时为外部集成提供 REST API。
17578
51
ppt-master
PPT Master 是一个开源工作流,支持 AI IDE 从多种文档格式生成完全可编辑的 PowerPoint 演示文稿。与导出静态图像的工具不同,该系统创建的文件包含用户可直接修改的真实形状、文本框和图表。它通过本地运行并支持多种 AI 模型来优先保障数据隐私和灵活性,且不会产生平台锁定。
10878
52
andrej-karpathy-skills
本项目提供了一套结构化指南,旨在通过解决过度复杂化和错误假设等常见陷阱来改善 LLM 的编码行为。它实施了四大核心原则——先思考后编码、简洁至上、外科手术式修改以及目标驱动执行,以确保生成更精确可靠的代码。用户可以通过 Claude Code 插件、CLAUDE.md 文件或 Cursor rules 将这些规则轻松集成到开发工作流中。
91578
53
cc-switch
CC Switch 是一款桌面应用程序,为管理 Claude Code、Codex 和 Gemini CLI 等多种 AI 驱动的 CLI 工具提供了集中式界面。它通过提供 50 多种提供商预设和用于统一管理的视觉仪表板,消除了手动编辑配置文件的需求。该工具还具备跨平台支持、云同步以及用于跟踪使用情况和管理 MCP 服务器的内置实用程序。
8778
54
CL4R1T4S
CL4R1T4S 提供了一个全面的存储库,汇集了来自主流 AI 模型和智能体的提取系统提示词、指南及工具。该项目旨在通过揭示塑造 AI 模型行为及用户交互方式的隐藏指令来提高透明度。它鼓励社区贡献,共同记录并分享这些底层的提示词框架,以促进对 AI 智能的深入理解。
28878
55
agent-skills
Agent Skills 提供了一个结构化的工程工作流库,旨在帮助 AI 编程智能体在整个开发生命周期中遵循专业最佳实践。该项目包含 20 种专业技能,涵盖从规范驱动开发到安全加固的各个方面,从而确保生成代码的一致性和质量。这些技能与各种 AI 智能体和 IDE 兼容,确保自动化任务能够达到生产级标准。
13978
56
awesome-design-md
本仓库提供了一系列精选的 DESIGN.md 文件,旨在让 AI 代理能够生成一致且像素级完美的 UI。每个文档都基于流行的真实网站,涵盖了配色方案、排版和组件样式等核心设计元素。开发者只需将这些文件放入项目中,即可引导 AI 编程代理匹配特定的设计美学。
34478
57
mempalace
MemPalace 提供了一种本地优先的解决方案,用于将对话历史记录存储为逐字文本,并具备结构化的语义搜索功能。该系统利用可插拔的后端架构将数据组织到 wings、rooms 和 drawers 中,且无需进行外部 API 调用。它在确保所有用户数据严格保留在本地机器上的同时,实现了高检索召回率基准。
8078
58
taste-skill
Taste Skill 提供了一系列专门的指令,旨在提高 AI Agent 生成的前端代码质量。该工具包提供从极简主义到粗野主义等多种设计风格,并可通过可调参数自定义差异性和动态效果。它与框架无关,可与主流 AI 编码工具无缝集成,确保输出专业级的高品质界面。
14978
59
caveman
Caveman 是一款专为 AI 智能体设计的插件,通过强制执行简洁的电报式沟通风格,显著降低输出 Token 的使用量。它在保持技术准确性的同时,利用其压缩工具减少了约 75% 的输出 Token 和 46% 的输入 Token。该项目支持包括 Claude Code、Cursor 和 Gemini 在内的多种智能体,并提供多种强度级别以及如文言文等专业模式。
26478
60
DeepTutor
DeepTutor 是一个 Agent-Native 平台,通过聊天、深度研究和测验生成等多种交互模式,为个性化学习提供统一的工作空间。它配备了具有持久记忆的自主 TutorBots,以及可直接集成个人知识库的协作式 AI Co-Writer。用户可以通过引导式 CLI、手动安装或 Docker 部署该系统,从而创建量身定制的教育环境。
14678
61
evolver
Evolver 是一个基于 GEP 的引擎,旨在通过将临时的 prompt 调整转化为可审计、可复用的资产,从而促进 AI Agent 的自我进化。它通过扫描运行时日志和内存来生成受协议约束的 prompt,在不直接修改源代码的情况下引导 Agent 进行改进。该系统支持多种操作模式,包括独立执行、持续后台循环以及与 OpenClaw 和 Cursor 等 Agent 运行时的集成。
16778
62
Claude-Code-Game-Studios
Claude Code Game Studios 通过由 49 个专业智能体组成的层级团队,将标准的 AI 编码会话转化为结构化的游戏开发环境。该系统提供 72 个 slash commands 和自动化验证钩子,在整个开发生命周期中强制执行专业的设计、编码和生产标准。用户在保持对项目完全控制的同时,能够受益于 AI 驱动的组织架构、质量门禁和特定领域的专业知识。
19278
63
omi
Omi 是一个开源平台,通过实时捕获并转录您的屏幕和对话内容,充当您的数字第二大脑。它提供 AI 驱动的摘要、待办事项以及能够记住您所见所闻的对话式交互界面。该系统支持跨桌面、移动端及专用可穿戴硬件的平台集成。
17678
64
jaqmc
JaQMC 是一个基于 JAX 构建的模块化框架,利用深度神经网络作为变分波函数来求解电子薛定谔方程。它提供了一个灵活的环境,用于对原子、分子和固态系统中的相互作用电子进行建模,而无需依赖传统的基组。该平台支持 FermiNet 和 PsiFormer 等先进架构,同时利用 JIT 编译和多设备并行化来实现高性能模拟。
10178
65
vLLM-Kunlun
vLLM Kunlun 是一个由社区维护的插件,旨在实现 vLLM 在 Kunlun XPU 硬件上的无缝运行。它利用硬件可插拔接口将 Kunlun 后端与核心 vLLM 框架解耦。通过此集成,用户能够在 Kunlun3 P800 硬件上高效运行各种 Transformer、Mixture-of-Expert 和多模态模型。
39778
66
ERNIE-Image
ERNIE-Image 是百度开发的一款基于单流 Diffusion Transformer (DiT) 架构的开源文生图模型。该模型配备了轻量级提示词增强器,能够将简短的用户输入扩展为结构丰富的详细描述。凭借 8B 参数规模,它在保持高效部署的同时,在文本渲染和指令遵循方面展现了卓越的性能。
26778
67
rtp-llm
RTP-LLM 是由阿里巴巴基础模型推理团队开发的高性能大语言模型推理加速引擎。该引擎已在淘宝、天猫等多个阿里业务场景中广泛应用,并支持多种主流模型格式与硬件架构。它通过集成先进的算子优化、量化技术及分布式推理能力,为开发者提供高效且灵活的部署方案。
1,09178
68
anolisa
ANOLISA 是 Anolis OS 的演进版本,专为充当 AI Agent 工作负载的操作系统而设计。它提供了一套全面的架构,包括 Copilot Shell、安全内核以及基于 eBPF 的可观测性工具。该平台提供了一个精选的系统管理和 DevOps 技能库,以促进高效的 AI Agent 管理。
15978
69
TorchEasyRec
TorchEasyRec 是一个基于 PyTorch 的框架,旨在构建生产就绪的深度学习推荐模型。它支持包括候选生成、排序、多任务学习和生成式推荐在内的广泛任务。该框架提供了灵活的配置、分布式训练能力,并能与各种数据源和部署环境无缝集成。
36478
70
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端的开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等先进功能。该平台被广泛应用于各个工业领域,旨在帮助开发者和企业高效地实现 AI 解决方案的商业化。
23,83778
71
claude-mem
Claude-Mem 是一个专为 Claude Code 及类似 CLI 工具设计的持久化记忆压缩系统,旨在跨会话保持上下文。它能自动捕获工具使用情况并生成语义摘要,以确保项目知识的连续性。该系统包含一个 Web 查看器、混合搜索功能以及为开发者提供的细粒度隐私控制。
20178
72
claude-code-best-practice
本仓库提供了一系列关于优化 Claude Code 的最佳实践、实现模式和工作流程的综合指南。它涵盖了子智能体、命令、技能和编排等核心概念,旨在帮助开发者从基础编码转型为高级智能体工程。用户可以探索各种开发工作流和集成策略,以提升生产力和自动化能力。
6378
73
CLIProxyAPI
CLIProxyAPI 是一个多功能代理服务器,为各种命令行工具提供兼容 OpenAI、Gemini 和 Claude 的 API 接口。它支持针对 OpenAI Codex 和 Claude Code 等模型的基于 OAuth 的身份验证,从而实现与本地或多账号设置的无缝集成。该项目还具备高级负载均衡、模型映射以及可重用的 Go SDK,用于将代理功能嵌入到自定义应用程序中。
5578
74
t3code
T3 Code 提供了一个专为与编码代理交互而设计的极简 Web 图形用户界面。该平台目前支持与 Codex 和 Claude 集成,并计划在未来扩展对更多提供商的支持。用户可以通过桌面应用程序访问该工具,也可以直接使用 npx 运行以实现快速部署。
5678
75
magika
Magika 是一款利用深度学习提供高精度文件类型识别的 AI 工具,支持超过 200 种内容类型。它配备了高度优化的模型,能够在毫秒级时间内提供推理结果,同时保持约 99% 的准确率。该项目提供通用的命令行界面以及 Python、JavaScript 和 Rust 语言绑定,以支持多样化的开发者工作流程。
10878
76
pi-autoresearch
pi-autoresearch 是 pi AI 编码代理的一个扩展,通过测试、基准测试和优化代码变更来实现自主优化循环。它通过持久化会话工作流支持多种优化目标,例如测试速度、包大小和 LLM 训练指标。该工具包含一个实时仪表板、用于过滤噪声的置信度评分,以及将实验最终确定为干净且可审查分支的功能。
11578
77
chrome-devtools-mcp
Chrome DevTools for Agents 是一个 MCP server,旨在让 AI coding assistants 能够控制并检查运行中的 Chrome 浏览器实例。它提供了一套全面的工具,用于浏览器自动化、性能分析以及深度调试。该项目支持与各种 AI coding platforms 无缝集成,通过可靠的浏览器交互来增强开发者的工作流程。
8378
78
FastDeploy
FastDeploy 是基于飞桨的专业大语言模型与视觉语言模型推理部署工具包,旨在提供开箱即用的生产级部署解决方案。该工具包支持多种主流硬件平台,并集成了负载均衡、统一KV缓存传输及全量化格式支持等高级加速技术。开发者可通过兼容 OpenAI API 的接口实现快速部署,从而显著提升模型推理的吞吐量与资源利用率。
3,67578
79
open-agents
Open Agents 是一个开源参考应用程序,旨在 Vercel 平台上构建和运行后台编码代理。该系统采用三层架构,将 Web 界面、持久化代理工作流和隔离的沙盒执行环境分离开来。这种模块化设计使开发人员能够执行复杂的编码任务(如存储库管理和自动拉取请求),而无需本地机器的持续参与。
8478
80
learn-claude-code
本仓库提供了一份全面的教育指南,旨在通过将模型智能与环境基础设施分离,为 AI Agent 构建高效的工程化框架。它包含十二个循序渐进的课程,教授开发者如何实现工具、上下文管理和任务协调,以支持 Agent 的自主行为。通过对 Claude Code 的架构进行逆向工程,该项目展示了如何创建稳健的系统,使模型能够在特定领域内进行感知、推理和行动。
5578
81
ai-engineering-from-scratch
本综合课程提供涵盖 20 个阶段的 260 多节课程,旨在帮助开发者掌握从基础数学到高级自主智能体集群的 AI 工程技术。课程采用 AI 原生学习方法,学生将与编码智能体协作构建、测试并部署可复用的工具。教学大纲跨越 Python、TypeScript、Rust 和 Julia 等多种编程语言,以确保学员获得实用的生产级技能。
8278
82
impeccable
Impeccable 是一套全面的设计技能和命令集,旨在引导 AI 代理进行卓越的前端 UI 开发。它提供特定领域的参考资料和精选的反模式,帮助开发者避免通用模板和糟糕的可访问性等常见设计错误。该工具支持多种 AI 编码环境,并包含一个用于检测跨项目设计问题的独立 CLI。
5378
83
claude-howto
Claude How To 提供了一条结构化且可视化的学习路径,旨在帮助开发者全面掌握 Claude Code 的各项功能。本指南包含可直接复制的模板、互动测验以及涵盖从 slash commands 到复杂 agent 工作流的详细教程。它旨在填补基础功能认知与构建生产级自动化流水线能力之间的鸿沟。
5478
84
gbrain
GBrain 是一个自主记忆系统,旨在为 AI 代理提供一个持久且不断进化的知识库,使其智能水平随时间推移而累积。它利用“精简架构,强大技能”的设计来摄取、丰富并组织来自会议、电子邮件和笔记等各种来源的数据。该系统配备了混合搜索引擎和 25 种专业技能,使代理能够自主执行复杂任务、维护引用并管理信息。
4578
85
pi-mono
Pi Monorepo 提供了一套全面的工具,旨在构建 AI Agent 并管理 LLM 部署。它包含了用于 Agent 运行时、多提供商 LLM API 以及交互式编码 Agent 界面的各种软件包。开发者还可以通过分享开源编码 Agent 会话来为生态系统做出贡献,从而帮助提升真实世界模型的性能。
5778
86
ROCK
ROCK 是一个专为智能体强化学习应用设计的可扩展环境管理框架。它利用客户端-服务器架构,为开发、测试和研究提供安全且隔离的沙盒环境。该平台支持 GEM 协议等标准化接口,并提供统一的 SDK 以实现与强化学习智能体的无缝交互。
41778
87
PaddleX
PaddleX 是基于飞桨框架构建的低代码开发工具,集成了 200 多种预训练模型与 33 条模型产线。它支持从模型训练到推理的全流程开发,并兼容多种国内外主流硬件。开发者可通过极简的 Python API 或图形界面,快速实现产业级 AI 应用的落地与部署。
6,10878
88
weft
Weft 是一种旨在将 LLM、人类交互和基础设施集成到统一可视化工作流中的编程语言。它具备持久化执行功能以确保程序在崩溃后仍能运行,并通过类型化的模块化节点系统支持复杂逻辑。开发者无需手动配置,即可通过连接原生节点来构建和管理复杂的智能体系统。
5778
89
fireworks-tech-graph
fireworks-tech-graph 使用户能够直接从自然语言描述中生成专业的 SVG 和 PNG 技术图表。该工具支持 14 种 UML 图表类型,并包含 7 种专为各种文档需求量身定制的独特视觉风格。它专门针对 AI 和基于 agent 的领域模式进行了优化,无需手动绘图即可实现快速可视化。
6378
90
opendataloader-pdf
OpenDataLoader PDF 是一款高性能开源解析器,旨在将 PDF 文档转换为 Markdown、JSON 和 HTML 等结构化格式,以供 AI 和 RAG 流水线使用。它采用混合处理模式,结合确定性本地解析与 AI 驱动分析,为复杂表格、公式和扫描文档实现行业领先的提取精度。此外,该项目还提供自动化无障碍解决方案,包括符合国际标准的端到端 Tagged PDF 生成功能。
6678
91
OpenMontage
OpenMontage 是一个开源的智能体系统,它将 AI 编程助手转变为功能全面的视频制作工作室。它实现了整个创作工作流的自动化,涵盖了研究、脚本编写、素材生成、剪辑以及最终合成。该平台支持使用多种免费和付费工具来制作 AI 生成的视觉内容以及真实素材的纪录片蒙太奇。
6878
92
oh-my-codex
oh-my-codex 是一个旨在改善 OpenAI Codex CLI 日常运行体验的工作流增强层。它通过 deep-interview 和基于团队的并行处理等专用命令,为任务澄清、规划和执行提供了结构化流程。该工具将项目状态、日志和内存维护在本地的 .omx 目录中,以确保开发工作流的一致性和持久性。
5978
93
agentkit-samples
AgentKit 代码工坊是火山引擎推出的 AI Agent 开发平台配套示例仓库,旨在帮助开发者快速掌握智能体构建与部署流程。该项目提供了从基础入门到复杂业务场景的多种代码示例,涵盖了多智能体协作、RAG 检索增强及工具调用等核心功能。开发者可以通过这些教程深入理解 AgentKit 的开发工具链,从而高效实现各类智能化应用。
31078
94
PaddleFormers
PaddleFormers 是基于飞桨框架构建的 Transformers 库,旨在为大语言模型和视觉语言模型提供与 Hugging Face 对等的训练接口。该项目通过集成张量并行、流水线并行及自动混合精度等技术,实现了在重点模型上超越 Megatron-LM 的训练性能。此外,它还全面支持 Safetensors 格式并深度适配了多种国产计算芯片,助力开发者高效完成全流程模型训练。
12,98778
95
colleague-skill
colleague.skill 允许用户通过处理各种通信数据源,基于同事的工作习惯和个性创建 AI 角色。该系统采用两部分架构,结合了专业工作能力与细微的行为特征,以模拟真实的交互。用户可以轻松管理、更新和回滚这些 AI 技能,以保持对团队成员专业知识的准确呈现。
5378
96
camofox-browser
Camofox-browser 是一款专为 AI Agent 提供可靠网页浏览能力的服务器,利用 Camoufox 引擎实现 C++ 级别的指纹伪装。它提供 REST API,通过可访问性快照、稳定的元素引用和内置搜索宏简化了交互过程。该系统针对效率和部署进行了优化,具备自动空闲关闭和会话隔离功能,以支持可扩展的 Agent 操作。
6278
97
get-shit-done
get-shit-done 是一个规范驱动的开发系统,旨在通过防止 AI 编程助手中的上下文衰减来保持高质量的代码。它协调子代理来处理项目规划、研究和执行,同时保持清晰的 git 历史记录和原子提交。该系统为开发人员提供了一个结构化的工作流程,无需企业级项目管理的开销即可持续构建复杂功能。
8578
98
timesfm
TimesFM 是由 Google Research 专门为时间序列预测任务开发的仅解码器基础模型。最新的 2.5 版本采用了 200M 参数架构,支持高达 16k 的上下文长度和连续分位数预测。该存储库提供了用于推理、使用 LoRA 进行微调以及与代理工作流集成的全面工具。
7578
99
paseo
Paseo 提供了一个统一的接口,用于在本地机器上管理和运行 Claude Code、Codex 和 OpenCode 等各种编码代理。它支持跨设备工作流,允许用户通过桌面端、移动端、Web 或 CLI 应用程序与代理进行交互。该平台优先考虑隐私,在无需遥测或强制登录的情况下运行,同时具备强大的代理编排功能。
6278
100
oh-my-claudecode
oh-my-claudecode 提供了一个多智能体编排层,旨在以零学习成本增强 Claude Code 的使用体验。它直接在终端内实现了团队协作任务执行、智能模型路由和持久化自主工作流等高级功能。该工具通过自动化任务委派、并行处理和苏格拉底式的需求澄清,简化了复杂的开发任务。
5678
101
tair-kvcache
Tair KVCache 是阿里云开发的一套系统,旨在通过分布式内存池和动态多级缓存技术加速大语言模型推理。该项目提供了一个用于统一元数据处理的集中式管理器,以及一个无需 GPU 资源即可预测性能指标的仿真工具。这些组件协同工作,在提高推理效率的同时降低了整体基础设施成本。
13778
102
awesome-openclaw-tutorial
本教程为用户提供从零开始掌握 OpenClaw 的全面指南,涵盖安装部署、核心功能实战及进阶自动化技巧。内容基于 OpenClaw v2026.4.14 稳定版进行校对,并提供丰富的实战案例与避坑指南。通过本教程,用户可以快速构建个人 AI 工作助手,实现个人效率的显著提升。
3,87878
103
claude_code_src
本项目通过还原 Claude Code 2.1.88 版本的 source map,成功恢复了包含 70 万行代码的可读源码目录。开发者可以借此深入研究该 CLI 工具的命令系统、React 与 Ink 构建的终端 UI 以及 MCP 协议的实现细节。项目旨在提供架构分析与归档参考,帮助技术人员理解其核心业务逻辑与工程设计。
2,03578
104
Humanizer-zh
Humanizer-zh 是一个专为 Claude Code 设计的技能工具,旨在帮助用户识别并去除文本中常见的 AI 生成痕迹。该项目通过分析 24 种 AI 写作模式,指导用户将机械化的内容改写得更具人类表达的自然感与个性。它不仅提供自动化改写功能,还通过具体的写作原则帮助创作者提升文章的真实质量与可读性。
5,52778
105
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端的开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等先进功能。该平台被广泛应用于各个工业领域,旨在帮助开发者和企业高效地实现 AI 解决方案的商业化。
23,80478
106
Claude-Code-x-OpenClaw-Guide-Zh
本项目提供了一套系统化且小白友好的中文教程,涵盖了 Anthropic 官方编程工具 Claude Code 和开源 AI 助手框架 OpenClaw。教程包含 25 篇深度指南、70 多个可运行代码示例及 170 多个常见问题解答,旨在帮助开发者快速掌握 AI 编程与自动化工作流。内容实时更新以适配最新版本,为用户提供从零基础到企业级实战的学习路径。
2,96978
107
awesome-openclaw-usecases-zh
本仓库汇集了 46 个经过验证的 OpenClaw AI 智能体真实应用场景,旨在帮助用户通过自动化手段提升工作与生活效率。内容涵盖了从新手入门指南到针对国内生态(如飞书、钉钉、企业微信)的深度适配用例。每个案例均提供详细的设置步骤与可直接复制的提示词,确保用户能够快速上手并实现个性化智能体部署。
3,46978
108
OpenClawChineseTranslation
OpenClaw 汉化发行版为开源个人 AI 助手平台提供了完整的中文界面支持,涵盖 CLI 命令行及 Dashboard 网页控制台。该项目每小时自动同步官方更新,确保用户能及时体验最新功能。用户可通过简单的安装向导快速部署,并利用内置的生态工具实现高效的 AI 交互管理。
3,65678
109
MedgeClaw
MedgeClaw 是一个开源的生物医学研究助手,它集成了 OpenClaw 和 Claude Code 以自动化复杂的科学工作流程。用户可以通过 WhatsApp、Slack 或 Discord 等消息平台与系统交互,从而在 R 和 Python 环境中触发分析。该平台提供了一个实时研究仪表板,用于监控进度、查看代码以及访问交互式输出。
94176
110
ai-daily-digest
AI Daily Digest 是一款通过抓取 Hacker News 顶级技术博客并利用 AI 进行多维评分与摘要的自动化工具。它支持通过命令行或交互式对话生成结构化的每日技术日报,并提供趋势总结与可视化统计功能。该项目采用纯 TypeScript 编写且零依赖,支持灵活切换 Gemini、OpenAI 及其他兼容 API 的模型。
1,51076
111
slime
Slime 是一个 LLM 后训练框架,旨在通过集成 Megatron 和 SGLang 来促进强化学习的扩展。它提供了高性能的训练能力,以及用于自定义工作流的灵活数据生成接口。该框架已成功应用于支持各种研究项目和生产系统,包括高级推理模型和智能体模型。
5,12976
112
chinese-novelist-skill
Chinese-novelist 是一个专为 Claude Code 设计的技能插件,旨在帮助用户通过简单的交互完成中文小说的全流程创作。用户只需回答五个核心问题,AI 即可自动生成详细的大纲、人物档案及连贯的章节内容。该工具内置了专业的创作法则与质量检查清单,能够确保小说情节的连贯性与吸引力。
94376
113
chinese-novelist-skill
Chinese-novelist 是一个专为 Claude Code 设计的技能插件,旨在帮助用户通过简单的交互完成中文小说的全流程创作。用户只需回答五个核心问题,AI 即可自动生成详细的大纲、人物档案及连贯的章节内容。该工具内置了专业的创作法则与质量检查清单,能够确保小说情节的连贯性与吸引力。
99374
114
MedgeClaw
MedgeClaw 是一个开源的生物医学研究助手,它集成了 OpenClaw 和 Claude Code 以自动化复杂的科学工作流程。用户可以通过 WhatsApp、Slack 或 Discord 等消息平台与系统交互,从而在 R 和 Python 环境中触发分析。该平台提供了一个实时研究仪表板,用于监控进度、查看代码以及访问交互式输出。
95374
115
thunderbolt
Thunderbolt 是一款专为本地部署和数据所有权而设计的开源跨平台 AI 客户端。它支持在桌面和移动环境中运行各种前沿模型、本地模型及私有化部署模型。该项目目前处于活跃开发阶段,重点关注企业级就绪能力与安全性。
17472
116
learn-opencode
OpenCode 是一门面向零基础用户的免费开源 AI 实战课程,旨在帮助用户在 4 小时内掌握利用 AI 提升工作效率的方法。该教程提供深度中文内容,支持国内主流模型直连,无需复杂的网络配置。课程涵盖从快速起步到深度定制的五个阶段,并提供丰富的实战项目与 Prompt 模板供学习者使用。
1,27272
117
ROLL
ROLL 是一个高效且用户友好的强化学习库,专为在大规模 GPU 集群上训练和扩展 Large Language Models 而设计。它利用由 Ray 驱动的多角色分布式架构,以支持诸如人类偏好对齐、推理和 Agentic 交互等复杂任务。该框架集成了 Megatron-Core、vLLM 和 SGLang 等先进技术,旨在加速跨不同硬件环境的模型训练和推理。
3,04772
118
Awesome-finance-skills
Awesome-finance-skills 是一个即插即用的金融技能集合,旨在为大语言模型提供实时新闻、股票数据、情感分析及市场预测能力。该项目支持多种主流 Agent 框架,用户可通过简单的命令行操作快速集成金融分析功能。此外,它还提供逻辑链路可视化与专业研报生成工具,助力 AI 智能体实现深度市场洞察。
1,59572
119
FastDeploy
FastDeploy 是基于飞桨的专业大语言模型与视觉语言模型推理部署工具包,旨在提供开箱即用的生产级部署解决方案。该工具包支持多种主流硬件平台,并集成了负载均衡、统一KV缓存传输及全量化格式支持等高级加速技术。开发者可通过兼容 OpenAI API 的接口实现快速部署,从而显著提升模型推理的吞吐量与资源利用率。
3,66972
120
claude-cookbooks
Claude Cookbooks 提供了一系列全面的代码片段和指南,旨在帮助开发者将 Claude 集成到自己的应用程序中。该存储库涵盖了广泛的主题,包括工具使用、多模态功能以及提示词缓存等高级技术。这些资源旨在方便开发者根据不同的编程语言和项目需求进行灵活调整。
9268
121
Protenix
Protenix 是一个专为高精度生物分子结构预测而设计的开源框架,其提供的模型性能可与最先进的方法相媲美。该项目提供了多个版本,包括增强版的 Protenix-v2,它在抗体-抗原结构预测和配体相关合理性方面展现了显著的改进。该项目基于 Apache 2.0 许可证发布,可免费用于学术和商业研究应用。
1,75268
122
autoflow
AutoFlow 是一款开源知识库工具,利用基于 TiDB Vector、LlamaIndex 和 DSPy 构建的 Graph RAG 技术。该平台提供由内置高级网站爬虫驱动的 Perplexity 风格对话式搜索体验。用户还可以使用简单的 JavaScript 代码片段将可自定义的搜索小部件集成到自己的网站中。
2,75868
123
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、具有时空掩码的可控生成模型以及专门的评估基准。它支持多种创意任务,包括图像到视频生成、角色 3D 建模、风格迁移和多模态引导。
2,40368
124
xiaomi-miloco
Xiaomi Miloco 是一款开源智能家居解决方案,利用端侧大语言模型来集成并控制 IoT 设备。它通过利用家庭摄像头的视觉数据,实现自然语言交互以进行复杂的任务规划和场景理解。该框架通过在本地处理视频信息,同时与更广泛的 Xiaomi Home 生态系统无缝连接,从而优先保障用户隐私。
2,50068
125
rtp-llm
RTP-LLM 是由阿里巴巴基础模型推理团队开发的高性能大语言模型推理加速引擎。该引擎已在淘宝、天猫等多个阿里业务场景中广泛应用,并支持多种主流模型格式与硬件架构。它通过集成先进的算子优化、量化技术及分布式推理能力,为开发者提供高效且灵活的部署方案。
1,08068
126
pipcook
Pipcook 是一个模块化的 JavaScript 应用框架,旨在帮助前端工程师将机器学习集成到他们的工作流程中。它提供了一个全面的流水线系统,允许用户直接在 Node.js 环境中训练、验证和部署机器学习模型。通过桥接对 Python 包的访问,该框架使开发人员能够利用强大的机器学习工具,而无需具备该领域的深厚专业知识。
2,59365
127
pipcook
Pipcook 是一个模块化的 JavaScript 应用框架,旨在帮助前端工程师将机器学习集成到他们的工作流程中。它提供了一个全面的流水线系统,允许用户直接在 Node.js 环境中训练、验证和部署机器学习模型。通过桥接对 Python 包的访问,该框架使开发人员能够利用强大的机器学习工具,而无需具备该领域的深厚专业知识。
2,59362
128
community
PaddlePaddle 社区是开发者通过代码改进、文档编写和技术分享为框架做出贡献的核心枢纽。它提供结构化的治理机制、专门的工作组以及各类导师计划,以支持开发者的积极参与。贡献者将通过官方认证、发布说明以及项目作者记录获得认可。
14058
129
EvoCUA
EvoCUA 是一款高性能、开源的多模态模型,专为端到端计算机自动化任务而设计。它在 OSWorld 基准测试中取得了顶级成果,并展示了在 Windows 系统上强大的跨操作系统泛化能力。该模型以其卓越的安全性而闻名,在主流计算机使用智能体中保持着最低的非预期行为发生率。
30352
130
vLLM-Kunlun
vLLM Kunlun 是一个由社区维护的插件,旨在实现 vLLM 在 Kunlun XPU 硬件上的无缝运行。它利用硬件可插拔接口将 Kunlun 后端与核心 vLLM 框架解耦。通过此集成,用户能够在 Kunlun3 P800 硬件上高效运行各种 Transformer、Mixture-of-Expert 和多模态模型。
38952
131
PaConvert
该工具由Paddle官方维护,旨在实现PyTorch代码到PaddlePaddle代码的高效自动化迁移。它支持超过1600个PyTorch API及200个torchvision API的一键转换,在测试中保持了95%以上的平均转换率。转换过程通过命令行操作,能够保持原代码的风格与结构,并提供详细的转换日志与总结。
12548
132
ROCK
ROCK 是一个专为智能体强化学习应用设计的可扩展环境管理框架。它利用客户端-服务器架构,为开发、测试和研究提供安全且隔离的沙盒环境。该平台支持 GEM 协议等标准化接口,并提供统一的 SDK 以实现与强化学习智能体的无缝交互。
39848
133
anolisa
ANOLISA 是 Anolis OS 的演进版本,专为充当 AI Agent 工作负载的操作系统而设计。它提供了一套全面的架构,包括 Copilot Shell、安全内核以及基于 eBPF 的可观测性工具。该平台提供了一个精选的系统管理和 DevOps 技能库,以促进高效的 AI Agent 管理。
13045
134
ai-website-cloner-template
AI Website Cloner Template 是一个可重用的框架,旨在利用 AI 编码代理将现有网站逆向工程为现代 Next.js 代码库。通过提供目标 URL,该系统执行一个多阶段流水线,提取设计令牌、资源和组件规范以重建站点。它支持多种 AI 代理,并使用包括 Next.js 16、Tailwind CSS v4 和 shadcn/ui 在内的技术栈。
12042
135
PaddleCustomDevice
PaddleCustomDevice 是飞桨框架提供的自定义硬件接入实现方案。该项目旨在帮助开发者将各类第三方硬件后端集成到飞桨生态中。目前已支持包括昇腾、寒武纪、英特尔GPU及苹果MPS在内的多种主流硬件后端。
10342
136
gallery
Google AI Edge Gallery 是一款旨在直接在您的设备上运行强大的开源 Large Language Models 的移动应用程序。它为用户提供了一个完全离线且私密的环境,以体验先进的生成式 AI 功能,包括最新的 Gemma 4 系列。该应用程序提供了一套全面的工具,用于模型管理、基准测试和交互式 AI 功能。
10842
137
PaddleCustomDevice
PaddleCustomDevice 是飞桨框架提供的自定义硬件接入实现方案。该项目旨在帮助开发者将各类第三方硬件后端集成到飞桨生态中。目前已支持包括昇腾、寒武纪、英特尔GPU及苹果MPS在内的多种主流硬件后端。
10342
138
memvid
Memvid是一个无需数据库的单文件内存层,旨在为AI智能体提供即时检索和长期记忆功能。它通过创新的“智能帧”设计,将数据、嵌入和索引封装在单个文件中,实现了高效的压缩与并行读取。该系统具有模型无关、基础设施零依赖的特点,支持在各种离线或在线场景中实现持久化记忆。
9942
139
ralph
Ralph 是一个自主 AI Agent 循环,它使用 Amp 或 Claude Code 等工具重复执行编码任务,直到满足所有项目需求。每次迭代都在全新的上下文中运行,通过 git 历史记录、进度日志和结构化的 JSON 任务列表来维护项目状态。该系统通过将大型功能分解为可通过自动化质量检查验证的可管理用户故事,确保项目持续推进。
15538
140
CorridorKey
CorridorKey 是一款基于神经网络的工具,旨在解决将前景主体从绿幕背景中分离的复杂问题。通过为每个像素预测真实的原始颜色和清晰的线性 alpha 通道,它能够保留传统抠像工具常会破坏的运动模糊和透明度等细腻细节。该软件通过输出与行业标准合成应用程序兼容的 16-bit 和 32-bit 线性浮点 EXR 文件,支持高保真 VFX 工作流程。
20438
141
last30days-skill
last30days 工具是一款由 AI Agent 主导的搜索引擎,它整合了来自社交媒体、开发者平台和预测市场的实时数据,以提供最新的见解。通过连接 Reddit、X、GitHub 和 YouTube 等相互独立的平台,该 Agent 根据实际的人类参与度而非传统的 SEO 指标来对信息进行评分。它就像一位专业的科研助理,能够针对过去一个月内任何主题、人物或公司提供简洁且基于证据的简报。
12238
142
obsidian-skills
Obsidian-skills 提供了一系列旨在将 Obsidian 功能与兼容的 AI 代理集成的工具。这些技能遵循 Agent Skills 规范,允许与 Claude Code、Codex CLI 和 OpenCode 等平台无缝使用。用户可以通过多种方式安装该插件,包括市场命令、npx 或手动目录配置。
13738
143
hermes-agent-orange-book
本综合指南详细介绍了由 Nous Research 开发的 Hermes Agent 框架。书中通过十七章内容涵盖了自我改进学习循环、三层记忆系统以及自动化技能演进等核心机制。对于希望实现和定制自主 AI 智能体的开发者及 AI 爱好者而言,本书是一份实用的参考资源。
11838
144
personaplex
PersonaPlex 是一款基于 Moshi 架构构建的实时全双工语音到语音模型,能够通过文本提示和音频语音调节实现精确的角色控制。该模型在合成和真实对话数据的混合集上进行训练,以提供自然、低延迟的交互体验。用户可以通过提供的服务器接口部署该模型,或使用特定的语音嵌入和基于角色的提示进行离线评估。
8238
145
Waza
Waza 提供了一系列 Claude Code 技能,旨在将核心工程习惯转化为可执行的 AI 工作流。通过专注于特定的高影响力技术而非臃肿的配置,它帮助开发者在设计、调试和文档编写方面保持高标准。这些技能基于真实项目数据构建,确保 Claude 能够以经验丰富的工程师般的精确度和意图进行操作。
12538
146
VibeVoice
VibeVoice 是一系列开源语音 AI 模型,利用连续语音分词器和 next-token diffusion 框架来实现高保真音频处理。该项目提供了用于长文本自动语音识别、实时流式文本转语音以及多说话人合成的专用模型。这些模型专为研究目的而设计,提供诸如对长达一小时的音频进行单次处理以及支持超过 50 种语言等功能。
10938
147
MiroFish
MiroFish 是一个基于多智能体技术的下一代 AI 预测引擎,通过提取现实世界的种子信息构建高保真数字平行世界。用户可以在该沙盒中通过注入变量进行模拟,从而对未来轨迹进行精确推演。该平台旨在为决策者提供零风险的测试实验室,同时为个人用户提供创意模拟空间。
14238
148
obsidian-mind
Obsidian Mind 是一个专为 Claude Code 设计的 Obsidian 知识库模板,旨在通过自动化的会话钩子和结构化存储解决 AI 长期记忆缺失的问题。它通过将工作笔记、决策记录、会议纪要和绩效证据自动链接到知识图谱中,确保 Claude 在每次会话开始时都能获取完整的上下文。该系统支持通过自然语言交互进行日常工作流管理,并能自动生成绩效评估简报和项目总结。
11138
149
agent-browser
agent-browser 是一个基于 Rust 构建的高性能浏览器自动化命令行工具,专为 AI 代理设计。它支持通过简单的命令进行网页交互、元素定位和状态管理,无需复杂的 Playwright 或 Node.js 环境。该工具提供了丰富的会话持久化、身份验证管理及调试功能,以确保 AI 代理能够安全且高效地运行。
9338
150
rowboat
Rowboat 是一款开源 AI 同事,它与您的电子邮件和会议记录集成,以构建持久的本地知识图谱。它利用此上下文来协助起草文档、准备会议和跟踪项目等任务,同时将所有数据保持为可编辑的 Markdown 格式。通过在您的机器上维护长期记忆,它实现了随时间推移而不断改进的复合上下文,且无需依赖外部云存储。
10935
151
llmfit
llmfit 是一款基于终端的实用程序,用于分析您的系统硬件,以确定哪些大型语言模型可以在您的特定配置上有效运行。它提供交互式 TUI 和 CLI,根据质量、速度和内存适配度对模型进行评分,同时支持 Ollama、llama.cpp 和 MLX 等多种后端。用户还可以执行硬件模拟,以测试不同模型配置在目标系统规格上的表现。
9335
152
claudian
Claudian 是一款 Obsidian 插件,可将 Claude Code 和 Codex 等 AI 编程代理直接集成到您的知识库中。它将您的知识库转变为一个活跃的工作目录,代理可以在其中读取、写入、搜索并执行 bash 命令。用户可以通过聊天侧边栏、内联编辑以及对 Model Context Protocol 服务器的支持与这些代理进行交互。
10735
153
feynman
Feynman 是一个开源的 AI 研究代理,旨在协助处理文献综述、论文审计和实验复现等复杂任务。该平台利用多代理系统来收集证据、执行模拟同行评审并起草结构化的研究结果。用户可以通过终端界面与该工具进行交互,并支持本地和基于云的执行环境。
11035
154
ghost-pepper
Ghost Pepper 是一款注重隐私的 macOS 应用程序,无需依赖云端 API 即可提供本地语音转文字转录功能。用户只需按住 Control 键即可录制音频,录音随后会被转录并自动粘贴到任何文本输入框中。该应用利用本地模型进行语音识别和文本清理,确保没有任何数据离开用户的设备。
9935
155
LiteRT-LM
LiteRT-LM 是由 Google 设计的一款高性能、生产就绪型推理框架,旨在边缘设备上部署大型语言模型。它支持包括 Android、iOS、桌面端和 IoT 在内的多种平台,同时利用 GPU 和 NPU 硬件加速以实现最佳性能。该框架支持多模态和函数调用等高级功能,为各类 Google 产品中的端侧 AI 体验提供支持。
9535
156
oh-my-openagent
Oh My OpenCode 是一个旨在打破单一模型锁定、通过编排多种AI模型实现高效开发的开源代理工具。它通过引入 Discipline Agents 和 ultrawork 命令,实现任务的并行处理与自动化执行,无需手动切换模型。该工具通过哈希锚定编辑工具和深度初始化功能,显著提升了代码修改的准确性与开发体验。
10635
157
claude-code
本项目包含了 Anthropic 官方 Claude Code CLI 工具的完整泄露源代码,该代码于 2026 年 3 月 31 日通过 npm 包中的映射文件被发现。仓库提供了基于 TypeScript 和 Bun 构建的原始源码,并附带了详细的架构文档和探索指南。用户可以通过内置的 MCP 服务器以交互方式深入研究该工具的内部实现与设计模式。
6835
158
codex-plugin-cc
该插件允许 Claude Code 用户直接在工作流中调用 Codex 进行代码审查或任务委派。用户可以通过一系列斜杠命令执行只读审查、对抗性审查以及后台任务管理。该工具利用本地安装的 Codex CLI 和现有的身份验证配置,确保了与用户现有开发环境的无缝集成。
10735
159
qwen-code
Qwen Code 是一款开源 AI Agent,旨在直接在终端中运行,帮助开发者理解代码库并实现任务自动化。它支持多种身份验证方法,包括 Qwen OAuth 和各种兼容 OpenAI 的 API 提供商,以提供灵活的模型集成。该工具提供了功能丰富的 agentic 工作流,并可集成到 VS Code、Zed 和 JetBrains 等主流 IDE 中。
7632
160
clicky
Clicky 是一款开源 AI 教学助手,可直接集成到您的 macOS 环境中以提供实时指导。该应用程序利用屏幕录制、语音交互和光标控制功能,充当能够观察并与您的桌面进行交互的虚拟导师。用户可以通过配置 Cloudflare Worker 代理并使用 Xcode 构建基于 Swift 的应用程序,从而在本地部署该项目。
13232
161
qmd
QMD 是一款设备端搜索引擎,用于索引 Markdown 笔记、文档和转录内容,以实现高效的本地检索。它采用混合方法,结合了 BM25 全文搜索、向量语义搜索和基于 LLM 的重排序,从而提供高质量的搜索结果。该工具专为 Agent 工作流设计,提供命令行界面和 MCP 服务器,以便与 AI Agent 无缝集成。
13232
162
OpenSpec
OpenSpec 是一个轻量级的规范化框架,旨在通过在编码前建立明确的规格说明来提升 AI 辅助开发的预测性和组织性。它通过引入 artifact-guided 工作流,让开发者与 AI 在编写代码前就需求、设计和任务达成一致。该工具支持 20 多种 AI 编码助手,能够灵活适配从个人项目到企业级的各种开发场景。
7932
163
ai-hedge-fund
AI Hedge Fund 是一个教育性的概念验证项目,旨在探索如何利用人工智能进行交易决策。它采用多智能体系统,模拟各种著名的投资策略和分析方法来评估股票。该系统仅用于研究目的,不执行任何现实世界的金融交易。
16528
164
Archon
Archon 是一个开源工作流引擎,允许开发人员使用确定性的 YAML 工作流来定义 AI 编程流程。通过对规划、实现和验证等任务进行结构化,它确保了 AI 驱动的开发在各个项目中都是可重复、隔离且可靠的。用户可以组合将确定性操作与 AI 驱动步骤混合的工作流,以自动化复杂的软件开发任务。
16628
165
JoyAI-Image
JoyAI-Image 是一个统一的多模态基础模型,它集成了 8B Multimodal Large Language Model 和 16B Multimodal Diffusion Transformer,以支持图像理解、生成和编辑。该模型利用理解与生成之间的闭环协作,增强了空间推理和可控编辑能力。它提供了一个可扩展的训练流水线,并支持多视图生成和精确空间操作等高级功能。
10528
166
GitNexus
GitNexus 将代码库索引为综合知识图谱,为 AI 代理提供深度的架构上下文,从而防止诸如依赖项损坏等常见错误。它提供了一个用于本地存储库索引的 CLI 工具,以及一个将此智能直接集成到 AI 编辑器中的 MCP server。此外,该平台还具有用于可视化探索的基于 Web 的 UI,并为托管或自托管部署提供企业级支持。
8128
167
goose
Goose 是一个通用 AI Agent,旨在您的本地机器上运行,用于处理从编码和研究到自动化和数据分析等各种任务。它使用 Rust 构建,以确保通过桌面、CLI 和 API 接口在 macOS、Linux 和 Windows 上实现高性能和可移植性。该项目支持超过 15 个 AI 提供商,并通过 Model Context Protocol 集成了 70 多个扩展。
12928
168
k-skill
k-skill 是一套专为 AI Agent 设计的自动化工具,用于执行与 SRT、KTX、Coupang 和 KakaoTalk 等热门韩国服务相关的各种任务。它支持与主流 coding agents 集成,并允许用户在无需额外 client API 层的情况下执行任务。用户可以通过安装完整套件并通过提供的设置工具配置凭据来开始使用。
9828
169
paperclip
Paperclip 是一个开源平台,提供 Node.js 服务器和 React UI,用于将 AI Agent 团队编排为一个有凝聚力的商业实体。它类似于任务管理器,提供组织架构图、预算执行和目标对齐等功能,以管理自主运营。用户可以集成自己的 Agent 来 24/7 全天候运营业务,同时通过集中式仪表板保持监督。
10628
170
onyx
Onyx 是一个功能丰富的开源 AI 平台,旨在为大语言模型提供易于部署的应用层接口。该平台支持 RAG、深度研究、代码执行及多种 AI 代理功能,并兼容主流的自托管和专有大模型。用户可以通过标准版或轻量版进行部署,以满足从个人使用到企业级协作的不同需求。
29728
171
OmniVoice
OmniVoice 是一款基于扩散语言模型架构的先进大规模多语言零样本语音合成模型,支持超过 600 种语言。该模型具备卓越的推理速度,能够实现高质量的语音克隆与语音设计功能。用户可以通过 Python API 或命令行工具轻松进行语音生成,并支持细粒度的非语言符号及发音控制。
11628
172
ai-marketing-skills
AI Marketing Skills 是一个为营销和销售团队设计的开源项目,提供了一系列可直接运行的自动化工作流和脚本。这些工具旨在与 Claude Code 或其他 AI 编程代理集成,通过专家面板、评分算法和自动化管道优化业务流程。该项目涵盖了从增长实验、销售线索挖掘到内容运营和财务分析等多个领域的专业技能。
8928
173
TradingAgents
TradingAgents 是一个基于多智能体的大模型金融交易框架,旨在模拟真实交易公司的运作流程。该框架通过部署包括基本面、情绪、新闻和技术分析在内的专业智能体,协同评估市场状况并制定交易策略。系统利用 LangGraph 构建,支持多种主流大模型提供商,并提供交互式命令行界面及 Python 开发接口。
11728
← 全部排行榜