首页主题RAG
// 主题

RAG

15近 90 天热度·15历史累计

// 近 4 周新增

// 生态图谱

LLM11Knowledge Graph5Vector Database5Python5Agents3RAG
AI 14
Database 1

// 近期新项目

查看全部新项目 →

// 本周 TOP 6

01
Tencent / WeKnora
WeKnora 是一个基于 LLM 的开源框架,专为企业级文档理解、语义检索和自主推理而设计。它配备了用于处理复杂多步任务的 ReAct 智能体,以及能将原始文档提炼为结构化互联知识库的 Wiki 模式。该平台支持多源数据摄入、多种 LLM 集成以及灵活的部署选项,以确保完整的数据主权。
7814,104
02
garrytan / gbrain
GBrain 提供了一个持久化的自连接知识图谱,使 AI Agent 能够跨会议、电子邮件和文档存储并检索复杂信息。该系统自动提取实体关系并维护结构化时间线,从而使 Agent 能够回答标准向量搜索无法处理的查询。通过利用持久化任务队列和模块化技能系统,它确保了 Agent 能够随着时间的推移变得更加智能和可靠。
5640
03
MemPalace / mempalace
MemPalace 是一个本地优先的 AI 记忆系统,它将对话历史记录存储为逐字文本,以实现高精度的语义检索。它利用带有可插拔后端的结构化索引方法,将内容组织为侧翼、房间和抽屉,而无需进行外部 API 调用。该平台还具有时间知识图谱、MCP 工具和特定于代理的日记,以提供全面的上下文管理。
4738
04
nashsu / llm_wiki
LLM Wiki 是一款跨平台桌面应用程序,利用增量式 LLM 驱动的流水线将您的文档转换为有组织的互联知识库。它具备复杂的两步摄入流程、持久化知识图谱以及深度研究能力,旨在维护和扩展您的个人资料库。该系统通过来源可追溯性、人机协作审查以及与 Obsidian 等工具的无缝集成,确保了高质量的输出。
4322
05
HKUDS / DeepTutor
DeepTutor 是一个原生智能体平台,旨在通过统一的聊天工作区和多智能体架构提供个性化的智能辅导。它具备诸如用于交互式学习的 Book Engine、AI Co-Writer 以及用于根据个人用户资料定制体验的持久记忆等高级功能。用户可以通过引导式 CLI 设置或 Docker 轻松部署该系统,并支持广泛的 LLM 和嵌入提供商。
3695
06
1jehuang / jcode
jcode 是一款专为多会话工作流和极致资源效率而设计的高性能编程 Agent 框架。它配备了先进的内存系统,利用语义向量嵌入来检索相关信息,从而避免了过多的 token 消耗。该平台通过集群架构支持原生的 Agent 协作,并可通过 OAuth 或自定义配置与多种 LLM 提供商集成。
3336

// 历史精选 (15)

Tencent / WeKnora
WeKnora 是一个基于 LLM 的开源框架,专为企业级文档理解、语义检索和自主推理而设计。它配备了用于处理复杂多步任务的 ReAct 智能体,以及能将原始文档提炼为结构化互联知识库的 Wiki 模式。该平台支持多源数据摄入、多种 LLM 集成以及灵活的部署选项,以确保完整的数据主权。
78
HKUDS / RAG-Anything
RAG-Anything 是一个综合性框架,旨在处理和查询包括文本、图像、表格和数学公式在内的多种文档类型。它基于 LightRAG 构建,提供了一个端到端的流水线,将多模态内容整合到统一的知识图谱中以实现智能检索。该系统通过提供单一且连贯的复杂文档分析接口,消除了对多种专用工具的需求。
78
bytedance / agentkit-samples
AgentKit 代码工坊是火山引擎推出的 AI Agent 开发平台示例仓库,旨在帮助开发者快速掌握智能体的构建与部署。该项目提供了从基础入门到复杂场景的多种代码示例,涵盖了多智能体协作、RAG 检索增强及工具调用等核心功能。开发者可以通过这些教程深入理解 AgentKit 的开发工具链,并将其高效集成到各类业务应用中。
78
opendataloader-project / opendataloader-pdf
OpenDataLoader PDF 是一款高性能开源解析器,旨在将 PDF 文档转换为 Markdown、JSON 和 HTML 等结构化格式,以供 AI 和 RAG 流水线使用。它采用混合处理模式,结合确定性本地解析与 AI 驱动分析,为复杂表格、公式和扫描文档实现行业领先的提取精度。此外,该项目还提供自动化无障碍解决方案,包括符合国际标准的端到端 Tagged PDF 生成功能。
59
pingcap / autoflow
AutoFlow 是一款开源知识库工具,利用基于 TiDB Vector、LlamaIndex 和 DSPy 构建的 Graph RAG 技术。该平台提供由内置高级网站爬虫驱动的 Perplexity 风格对话式搜索体验。用户还可以使用简单的 JavaScript 代码片段将可自定义的搜索小部件集成到自己的网站中。
59
garrytan / gbrain
GBrain 提供了一个持久化的自连接知识图谱,使 AI Agent 能够跨会议、电子邮件和文档存储并检索复杂信息。该系统自动提取实体关系并维护结构化时间线,从而使 Agent 能够回答标准向量搜索无法处理的查询。通过利用持久化任务队列和模块化技能系统,它确保了 Agent 能够随着时间的推移变得更加智能和可靠。
56
memvid / memvid
Memvid是一个无需数据库的单文件内存层,旨在为AI智能体提供即时检索和长期记忆功能。它通过创新的“智能帧”设计,将数据、嵌入和索引封装在单个文件中,实现了高效的压缩与并行读取。该系统具有模型无关、基础设施零依赖的特点,支持在各种离线或在线场景中实现持久化记忆。
49
MemPalace / mempalace
MemPalace 是一个本地优先的 AI 记忆系统,它将对话历史记录存储为逐字文本,以实现高精度的语义检索。它利用带有可插拔后端的结构化索引方法,将内容组织为侧翼、房间和抽屉,而无需进行外部 API 调用。该平台还具有时间知识图谱、MCP 工具和特定于代理的日记,以提供全面的上下文管理。
47
onyx-dot-app / onyx
Onyx 是一个功能丰富的开源 AI 平台,旨在为大语言模型提供易于部署的应用层接口。该平台支持 RAG、深度研究、代码执行及多种 AI 代理功能,并兼容主流的自托管和专有大模型。用户可以通过标准版或轻量版进行部署,以满足从个人使用到企业级协作的不同需求。
46
nashsu / llm_wiki
LLM Wiki 是一款跨平台桌面应用程序,利用增量式 LLM 驱动的流水线将您的文档转换为有组织的互联知识库。它具备复杂的两步摄入流程、持久化知识图谱以及深度研究能力,旨在维护和扩展您的个人资料库。该系统通过来源可追溯性、人机协作审查以及与 Obsidian 等工具的无缝集成,确保了高质量的输出。
43
tobi / qmd
QMD 是一款设备端搜索引擎,用于索引 Markdown 笔记、文档和转录内容,以实现高效的本地检索。它采用混合方法,结合了 BM25 全文搜索、向量语义搜索和基于 LLM 的重排序,从而提供高质量的搜索结果。该工具专为 Agent 工作流设计,提供命令行界面和 MCP 服务器,以便与 AI Agent 无缝集成。
43
endee-io / endee
Endee 是一款专为 AI 搜索、RAG 流水线和语义检索工作负载而设计的高性能开源向量数据库。它采用 C++ 实现,并针对现代 CPU 架构进行了优化,以确保生产级的性能和低延迟结果。该平台支持灵活的部署选项,包括 Docker 和本地构建,同时提供混合搜索和元数据感知过滤等高级功能。
42
HKUDS / DeepTutor
DeepTutor 是一个原生智能体平台,旨在通过统一的聊天工作区和多智能体架构提供个性化的智能辅导。它具备诸如用于交互式学习的 Book Engine、AI Co-Writer 以及用于根据个人用户资料定制体验的持久记忆等高级功能。用户可以通过引导式 CLI 设置或 Docker 轻松部署该系统,并支持广泛的 LLM 和嵌入提供商。
36
anthropics / claude-cookbooks
Claude Cookbooks 提供了一系列全面的代码片段和指南,旨在帮助开发者将 Claude 集成到自己的应用程序中。该存储库涵盖了广泛的主题,包括工具使用、多模态功能以及提示词缓存等高级技术。这些资源旨在方便开发者根据不同的编程语言和项目需求进行灵活调整。
36
1jehuang / jcode
jcode 是一款专为多会话工作流和极致资源效率而设计的高性能编程 Agent 框架。它配备了先进的内存系统,利用语义向量嵌入来检索相关信息,从而避免了过多的 token 消耗。该平台通过集群架构支持原生的 Agent 协作,并可通过 OAuth 或自定义配置与多种 LLM 提供商集成。
33

// 项目使用场景

WeKnora
  • 01针对企业文档的基于 RAG 的智能问答
  • 02用于多步推理和工具编排的自主 ReAct 智能体
  • 03从原始文档自动生成 Wiki 并进行知识图谱可视化
RAG-Anything
  • 01对包括 PDF、Office 文件和图像在内的多模态文档进行端到端处理
  • 02构建多模态知识图谱以增强语义理解和关系映射
  • 03结合向量相似度搜索与图遍历的混合智能检索,以提供具备上下文感知的答案
agentkit-samples
  • 01基于 RAG 的智能文档问答与记忆管理
  • 02多智能体协作与分布式任务处理
  • 03集成火山引擎工具链的业务流程自动化
opendataloader-pdf
  • 01为 RAG 和 LLM 流水线提取带有边界框支持的 PDF 结构化数据
  • 02通过布局分析和自动标记实现 PDF 无障碍合规自动化
  • 03处理包括扫描版 PDF、数学公式和无边框表格在内的复杂文档
autoflow
  • 01具有自动站点地图 URL 抓取功能的 Perplexity 风格对话式搜索
  • 02用于在外部网站上即时响应产品相关查询的可嵌入 JavaScript 小部件
  • 03使用 Graph RAG 和 TiDB 管理知识库,用于存储聊天记录和向量数据

// 项目对比

// 相关主题