HubLens
搜索
⌘
K
关于
未找到结果。
首页
›
主题
› LLM
Topic
LLM
90 天热度
79
历史累计
79
近 4 周新增
0
03-20
0
03-27
25
04-03
54
04-10
本周 TOP 10
1
litellm
LiteLLM 是一个开源 AI 网关,它提供了一个使用标准 OpenAI 格式调用 100 多种不同 LLM 提供商的统一接口。它可以作为 Python SDK 直接集成,也可以部署为代理服务器来管理负载均衡和支出跟踪等企业级功能。该平台通过消除处理特定于提供商的 SDK、身份验证模式和请求格式的需求,简化了 LLM 的管理。
92
2
FlashMLA
FlashMLA 是由 DeepSeek 开发的高性能注意力内核库,旨在为其 V3 和 V3.2-Exp 模型提供动力。它为预填充和解码阶段的稀疏和密集注意力机制提供了专门的实现。该库专为 NVIDIA GPU 架构设计,并包含对 FP8 KV 缓存的支持,以提高计算效率。
92
3
deer-flow
DeerFlow 2.0 是一个从零开始重写的开源超级智能体框架,旨在编排子智能体、内存和沙箱。它利用可扩展的技能和各种 LLM 提供商,通过灵活的模块化架构来执行复杂任务。该平台支持包括 Docker 和本地开发在内的多种部署模式,以促进高效的研究和自动化工作流程。
91
4
PaddleOCR
PaddleOCR 是一个综合性工具包,旨在将图像和 PDF 文档转换为 Markdown 和 JSON 等结构化、适配 LLM 的数据格式。它具备最先进的视觉语言模型和高性能文本识别引擎,支持超过 100 种语言。该平台被广泛集成到主流 AI Agent 和 RAG 框架中,可在各种硬件后端上提供高效的部署选项。
91
5
zhangxuefeng-skill
该项目基于张雪峰的著作、采访及决策记录,构建了一套可运行的思维框架而非简单的语录合集。它通过提炼核心心智模型、决策启发式和表达DNA,为用户提供深度分析与建议。用户可将其安装至Claude Code中,以张雪峰的视角进行专业选择与职业规划分析。
89
6
willow
Willow Inference Server 允许用户自行托管用于各种应用程序的高速语言推理任务。它支持包括 speech-to-text、text-to-speech 和大型语言模型处理在内的一系列功能。用户可以访问官方文档和社区讨论,以优化他们在该平台上的使用体验。
88
7
secret-llama
Secret Llama 是一款完全在浏览器内运行的聊天机器人,允许用户与 Llama 3 和 Mistral 等开源模型进行交互。它通过将所有对话数据保留在用户的本地计算机上来确保完全的隐私,且无需服务器或安装任何软件。该平台提供类似于 ChatGPT 的用户友好界面,同时通过 WebGPU 技术支持离线功能。
88
8
x
Ant Design X 提供了一套全面的原子组件和实用 API,旨在帮助开发者构建高质量的 AI 应用程序。该库包含用于流式 Markdown 渲染、动态卡片界面和智能 Agent 技能的专业工具。这些企业级组件能够实现高效的数据流管理,并为现代 AI 驱动的体验提供灵活的 UI 开发方案。
88
9
xiaomi-miloco
Xiaomi Miloco 是一款开源智能家居解决方案,利用端侧大语言模型来集成和控制物联网设备。通过利用摄像头数据流进行视觉理解,该系统使用户能够通过自然语言指令管理家庭环境。该框架通过在本地执行所有处理并与 Xiaomi Home 生态系统无缝连接,优先保障隐私和安全。
88
10
slime
slime 是一个高性能的后训练框架,旨在为大型语言模型扩展强化学习。它集成了 Megatron-LM 以实现高效训练,并结合 SGLang 提供灵活且高吞吐量的数据生成能力。该框架支持多种模型,并已在多个研究项目中用于智能体训练和推理优化。
88
历史精选 (50)
litellm
LiteLLM 是一个开源 AI 网关,它提供了一个使用标准 OpenAI 格式调用 100 多种不同 LLM 提供商的统一接口。它可以作为 Python SDK 直接集成,也可以部署为代理服务器来管理负载均衡和支出跟踪等企业级功能。该平台通过消除处理特定于提供商的 SDK、身份验证模式和请求格式的需求,简化了 LLM 的管理。
92
FlashMLA
FlashMLA 是由 DeepSeek 开发的高性能注意力内核库,旨在为其 V3 和 V3.2-Exp 模型提供动力。它为预填充和解码阶段的稀疏和密集注意力机制提供了专门的实现。该库专为 NVIDIA GPU 架构设计,并包含对 FP8 KV 缓存的支持,以提高计算效率。
92
deer-flow
DeerFlow 2.0 是一个从零开始重写的开源超级智能体框架,旨在编排子智能体、记忆和沙盒。它利用可扩展的技能,并与各种 AI 模型集成,通过灵活的容器化架构执行复杂任务。该框架支持多种部署模式,并提供与 Slack、Telegram 和 Feishu 等消息平台的无缝连接。
92
deer-flow
DeerFlow 2.0 是一个从零开始重写的开源超级智能体框架,旨在编排子智能体、内存和沙箱。它利用可扩展的技能和各种 LLM 提供商,通过灵活的模块化架构来执行复杂任务。该平台支持包括 Docker 和本地开发在内的多种部署模式,以促进高效的研究和自动化工作流程。
91
PaddleOCR
PaddleOCR 是一个综合性工具包,旨在将图像和 PDF 文档转换为 Markdown 和 JSON 等结构化、适配 LLM 的数据格式。它具备最先进的视觉语言模型和高性能文本识别引擎,支持超过 100 种语言。该平台被广泛集成到主流 AI Agent 和 RAG 框架中,可在各种硬件后端上提供高效的部署选项。
91
zhangxuefeng-skill
该项目基于张雪峰的著作、采访及决策记录,构建了一套可运行的思维框架而非简单的语录合集。它通过提炼核心心智模型、决策启发式和表达DNA,为用户提供深度分析与建议。用户可将其安装至Claude Code中,以张雪峰的视角进行专业选择与职业规划分析。
89
willow
Willow Inference Server 允许用户自行托管用于各种应用程序的高速语言推理任务。它支持包括 speech-to-text、text-to-speech 和大型语言模型处理在内的一系列功能。用户可以访问官方文档和社区讨论,以优化他们在该平台上的使用体验。
88
secret-llama
Secret Llama 是一款完全在浏览器内运行的聊天机器人,允许用户与 Llama 3 和 Mistral 等开源模型进行交互。它通过将所有对话数据保留在用户的本地计算机上来确保完全的隐私,且无需服务器或安装任何软件。该平台提供类似于 ChatGPT 的用户友好界面,同时通过 WebGPU 技术支持离线功能。
88
x
Ant Design X 提供了一套全面的原子组件和实用 API,旨在帮助开发者构建高质量的 AI 应用程序。该库包含用于流式 Markdown 渲染、动态卡片界面和智能 Agent 技能的专业工具。这些企业级组件能够实现高效的数据流管理,并为现代 AI 驱动的体验提供灵活的 UI 开发方案。
88
xiaomi-miloco
Xiaomi Miloco 是一款开源智能家居解决方案,利用端侧大语言模型来集成和控制物联网设备。通过利用摄像头数据流进行视觉理解,该系统使用户能够通过自然语言指令管理家庭环境。该框架通过在本地执行所有处理并与 Xiaomi Home 生态系统无缝连接,优先保障隐私和安全。
88
slime
slime 是一个高性能的后训练框架,旨在为大型语言模型扩展强化学习。它集成了 Megatron-LM 以实现高效训练,并结合 SGLang 提供灵活且高吞吐量的数据生成能力。该框架支持多种模型,并已在多个研究项目中用于智能体训练和推理优化。
88
hermes-agent-orange-book
本综合指南提供了由 Nous Research 开发的 Hermes Agent 框架的实用概述。它涵盖了诸如自我改进学习循环、三层记忆系统以及跨越十七章的自动技能演化等核心机制。本书为希望实现和定制自主 AI 代理的开发人员及 AI 爱好者提供了宝贵的资源。
88
openocta
OpenOcta 是一款开源的企业级 AI Agent 运行时,通过单一 Go 二进制文件提供包含网关、代理及自动化任务的完整控制面。该项目支持与业务系统、API、MCP 工具及自定义技能的深度集成,适用于流程自动化与智能对话场景。其架构设计简洁,前端资源内嵌于二进制中,确保了在企业环境下的快速部署与高效运行。
88
tong-jincheng-skill
该项目通过对童锦程约20万字的一手视频素材进行深度蒸馏,构建了一个能够模拟其直白、反鸡汤风格的AI分析工具。用户可以通过Claude Code调用该Skill,获取关于恋爱、人际关系及个人成长的深度洞察。它不进行简单的语录复读,而是利用童锦程独特的认知框架帮助用户分析并解决实际问题。
88
khazix-skills
Khazix Skills 是一个开源的 AI 工具集合,旨在将作者积累的方法论转化为可复用的 Prompts 和 Skills。该项目包含轻量级的提示词模板以及遵循 Agent Skills 开放标准的结构化指令集。用户可以通过直接安装或手动配置的方式,将这些工具集成到支持的 AI Agent 中以提升工作效率。
88
Awesome-finance-skills
Awesome-finance-skills 是一个即插即用的金融技能集合,旨在赋予大语言模型实时新闻分析、股票数据处理及市场预测能力。该项目支持多种主流 Agent 框架,通过简单的安装即可让 AI 具备专业的金融分析与研报生成功能。用户可以利用其内置的逻辑可视化和情感分析工具,快速提升 AI 代理在金融领域的决策支持水平。
88
AI-Infra-Guard
AI-Infra-Guard 是由腾讯朱雀实验室打造的专业AI红队安全评估平台,旨在为企业和个人提供全面的AI安全风险自查方案。该平台集成了AI基础设施漏洞扫描、Agent工作流安全评估、MCP服务器扫描及越狱测试等多种核心功能。用户可通过Docker快速部署,利用其现代化的Web界面和完善的API接口实现高效的安全检测与管理。
88
FlashMLA
FlashMLA 是由 DeepSeek 开发的高性能 attention 内核库,旨在为其 V3 和 V3.2-Exp 模型提供支持。该存储库为预填充(prefill)和解码(decoding)阶段的稀疏和密集 attention 机制提供了专门的实现。这些内核针对 NVIDIA GPU 架构(包括 SM90 和 SM100)进行了优化,以实现显著的计算吞吐量。
86
khoj
Khoj 是一款多功能的个人 AI 应用程序,旨在通过先进的语义搜索和文档集成来扩展用户能力。它支持多种本地和在线 LLM,同时提供从设备端到云端企业环境的灵活部署选项。用户可以创建自定义 Agent,并跨 Obsidian、Emacs 和移动设备等多个平台自动化研究任务。
82
andrej-karpathy-skills
本项目提供了一套结构化的指南,旨在提高 AI 编码代理的性能和可靠性。通过实施四项核心原则,它帮助开发者减轻 LLM 常见的陷阱,如过度复杂化、不必要的代码更改以及糟糕的假设管理。用户可以通过 Claude Code 插件或特定项目的 CLAUDE.md 文件轻松将这些规则集成到工作流程中。
82
FastDeploy
FastDeploy 是基于飞桨的大语言模型与视觉语言模型推理部署工具包,旨在提供开箱即用的生产级部署方案。该项目支持多种硬件平台,并集成了负载均衡式PD分解、统一KV缓存传输及全量化格式支持等核心技术。开发者可通过兼容 OpenAI API 的接口实现快速部署,并利用推测解码与分块预填充等高级加速技术提升推理性能。
82
page-agent
Page Agent 是一款客户端工具,使用户能够通过自然语言指令控制网页界面。它通过基于文本的 DOM 操作直接在网页内运行,无需浏览器扩展、无头浏览器或多模态 LLM。该库支持灵活的 LLM 集成,并为多页面任务自动化提供了可选扩展。
82
WeKnora
WeKnora 是一个智能知识管理与问答框架,利用 LLM 提供企业级的文档理解和语义检索功能。该平台提供基于 RAG 的 Quick Q&A 模式以实现快速查询,以及用于复杂多源推理任务的 ReACT Agent 引擎。它具有高度模块化的架构,支持多种文档格式、多个 LLM 提供商,并可与主流 IM 渠道无缝集成,适用于私有化或本地部署。
82
weft
Weft 是一种旨在将 LLM、人类交互和基础设施集成到统一可视化工作流中的编程语言。它具备持久化执行功能以确保程序在崩溃后仍能运行,并通过类型化的模块化节点系统支持复杂逻辑。开发者无需手动配置,即可通过连接原生节点来构建和管理复杂的智能体系统。
78
fireworks-tech-graph
fireworks-tech-graph 使用户能够直接从自然语言描述中生成专业的 SVG 和 PNG 技术图表。该工具支持 14 种 UML 图表类型,并包含 7 种专为各种文档需求量身定制的独特视觉风格。它专门针对 AI 和基于 agent 的领域模式进行了优化,无需手动绘图即可实现快速可视化。
78
claude-mem
Claude-Mem 是一个专为 Claude Code 及类似 CLI 工具设计的持久化记忆压缩系统,旨在跨会话保持上下文。它能自动捕获工具使用观察结果并生成语义摘要,以确保项目知识的连续性。该系统利用 SQLite 和向量数据库的混合搜索架构,提供高效且节省 Token 的信息检索功能。
78
graphify
graphify 是一款 AI 编程助手技能,能够从您的代码库、文档和多媒体文件中构建全面的知识图谱。它利用 tree-sitter 进行结构化代码分析,并结合基于 LLM 的提取技术来识别概念、关系和架构设计原理。生成的交互式图谱和报告使开发人员能够更高效地导航复杂的代码库并理解架构决策。
78
claude-code-best-practice
本仓库提供了关于 Claude Code 的最佳实践、实施指南和编排工作流的综合集合。它涵盖了子代理、自定义命令、技能和内存管理等核心概念,旨在提升代理工程能力。开发者可以利用这些资源优化开发循环,并将先进的 AI 驱动自动化集成到项目中。
78
rtk
RTK 是一款高性能 CLI 代理,旨在通过过滤和压缩命令输出来显著降低 LLM 的 Token 消耗。它支持超过 100 种常用命令,并通过透明的 shell hooks 与各种 AI 编程工具无缝集成。通过去除冗余信息并汇总数据,它能帮助开发者以极低的开销优化 AI 交互体验。
78
impeccable
Impeccable 是一项全面的设计技能,它为 AI 代理提供特定领域的参考资料和引导指令,以提升前端 UI 的质量。它通过提供 18 条用于审计、润色和优化视觉及交互设计的专业指令,来对抗通用的 AI 设计模式。此外,该项目还包含一个独立的 CLI 工具,用于检测各种文件和 URL 中常见的设计反模式。
78
claude-howto
本指南提供了一条结构化且可视化的学习路径,旨在帮助开发者超越基础用法并精通 Claude Code。内容包含可直接复制的模板、交互式测验以及涵盖从 slash commands 到复杂 agent 工作流的详细教程。通过学习这些模块,用户可以有效结合各项功能,构建用于代码审查、安全扫描和文档编写的自动化流水线。
78
cc-switch
CC Switch 是一款桌面应用程序,为管理 Claude Code、Codex 和 Gemini CLI 等多种 AI 编程 CLI 工具提供了统一的界面。它通过提供 50 多种预设配置以及针对 MCP 服务器和技能的可视化管理系统,消除了手动编辑配置文件的需求。该工具还具备跨平台支持、云端同步和内置使用情况追踪功能,旨在简化 AI 辅助开发的流程。
78
hermes-agent
Hermes Agent 是一款能够从经验中构建技能,并在不同会话中保持对用户交互深度模型的自我改进型 AI 助手。它支持多种 LLM 提供商,并可部署在包括本地机器、VPS 或无服务器环境在内的多种基础设施上。该平台具备用于跨平台通信的强大消息网关,并内置了用于定时自动化和并行任务委派的工具。
78
caveman
Caveman 是一款专为 AI 编程代理设计的插件,它强制将响应转换为简洁的电报式风格,从而显著降低 Token 使用量。该插件在保持技术准确性的同时,去除了填充词、客套话和不必要的冗长叙述。它支持多种压缩强度级别,包括文言文模式,并提供了用于压缩项目文档的实用工具。
78
EvoCUA
EvoCUA 是一款高性能开源多模态模型,专为跨各种桌面应用程序的端到端计算机自动化而设计。它目前在 OSWorld 排行榜上名列前茅,并展现出卓越的跨操作系统泛化能力。此外,该模型以其强大的安全性而著称,在主流计算机使用智能体中表现出最低的意外行为发生率。
78
agentkit-samples
AgentKit 代码工坊是火山引擎推出的 AI Agent 开发平台配套示例仓库,旨在帮助开发者快速掌握智能体构建与部署流程。该项目提供了从基础入门到复杂业务场景的多种代码示例,涵盖了多智能体协作、RAG 检索增强及工具调用等核心功能。开发者可以通过这些教程深入理解 AgentKit 的开发工具链,从而高效实现各类智能化应用。
78
vLLM-Kunlun
vLLM Kunlun 是一个由社区维护的硬件插件,旨在实现 vLLM 在 Kunlun XPU 设备上的无缝运行。它利用硬件可插拔接口将 Kunlun 后端与核心 vLLM 框架解耦。通过此集成,用户能够在 Kunlun3 P800 硬件上高效运行各种 Transformer、Mixture-of-Expert 和多模态模型。
78
rtp-llm
RTP-LLM 是由阿里巴巴基础模型推理团队开发的高性能大语言模型推理加速引擎。该引擎已在淘宝、天猫等多个阿里业务场景中广泛应用,并支持多种主流模型格式与硬件后端。它通过集成先进的算子优化、量化技术及分布式推理能力,为开发者提供高效的生产级推理解决方案。
78
PaddleFormers
PaddleFormers 是基于飞桨框架构建的 Transformers 库,旨在为大语言模型和视觉语言模型提供与 Hugging Face 对等的训练接口。该项目通过集成张量并行、流水线并行及自动混合精度等技术,实现了在重点模型上超越 Megatron-LM 的训练性能。此外,它还全面支持 Safetensors 格式并深度适配了多种国产计算芯片,助力开发者高效完成全流程模型训练。
78
colleague-skill
colleague.skill 允许用户通过处理各种通信数据源,基于同事的工作习惯和个性创建 AI 角色。该系统采用两部分架构,结合了专业工作能力与细微的行为特征,以模拟真实的交互。用户可以轻松管理、更新和回滚这些 AI 技能,以保持对团队成员专业知识的准确呈现。
78
learn-claude-code
本仓库提供了一个全面的教育框架,用于构建支持智能 AI agents 所需的基础设施或框架。它强调虽然代理能力源于训练模型,但框架对于提供有效运行所需的工具、上下文和环境至关重要。通过十二个循序渐进的课程,开发者将学习实现工具调度、任务管理和子代理协调等关键机制。
78
paseo
Paseo 提供了一个统一的接口,用于在本地机器上管理和运行 Claude Code、Codex 和 OpenCode 等各种编码代理。它支持跨设备工作流,允许用户通过桌面端、移动端、Web 或 CLI 应用程序与代理进行交互。该平台优先考虑隐私,在无需遥测或强制登录的情况下运行,同时具备强大的代理编排功能。
78
tair-kvcache
Tair KVCache 是阿里云开发的一套系统,旨在通过分布式内存池和动态多级缓存技术加速大语言模型推理。该项目提供了一个用于统一元数据处理的集中式管理器,以及一个无需 GPU 资源即可预测性能指标的仿真工具。这些组件协同工作,在提高推理效率的同时降低了整体基础设施成本。
78
ai-daily-digest
AI Daily Digest 是一个基于 Bun 运行时的自动化工具,旨在从 90 个顶级技术博客中抓取并筛选高质量内容。该工具通过 AI 多维评分、结构化摘要及趋势分析,为用户生成包含多维度统计图表的每日技术精选日报。系统默认使用 Gemini API,并支持灵活切换至其他 OpenAI 兼容的 AI 模型提供商。
76
ai-daily-digest
AI Daily Digest 是一款基于 Bun 运行时的工具,通过抓取 90 个顶级技术博客的 RSS 源,利用 AI 进行多维评分、分类与摘要生成。该项目支持交互式命令行操作,能够自动将文章整理为包含宏观趋势、深度摘要及可视化统计的结构化日报。用户可灵活配置 Gemini 或其他 OpenAI 兼容的 API 模型,实现高效的技术资讯获取与阅读。
76
slime
Slime 是一个 LLM 后训练框架,旨在通过集成 Megatron 进行高性能训练和 SGLang 进行高效 rollout 生成,从而实现强化学习的扩展。该框架利用数据缓冲区连接训练和生成,为复杂的 RL 任务提供灵活且异步的工作流。它支持多种最先进的模型,包括 GLM、Qwen、DeepSeek 和 Llama 系列。
76
learn-opencode
OpenCode 是一门面向零基础用户的免费开源 AI 实战课程,旨在帮助用户在 4 小时内掌握利用 AI 提升工作效率的方法。该教程提供深度中文内容,支持国内主流模型直连,无需复杂的网络配置。课程涵盖从快速起步到深度定制的五个阶段,并提供丰富的实战项目与 Prompt 模板供学习者使用。
72
ROLL
ROLL 是一个高效且用户友好的强化学习库,专为在大规模 GPU 集群上训练和扩展 Large Language Models 而设计。它利用由 Ray 驱动的多角色分布式架构,以支持诸如人类偏好对齐、推理和 Agentic 交互等复杂任务。该框架集成了 Megatron-Core、vLLM 和 SGLang 等先进技术,旨在加速跨不同硬件环境的模型训练和推理。
72
Awesome-finance-skills
Awesome Finance Skills 是一个即插即用的金融技能集合,旨在赋予 AI Agent 实时新闻分析、股票数据处理及市场预测能力。该项目支持多种主流 Agent 框架,用户可通过一键安装或手动部署快速集成相关功能。通过整合 Kronos 模型与多种金融数据源,它能帮助 Agent 自动生成专业的市场分析报告与逻辑链路图。
72
FastDeploy
FastDeploy 是基于飞桨的大语言模型与视觉语言模型推理部署工具包,旨在提供开箱即用的生产级部署方案。该工具包支持多种主流硬件平台,并集成了负载均衡式PD分解、统一KV缓存传输及全量化格式支持等核心技术。通过兼容 OpenAI API 和 vLLM 接口,它能够帮助开发者高效实现模型推理与在线服务部署。
72
相关主题
Automation
(17)
Agent
(15)
Python
(10)
AI Agents
(10)
Inference
(8)