首页 › 对比 › litellm vs DeepGEMM

litellm vs DeepGEMM

星标、功能、趋势全方位对比

共同标签:LLM

litellm	指标	DeepGEMM
43,846	星标	6,621
92	评分	92
AI	分类	AI

litellm 简介

LiteLLM 是一个开源 AI 网关，它提供了一个使用标准 OpenAI 格式调用 100 多种不同 LLM 提供商的统一接口。它可以作为 Python SDK 进行直接集成，也可以部署为代理服务器来管理负载均衡和支出跟踪等企业级功能。通过抽象化特定提供商的复杂性，它使开发人员无需重写现有代码即可在不同模型之间无缝切换。

使用场景

使用 OpenAI 格式为 100+ LLM 提供商提供统一 API

具备负载均衡和支出跟踪功能的生产级代理服务器

将 MCP 工具和 A2A 代理集成到 LLM 工作流中

DeepGEMM 简介

DeepGEMM 是一个统一的 CUDA 库，专门为现代大型语言模型提供高性能 Tensor Core 内核。它具备轻量级的 Just-In-Time 编译模块，无需进行复杂的 CUDA 安装构建。该库支持包括 FP8/FP4 GEMMs、融合 Mega MoE 以及用于高效 GPU 计算的 MQA 评分内核在内的高级操作。

使用场景

面向 LLMs 的高性能 FP8 和 FP4 矩阵乘法

支持通信与计算重叠的融合 Mega MoE 内核

用于大规模模型中闪电索引器的 MQA 评分内核

查看 litellm →查看 DeepGEMM →