首页 › 对比 › secret-llama vs DeepGEMM

secret-llama vs DeepGEMM

星标、功能、趋势全方位对比

共同标签:LLM
secret-llama指标DeepGEMM
2,677星标6,915
92评分92
AI分类AI
hn来源github-zh-inc

// secret-llama

Secret Llama 是一款完全私有的聊天机器人,利用 WebGPU 技术完全在您的网页浏览器中运行。它支持 Llama 3 和 Mistral 等各种开源模型,无需任何服务器端处理或软件安装。该平台提供了一个用户友好的界面,在确保所有对话数据严格保留在本地机器上的同时,还能实现离线功能。

使用场景
  • 01直接在浏览器中运行 Llama 3 和 Mistral 等开源 LLM
  • 02通过将所有对话保留在本地来维护完整的数据隐私
  • 03在没有服务器依赖的情况下离线使用 AI 聊天机器人功能

// DeepGEMM

DeepGEMM 是一个统一的 CUDA 库,专门为现代大语言模型提供高性能 Tensor Core 内核。它具备轻量级的 Just-In-Time 编译模块,无需在安装时进行复杂的 CUDA 构建。该库为包括 GEMMs、融合 MoE 和 MQA 评分在内的各种矩阵运算提供了专家级调优的性能。

使用场景
  • 01用于 LLM 训练和推理的高性能 FP8 和 FP4 GEMM 运算
  • 02融合计算并重叠 NVLink 通信的 Mega MoE 内核
  • 03为大规模模型中的闪电索引器设计的 MQA 评分内核