星标、功能、趋势全方位对比
WeKnora 是一个智能知识管理框架,利用 LLM 提供基于 RAG 的快速问答和基于 ReACT 的复杂推理功能。该平台支持多种数据源、多种文档格式,并能与各种 IM 渠道及 LLM 提供商无缝集成。其模块化架构通过本地或私有云部署选项,确保了企业对数据的完全主权。
FlashMLA 是由 DeepSeek 开发的高性能注意力内核库,旨在为其 V3 和 V3.2-Exp 模型提供动力。该存储库为稀疏和密集注意力提供了专门的实现,支持高效的预填充和解码阶段。这些内核专为现代 GPU 架构设计,可在计算密集型工作负载中实现显著的性能提升。