HubLens
搜索
⌘
K
关于
未找到结果。
首页
›
主题
› Deep Learning
Topic
Deep Learning
90 天热度
25
历史累计
25
近 4 周新增
0
03-20
0
03-27
11
04-03
14
04-10
本周 TOP 10
1
PaddleOCR
PaddleOCR 是一个综合性工具包,旨在将图像和 PDF 文档转换为 Markdown 和 JSON 等结构化、适配 LLM 的数据格式。它具备最先进的视觉语言模型和高性能文本识别引擎,支持超过 100 种语言。该平台被广泛集成到主流 AI Agent 和 RAG 框架中,可在各种硬件后端上提供高效的部署选项。
91
2
DeepGEMM
DeepGEMM 是一个轻量级的 CUDA 库,专为高效的通用矩阵乘法(GEMM)设计,支持 FP8 和 BF16 数据格式。它利用即时编译(JIT)模块消除了预安装内核编译的需求,同时保持了与专家调优库相当的性能。该库为密集型和 MoE 分组 GEMM 提供了专门的 API,是学习 GPU 内核优化的绝佳资源。
88
3
DeepEP
DeepEP 是一个专门的通信库,旨在通过高吞吐量、低延迟的 GPU 内核优化 Mixture-of-Experts 和专家并行。它通过提供非对称域带宽转发和基于 Hook 的通信计算重叠等高级功能,支持训练和推理工作负载。该库针对 NVLink 和 RDMA 环境进行了深度优化,为大规模模型部署提供了显著的性能提升。
88
4
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、带有时空掩码的可控生成模型以及专业的评估基准。它支持多种创意任务,包括图像到视频生成、风格迁移、角色 3D 建模和多模态引导。
88
5
magika
Magika 是一款利用深度学习提供高精度文件类型识别的 AI 工具,适用于二进制和文本格式。它配备了一个高度优化的模型,能够在单核 CPU 上以毫秒级速度进行推理,并保持约 99% 的准确率。该项目提供了通用的命令行界面和语言绑定,非常适合大规模的安全和内容策略扫描。
78
6
VoxCPM
VoxCPM2 是一个无需分词器的 2B 参数文本转语音系统,利用扩散自回归架构实现高度自然的音频合成。该模型支持 30 种语言,并提供包括文本描述生成语音和可控声音克隆在内的高级功能。它能够输出录音室级别的 48kHz 音频,并以 Apache-2.0 许可证完全开源,支持商业用途。
78
7
ERNIE-Image
ERNIE-Image 是百度开发的一款基于单流 Diffusion Transformer 架构的开源文生图模型。该模型配备了轻量级提示词增强器,能够将简短输入转化为结构丰富的描述。凭借 8B 参数规模,它在处理复杂指令、文本渲染及结构化视觉任务方面表现出色,并支持在消费级 GPU 上高效部署。
78
8
rtp-llm
RTP-LLM 是由阿里巴巴基础模型推理团队开发的高性能大语言模型推理加速引擎。该引擎已在淘宝、天猫等多个阿里业务场景中广泛应用,并支持多种主流模型格式与硬件后端。它通过集成先进的算子优化、量化技术及分布式推理能力,为开发者提供高效的生产级推理解决方案。
78
9
PaddleFormers
PaddleFormers 是基于飞桨框架构建的 Transformers 库,旨在为大语言模型和视觉语言模型提供与 Hugging Face 对等的训练接口。该项目通过集成张量并行、流水线并行及自动混合精度等技术,实现了在重点模型上超越 Megatron-LM 的训练性能。此外,它还全面支持 Safetensors 格式并深度适配了多种国产计算芯片,助力开发者高效完成全流程模型训练。
78
10
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在通过其成熟且兼容异构硬件的架构,促进工业 AI 在各行各业的商业化落地。
78
历史精选 (25)
PaddleOCR
PaddleOCR 是一个综合性工具包,旨在将图像和 PDF 文档转换为 Markdown 和 JSON 等结构化、适配 LLM 的数据格式。它具备最先进的视觉语言模型和高性能文本识别引擎,支持超过 100 种语言。该平台被广泛集成到主流 AI Agent 和 RAG 框架中,可在各种硬件后端上提供高效的部署选项。
91
DeepGEMM
DeepGEMM 是一个轻量级的 CUDA 库,专为高效的通用矩阵乘法(GEMM)设计,支持 FP8 和 BF16 数据格式。它利用即时编译(JIT)模块消除了预安装内核编译的需求,同时保持了与专家调优库相当的性能。该库为密集型和 MoE 分组 GEMM 提供了专门的 API,是学习 GPU 内核优化的绝佳资源。
88
DeepEP
DeepEP 是一个专门的通信库,旨在通过高吞吐量、低延迟的 GPU 内核优化 Mixture-of-Experts 和专家并行。它通过提供非对称域带宽转发和基于 Hook 的通信计算重叠等高级功能,支持训练和推理工作负载。该库针对 NVLink 和 RDMA 环境进行了深度优化,为大规模模型部署提供了显著的性能提升。
88
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、带有时空掩码的可控生成模型以及专业的评估基准。它支持多种创意任务,包括图像到视频生成、风格迁移、角色 3D 建模和多模态引导。
88
ncnn
ncnn 是一个专为移动端极致优化的高性能神经网络前向计算框架,旨在简化深度学习算法在手机端的部署。该框架无第三方依赖且具备跨平台特性,在移动端 CPU 上的运行速度优于目前所有已知的开源框架。目前,ncnn 已被广泛应用于腾讯旗下的多款主流应用中,助力开发者轻松构建智能应用程序。
86
DeepEP
DeepEP 是一个专门设计的通信库,旨在通过高吞吐量、低延迟的 GPU kernels 来优化 Mixture-of-Experts 和专家并行。它提供了诸如非对称域带宽转发和低精度支持等高级功能,以增强训练和推理性能。该库还包含基于 hook 的机制,用于实现通信与计算重叠,从而在不占用额外流式多处理器资源的情况下最大化硬件效率。
82
magika
Magika 是一款利用深度学习提供高精度文件类型识别的 AI 工具,适用于二进制和文本格式。它配备了一个高度优化的模型,能够在单核 CPU 上以毫秒级速度进行推理,并保持约 99% 的准确率。该项目提供了通用的命令行界面和语言绑定,非常适合大规模的安全和内容策略扫描。
78
VoxCPM
VoxCPM2 是一个无需分词器的 2B 参数文本转语音系统,利用扩散自回归架构实现高度自然的音频合成。该模型支持 30 种语言,并提供包括文本描述生成语音和可控声音克隆在内的高级功能。它能够输出录音室级别的 48kHz 音频,并以 Apache-2.0 许可证完全开源,支持商业用途。
78
ERNIE-Image
ERNIE-Image 是百度开发的一款基于单流 Diffusion Transformer 架构的开源文生图模型。该模型配备了轻量级提示词增强器,能够将简短输入转化为结构丰富的描述。凭借 8B 参数规模,它在处理复杂指令、文本渲染及结构化视觉任务方面表现出色,并支持在消费级 GPU 上高效部署。
78
rtp-llm
RTP-LLM 是由阿里巴巴基础模型推理团队开发的高性能大语言模型推理加速引擎。该引擎已在淘宝、天猫等多个阿里业务场景中广泛应用,并支持多种主流模型格式与硬件后端。它通过集成先进的算子优化、量化技术及分布式推理能力,为开发者提供高效的生产级推理解决方案。
78
PaddleFormers
PaddleFormers 是基于飞桨框架构建的 Transformers 库,旨在为大语言模型和视觉语言模型提供与 Hugging Face 对等的训练接口。该项目通过集成张量并行、流水线并行及自动混合精度等技术,实现了在重点模型上超越 Megatron-LM 的训练性能。此外,它还全面支持 Safetensors 格式并深度适配了多种国产计算芯片,助力开发者高效完成全流程模型训练。
78
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在通过其成熟且兼容异构硬件的架构,促进工业 AI 在各行各业的商业化落地。
78
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供了包含框架、模型库和开发工具的完整生态系统。它支持自动并行、训练与推理一体化以及用于科学计算的高阶微分等先进功能。该平台旨在通过提供灵活、高性能的架构来支持多样化的模型开发,从而促进 AI 在各行业的商业化落地。
78
ROLL
ROLL 是一个高效且用户友好的强化学习库,专为在大规模 GPU 集群上训练和扩展 Large Language Models 而设计。它利用由 Ray 驱动的多角色分布式架构,以支持诸如人类偏好对齐、推理和 Agentic 交互等复杂任务。该框架集成了 Megatron-Core、vLLM 和 SGLang 等先进技术,旨在加速跨不同硬件环境的模型训练和推理。
72
Protenix
Protenix 是一个专为高精度生物分子结构预测而设计的开源框架,其提供的模型性能可与最先进的方法相媲美。该项目提供了多个版本,包括增强版的 Protenix-v2,它在抗体-抗原结构预测和配体相关合理性方面展现了显著的改进。该项目基于 Apache 2.0 许可证发布,可免费用于学术和商业研究应用。
68
Index-anisora
Index-AniSora 是由 Bilibili 开发的一套用于高质量动漫视频生成的综合开源系统。该项目提供了一个可控生成模型、专门的数据处理流水线以及针对动画美学定制的评估基准。它支持角色 3D 视频生成、视频风格迁移和多模态引导等高级功能,以促进多样化的动画制作任务。
68
rtp-llm
RTP-LLM 是由阿里巴巴基础模型推理团队开发的高性能大模型推理加速引擎,广泛应用于淘宝、天猫等多个业务场景。该引擎通过集成多种先进的 CUDA 内核与量化技术,显著提升了模型推理的性能与效率。此外,它还具备极高的灵活性,支持多种模型格式、多模态输入以及 LoRA 服务部署。
68
community
PaddlePaddle 社区是开发者通过代码改进、文档编写和技术分享为框架做出贡献的核心枢纽。它提供结构化的治理机制、专门的工作组以及各类导师计划,以支持开发者的积极参与。贡献者将通过官方认证、发布说明以及项目作者记录获得认可。
58
vLLM-Kunlun
vLLM Kunlun 是一个由社区维护的硬件插件,旨在实现 vLLM 在 Kunlun XPU 设备上的无缝运行。它作为一个硬件可插拔接口,允许用户在不修改原始 vLLM 源代码的情况下运行各种大语言模型和多模态模型。该项目支持量化、LoRA 微调和硬件加速图优化等高级功能,以确保高性能推理。
52
TorchEasyRec
TorchEasyRec 是一个基于 PyTorch 的框架,旨在构建用于推荐任务的生产级深度学习模型。它支持多种算法,包括候选生成、排序、多任务学习和生成式推荐。该框架通过简单的配置、高可扩展性以及与各种数据源和部署环境的无缝集成,实现了高效的开发。
48
PaConvert
该工具由Paddle官方维护,旨在实现PyTorch代码到PaddlePaddle代码的高效自动化迁移。它支持超过1600个PyTorch API及200个torchvision API的一键转换,在测试中保持了95%以上的平均转换率。转换过程通过命令行操作,能够保持原代码的风格与结构,并提供详细的转换日志与总结。
48
PaddleCustomDevice
PaddleCustomDevice 是飞桨框架提供的自定义硬件接入实现方案。该项目旨在帮助开发者将各类第三方硬件后端集成到飞桨生态中。目前已支持包括昇腾、寒武纪、英特尔GPU及苹果MPS在内的多种主流硬件后端。
42
PaddleCustomDevice
PaddleCustomDevice 是飞桨深度学习框架提供的自定义硬件接入解决方案。该项目旨在帮助开发者将各类第三方硬件后端高效集成到飞桨生态中。目前已支持包括昇腾、寒武纪、英特尔GPU及苹果MPS在内的多种主流硬件平台。
42
VibeVoice
VibeVoice 是一系列开源语音 AI 模型,利用连续语音分词器和 next-token diffusion 框架来实现高保真音频处理。该项目提供了用于长文本自动语音识别、实时流式文本转语音以及多说话人合成的专用模型。这些模型专为研究目的而设计,提供诸如对长达一小时的音频进行单次处理以及支持超过 50 种语言等功能。
38
OmniVoice
OmniVoice 是一款基于扩散语言模型架构的先进大规模多语言零样本语音合成模型,支持超过 600 种语言。该模型具备卓越的推理速度,能够实现高质量的语音克隆与语音设计功能。用户可以通过 Python API 或命令行工具轻松进行语音生成,并支持细粒度的非语言符号及发音控制。
28
相关主题
PaddlePaddle
(7)
LLM
(6)
Generative AI
(5)
Machine Learning
(5)
GPU
(4)