首页主题Machine Learning
// 主题

Machine Learning

21近 90 天热度·21历史累计

// 近 4 周新增

// 生态图谱

LLM7Deep Learning6Python5Computer Vision3PaddlePaddle3Machine Learning
AI 21

// 近期新项目

查看全部新项目 →

// 本周 TOP 10

01
TabbyML / tabby
Tabby 是一款自托管的开源 AI 编程助手,旨在作为 GitHub Copilot 的本地化替代方案。它作为一个独立的系统运行,无需外部云服务或数据库管理。该平台支持消费级 GPU,并提供 OpenAPI 接口,以便与现有的开发基础设施无缝集成。
8833,480
02
deepseek-ai / DeepEP
DeepEP 是一款专为现代机器学习训练和推理设计的高性能通信库,特别专注于专家并行技术。该库利用轻量级的 Just-In-Time 编译模块和 NCCL Gin 后端,提供高吞吐量、低延迟的 GPU kernels。它支持流水线并行和远程内存访问等高级功能,并与之前版本相比显著降低了 SM 资源消耗。
869,594
03
PaddlePaddle / Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在促进跨不同工业领域的大规模模型训练与推理。
8523,870
04
deepseek-ai / Thinking-with-Visual-Primitives
Thinking with Visual Primitives 引入了一种通过将空间标记直接交织到推理过程中来处理多模态大语言模型的新方法。该方法通过将抽象语言锚定到具体的物理坐标,解决了复杂结构任务中的引用鸿沟。该框架在保持高视觉标记效率的同时,通过压缩架构实现了具有前沿竞争力的性能。
84213
05
alchaincyf / hermes-agent-orange-book
本综合指南详细介绍了由 Nous Research 开发的 Hermes Agent 框架。书中分十七章涵盖了自我改进学习循环、记忆系统和自动化技能演进等核心机制。对于希望实现并定制自己智能代理的开发者和 AI 爱好者而言,本书是一份实用的参考资源。
743,426
06
abi / secret-llama
Secret Llama 是一款完全在浏览器内运行的聊天机器人,允许用户在本地运行 Llama 3 和 Mistral 等开源模型。由于该应用程序直接在浏览器中运行,所有对话数据均保持私密,且无需进行任何服务器安装。该平台提供了一个用户友好的界面,在利用 WebGPU 技术提升性能的同时支持离线使用。
712,672
07
KittenML / KittenTTS
KittenTTS 是一个开源的轻量级文本转语音库,专为 CPU 上的高效语音合成而设计。它提供从 15M 到 80M 参数的多种模型尺寸,确保以极小的磁盘占用空间输出高质量的 24 kHz 音频。该库包含内置的文本预处理功能,并支持可调节的语速,以实现灵活的集成。
7113,712
08
nikopueringer / CorridorKey
CorridorKey 是一款基于神经网络的工具,旨在解决将前景主体从绿幕或蓝幕背景中分离的复杂问题。它能够为每个像素重建真实的直通色彩和线性 Alpha 通道,从而有效保留头发和运动模糊等精细细节。该项目通过输出与行业标准合成软件兼容的 16-bit 和 32-bit Linear float EXR 文件,为高保真 VFX 工作流程提供支持。
4223
09
shiyu-coder / Kronos
Kronos 是一个开源的仅解码器基础模型,专门用于分析和预测金融 K 线序列。它利用两阶段框架,将多维市场数据量化为分层 Token,随后通过自回归 Transformer 进行处理。该项目提供了一套完整的预训练模型和工具,支持直接预测以及特定领域的微调。
2825
10
rohitg00 / ai-engineering-from-scratch
AI Engineering from Scratch 是一个包含 320 小时的综合课程,引导学生从基础的线性代数学习到构建自主智能体集群。该课程强调 AI-native 的学习方法,学生在 20 个不同的阶段中使用 AI coding agents 来测试知识并构建可复用的工具。通过使用 Python、TypeScript、Rust 和 Julia 进行开发,学习者可以建立一个包含 prompts、技能和 agents 的专业作品集,并将其部署到实际环境中。
2824

// 历史精选 (21)

PaddlePaddle / Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供了包含框架、模型库和开发工具的完整生态系统。它支持自动并行、训练与推理一体化以及用于科学计算的高阶微分等先进功能。该平台旨在通过提供灵活、高性能的架构来支持多样化的模型开发,从而促进 AI 在各行业的商业化落地。
92
TabbyML / tabby
Tabby 是一款自托管的开源 AI 编程助手,旨在作为 GitHub Copilot 的本地化替代方案。它作为一个独立的系统运行,无需外部云服务或数据库管理。该平台支持消费级 GPU,并提供 OpenAPI 接口,以便与现有的开发基础设施无缝集成。
88
deepseek-ai / DeepEP
DeepEP 是一款专为现代机器学习训练和推理设计的高性能通信库,特别专注于专家并行技术。该库利用轻量级的 Just-In-Time 编译模块和 NCCL Gin 后端,提供高吞吐量、低延迟的 GPU kernels。它支持流水线并行和远程内存访问等高级功能,并与之前版本相比显著降低了 SM 资源消耗。
86
PaddlePaddle / Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在促进跨不同工业领域的大规模模型训练与推理。
85
deepseek-ai / Thinking-with-Visual-Primitives
Thinking with Visual Primitives 引入了一种通过将空间标记直接交织到推理过程中来处理多模态大语言模型的新方法。该方法通过将抽象语言锚定到具体的物理坐标,解决了复杂结构任务中的引用鸿沟。该框架在保持高视觉标记效率的同时,通过压缩架构实现了具有前沿竞争力的性能。
84
ruvnet / RuView
RuView 是一个基于边缘的感知平台,利用 WiFi Channel State Information (CSI) 来检测人员存在、生命体征和活动,无需摄像头或可穿戴设备。该系统通过低成本的 ESP32 硬件处理无线电信号干扰,以提供实时的空间智能和环境映射。它支持诸如 3D point cloud 生成、pose estimation 以及使用本地神经网络进行持久化数据存储等高级功能。
78
alchaincyf / hermes-agent-orange-book
本综合指南详细介绍了由 Nous Research 开发的 Hermes Agent 框架。书中分十七章涵盖了自我改进学习循环、记忆系统和自动化技能演进等核心机制。对于希望实现并定制自己智能代理的开发者和 AI 爱好者而言,本书是一份实用的参考资源。
74
abi / secret-llama
Secret Llama 是一款完全在浏览器内运行的聊天机器人,允许用户在本地运行 Llama 3 和 Mistral 等开源模型。由于该应用程序直接在浏览器中运行,所有对话数据均保持私密,且无需进行任何服务器安装。该平台提供了一个用户友好的界面,在利用 WebGPU 技术提升性能的同时支持离线使用。
71
KittenML / KittenTTS
KittenTTS 是一个开源的轻量级文本转语音库,专为 CPU 上的高效语音合成而设计。它提供从 15M 到 80M 参数的多种模型尺寸,确保以极小的磁盘占用空间输出高质量的 24 kHz 音频。该库包含内置的文本预处理功能,并支持可调节的语速,以实现灵活的集成。
71
alibaba / pipcook
Pipcook 是一个模块化的 JavaScript 应用框架,旨在帮助前端工程师将机器学习集成到他们的工作流程中。它提供了一个全面的流水线系统,允许用户直接在 Node.js 环境中训练、验证和部署机器学习模型。通过桥接对 Python 包的访问,该框架使开发人员能够利用强大的机器学习工具,而无需具备该领域的深厚专业知识。
61
bilibili / Index-anisora
Index-AniSora 是由 Bilibili 开发的一套用于高质量动漫视频生成的综合开源系统。该项目提供了一个可控生成模型、专门的数据处理流水线以及针对动画美学定制的评估基准。它支持角色 3D 视频生成、视频风格迁移和多模态引导等高级功能,以促进多样化的动画制作任务。
61
opendataloader-project / opendataloader-pdf
OpenDataLoader PDF 是一款高性能开源解析器,旨在将 PDF 文档转换为 Markdown、JSON 和 HTML 等结构化格式,以供 AI 和 RAG 流水线使用。它采用混合处理模式,结合确定性本地解析与 AI 驱动分析,为复杂表格、公式和扫描文档实现行业领先的提取精度。此外,该项目还提供自动化无障碍解决方案,包括符合国际标准的端到端 Tagged PDF 生成功能。
59
google-ai-edge / LiteRT-LM
LiteRT-LM 是由 Google 设计的一款高性能、生产就绪型推理框架,旨在边缘设备上部署大型语言模型。它支持包括 Android、iOS、桌面端和 IoT 在内的多种平台,同时利用 GPU 和 NPU 硬件加速以实现最佳性能。该框架支持多模态和函数调用等高级功能,为各类 Google 产品中的端侧 AI 体验提供支持。
54
alibaba / pipcook
Pipcook 是一个 JavaScript 应用框架,旨在让前端工程师无需深厚的背景知识即可使用机器学习。该项目提供了一种模块化的流水线架构,支持模型训练、验证和部署的全生命周期。它还包含一个通往 Python 的桥梁,允许开发者在 Node.js 运行时中直接利用成熟的 Python 机器学习库。
53
alibaba / pairec
Pairec 是一个基于 Go 的 Web 框架,旨在加速在线推荐服务的开发。它利用基于 JSON 的配置来简化复杂推荐逻辑的设置和部署。该框架包含多种内置模型功能,以简化高效推荐系统的创建。
43
nikopueringer / CorridorKey
CorridorKey 是一款基于神经网络的工具,旨在解决将前景主体从绿幕或蓝幕背景中分离的复杂问题。它能够为每个像素重建真实的直通色彩和线性 Alpha 通道,从而有效保留头发和运动模糊等精细细节。该项目通过输出与行业标准合成软件兼容的 16-bit 和 32-bit Linear float EXR 文件,为高保真 VFX 工作流程提供支持。
42
alchaincyf / hermes-agent-orange-book
本综合指南提供了对 Hermes Agent 的实践演练,这是一个由 Nous Research 开发的开源 AI 框架。本书详细介绍了该代理的独特架构,其特点包括自我改进的学习循环、三层记忆系统以及自动化技能演化。全书涵盖了从基础概念和安装到实际应用及高级代理编排的十七章内容。
39
PaddlePaddle / community
PaddlePaddle 社区是开发者通过代码改进、文档编写和技术分享为框架做出贡献的核心枢纽。它提供结构化的治理机制、专门的工作组以及各类导师计划,以支持开发者的积极参与。贡献者将通过官方认证、发布说明以及项目作者记录获得认可。
29
shiyu-coder / Kronos
Kronos 是一个开源的仅解码器基础模型,专门用于分析和预测金融 K 线序列。它利用两阶段框架,将多维市场数据量化为分层 Token,随后通过自回归 Transformer 进行处理。该项目提供了一套完整的预训练模型和工具,支持直接预测以及特定领域的微调。
28
rohitg00 / ai-engineering-from-scratch
AI Engineering from Scratch 是一个包含 320 小时的综合课程,引导学生从基础的线性代数学习到构建自主智能体集群。该课程强调 AI-native 的学习方法,学生在 20 个不同的阶段中使用 AI coding agents 来测试知识并构建可复用的工具。通过使用 Python、TypeScript、Rust 和 Julia 进行开发,学习者可以建立一个包含 prompts、技能和 agents 的专业作品集,并将其部署到实际环境中。
28
shareAI-lab / learn-claude-code
本仓库提供了一个构建 Agent Harness 的综合教育框架,这是 AI 模型感知和行动所必需的基础环境。它认为真正的代理能力是在模型训练期间习得的,而开发者的角色是构建工具、知识和上下文管理系统以支持这些模型运行。通过十二个进阶课程,用户将学习通过逆向工程 Claude Code 背后的原理来构建稳健且可扩展的 Agent 架构。
26

// 项目使用场景

Paddle
  • 01针对大规模模型的自动分布式并行训练
  • 02用于科学计算应用的高阶自动微分
  • 03通过标准化、可插拔架构实现的异构多芯片适配
tabby
  • 01自托管 AI 代码补全与生成
  • 02通过 Answer Engine 进行内部知识检索
  • 03与 VSCode、Vim 和 IntelliJ 等 IDE 集成
DeepEP
  • 01高吞吐量和低延迟的 MoE 分发与合并操作
  • 02用于大规模模型训练和推理的高效专家并行
  • 03对流水线并行、上下文并行和远程内存访问的实验性支持
Paddle
  • 01支持自动并行的统一动态图与静态图训练
  • 02集成化的大模型训练与推理工作流
  • 03用于科学计算和微分方程的高阶微分
Thinking-with-Visual-Primitives
  • 01使用空间标记进行基础任务推理
  • 02视觉环境中的复杂拓扑推理
  • 03通过减少标记消耗实现高效视觉处理

// 项目对比

// 相关主题