首页主题Machine Learning
Topic

Machine Learning

90 天热度
16
历史累计
16

近 4 周新增

本周 TOP 10

1
KittenTTS
KittenTTS 是一个开源的轻量级语音合成库,利用 ONNX 实现高效的语音合成。该项目提供从 15M 到 80M 参数的多种模型尺寸,支持直接在 CPU 上生成高质量音频。它内置了文本预处理功能并支持多种音色,非常适合边缘设备部署。
92
2
secret-llama
Secret Llama 是一款完全在浏览器内运行的聊天机器人,允许用户与 Llama 3 和 Mistral 等开源模型进行交互。它通过将所有对话数据保留在用户的本地计算机上来确保完全的隐私,且无需服务器或安装任何软件。该平台提供类似于 ChatGPT 的用户友好界面,同时通过 WebGPU 技术支持离线功能。
88
3
tabby
Tabby 是一款自托管、开源的 AI 编程助手,旨在作为 GitHub Copilot 的本地部署替代方案。它作为一个独立的系统运行,无需外部云服务或复杂的数据库管理。该平台支持消费级 GPU,并提供 OpenAPI 接口,以便与现有的开发基础设施无缝集成。
88
4
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、带有时空掩码的可控生成模型以及专业的评估基准。它支持多种创意任务,包括图像到视频生成、风格迁移、角色 3D 建模和多模态引导。
88
5
hermes-agent-orange-book
本综合指南提供了由 Nous Research 开发的 Hermes Agent 框架的实用概述。它涵盖了诸如自我改进学习循环、三层记忆系统以及跨越十七章的自动技能演化等核心机制。本书为希望实现和定制自主 AI 代理的开发人员及 AI 爱好者提供了宝贵的资源。
88
6
opendataloader-pdf
OpenDataLoader PDF 是一款高性能开源解析器,旨在将 PDF 文档转换为 Markdown、JSON 和 HTML 等结构化格式,以供 AI 和 RAG 流水线使用。它采用混合处理模式,结合确定性本地解析与 AI 驱动分析,为复杂表格、公式和扫描文档实现行业领先的提取精度。此外,该项目还提供自动化无障碍解决方案,包括符合国际标准的端到端 Tagged PDF 生成功能。
78
7
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在通过其成熟且兼容异构硬件的架构,促进工业 AI 在各行各业的商业化落地。
78
8
learn-claude-code
本仓库提供了一个全面的教育框架,用于构建支持智能 AI agents 所需的基础设施或框架。它强调虽然代理能力源于训练模型,但框架对于提供有效运行所需的工具、上下文和环境至关重要。通过十二个循序渐进的课程,开发者将学习实现工具调度、任务管理和子代理协调等关键机制。
78
9
community
PaddlePaddle 社区是开发者通过代码改进、文档编写和技术分享为框架做出贡献的核心枢纽。它提供结构化的治理机制、专门的工作组以及各类导师计划,以支持开发者的积极参与。贡献者将通过官方认证、发布说明以及项目作者记录获得认可。
58
10
CorridorKey
CorridorKey 是一款基于神经网络的工具,旨在解决将前景主体从绿幕背景中分离的复杂问题。通过为每个像素预测真实的原始颜色和清晰的线性 alpha 通道,它能够保留传统抠像工具常会破坏的运动模糊和透明度等细腻细节。该软件通过输出与行业标准合成应用程序兼容的 16-bit 和 32-bit 线性浮点 EXR 文件,支持高保真 VFX 工作流程。
38

历史精选 (16)

KittenTTS
KittenTTS 是一个开源的轻量级语音合成库,利用 ONNX 实现高效的语音合成。该项目提供从 15M 到 80M 参数的多种模型尺寸,支持直接在 CPU 上生成高质量音频。它内置了文本预处理功能并支持多种音色,非常适合边缘设备部署。
92
secret-llama
Secret Llama 是一款完全在浏览器内运行的聊天机器人,允许用户与 Llama 3 和 Mistral 等开源模型进行交互。它通过将所有对话数据保留在用户的本地计算机上来确保完全的隐私,且无需服务器或安装任何软件。该平台提供类似于 ChatGPT 的用户友好界面,同时通过 WebGPU 技术支持离线功能。
88
tabby
Tabby 是一款自托管、开源的 AI 编程助手,旨在作为 GitHub Copilot 的本地部署替代方案。它作为一个独立的系统运行,无需外部云服务或复杂的数据库管理。该平台支持消费级 GPU,并提供 OpenAPI 接口,以便与现有的开发基础设施无缝集成。
88
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、带有时空掩码的可控生成模型以及专业的评估基准。它支持多种创意任务,包括图像到视频生成、风格迁移、角色 3D 建模和多模态引导。
88
hermes-agent-orange-book
本综合指南提供了由 Nous Research 开发的 Hermes Agent 框架的实用概述。它涵盖了诸如自我改进学习循环、三层记忆系统以及跨越十七章的自动技能演化等核心机制。本书为希望实现和定制自主 AI 代理的开发人员及 AI 爱好者提供了宝贵的资源。
88
opendataloader-pdf
OpenDataLoader PDF 是一款高性能开源解析器,旨在将 PDF 文档转换为 Markdown、JSON 和 HTML 等结构化格式,以供 AI 和 RAG 流水线使用。它采用混合处理模式,结合确定性本地解析与 AI 驱动分析,为复杂表格、公式和扫描文档实现行业领先的提取精度。此外,该项目还提供自动化无障碍解决方案,包括符合国际标准的端到端 Tagged PDF 生成功能。
78
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供核心框架、模型库和端到端开发工具。它支持统一动态图与静态图、自动并行以及用于科学计算的高阶微分等高级功能。该平台旨在通过其成熟且兼容异构硬件的架构,促进工业 AI 在各行各业的商业化落地。
78
learn-claude-code
本仓库提供了一个全面的教育框架,用于构建支持智能 AI agents 所需的基础设施或框架。它强调虽然代理能力源于训练模型,但框架对于提供有效运行所需的工具、上下文和环境至关重要。通过十二个循序渐进的课程,开发者将学习实现工具调度、任务管理和子代理协调等关键机制。
78
Paddle
PaddlePaddle 是一个全面的工业级深度学习平台,提供了包含框架、模型库和开发工具的完整生态系统。它支持自动并行、训练与推理一体化以及用于科学计算的高阶微分等先进功能。该平台旨在通过提供灵活、高性能的架构来支持多样化的模型开发,从而促进 AI 在各行业的商业化落地。
78
Index-anisora
Index-AniSora 是由 Bilibili 开发的一套用于高质量动漫视频生成的综合开源系统。该项目提供了一个可控生成模型、专门的数据处理流水线以及针对动画美学定制的评估基准。它支持角色 3D 视频生成、视频风格迁移和多模态引导等高级功能,以促进多样化的动画制作任务。
68
pipcook
Pipcook 是一个模块化的 JavaScript 应用框架,旨在帮助前端工程师将机器学习集成到他们的工作流程中。它提供了一个全面的流水线系统,允许用户直接在 Node.js 环境中训练、验证和部署机器学习模型。通过桥接对 Python 包的访问,该框架使开发人员能够利用强大的机器学习工具,而无需具备该领域的深厚专业知识。
65
pipcook
Pipcook 是一个 JavaScript 应用框架,旨在让前端工程师无需深厚的背景知识即可使用机器学习。该项目提供了一种模块化的流水线架构,支持模型训练、验证和部署的全生命周期。它还包含一个通往 Python 的桥梁,允许开发者在 Node.js 运行时中直接利用成熟的 Python 机器学习库。
62
community
PaddlePaddle 社区是开发者通过代码改进、文档编写和技术分享为框架做出贡献的核心枢纽。它提供结构化的治理机制、专门的工作组以及各类导师计划,以支持开发者的积极参与。贡献者将通过官方认证、发布说明以及项目作者记录获得认可。
58
CorridorKey
CorridorKey 是一款基于神经网络的工具,旨在解决将前景主体从绿幕背景中分离的复杂问题。通过为每个像素预测真实的原始颜色和清晰的线性 alpha 通道,它能够保留传统抠像工具常会破坏的运动模糊和透明度等细腻细节。该软件通过输出与行业标准合成应用程序兼容的 16-bit 和 32-bit 线性浮点 EXR 文件,支持高保真 VFX 工作流程。
38
hermes-agent-orange-book
本综合指南提供了对 Hermes Agent 的实践演练,这是一个由 Nous Research 开发的开源 AI 框架。本书详细介绍了该代理的独特架构,其特点包括自我改进的学习循环、三层记忆系统以及自动化技能演化。全书涵盖了从基础概念和安装到实际应用及高级代理编排的十七章内容。
38
LiteRT-LM
LiteRT-LM 是由 Google 设计的一款高性能、生产就绪型推理框架,旨在边缘设备上部署大型语言模型。它支持包括 Android、iOS、桌面端和 IoT 在内的多种平台,同时利用 GPU 和 NPU 硬件加速以实现最佳性能。该框架支持多模态和函数调用等高级功能,为各类 Google 产品中的端侧 AI 体验提供支持。
35