HubLens
搜索
⌘
K
关于
未找到结果。
首页
›
主题
› Generative AI
Topic
Generative AI
90 天热度
11
历史累计
11
近 4 周新增
0
03-20
0
03-27
5
04-03
6
04-10
本周 TOP 6
1
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、带有时空掩码的可控生成模型以及专业的评估基准。它支持多种创意任务,包括图像到视频生成、风格迁移、角色 3D 建模和多模态引导。
88
2
ArcReel
ArcReel 是一款基于 AI Agent 驱动的开源视频生成工作台,旨在实现从小说剧本到短视频成片的自动化生产。该平台通过多智能体架构编排任务,支持 Gemini、火山方舟、Grok 及 OpenAI 等多种主流供应商的图像与视频生成模型。用户可通过可视化界面管理项目,并利用异步任务队列与版本回滚功能,高效完成高质量的视频创作。
88
3
OpenMontage
OpenMontage 是一个开源的智能体系统,它将 AI 编程助手转变为功能全面的视频制作工作室。它实现了整个创作工作流的自动化,涵盖了研究、脚本编写、素材生成、剪辑以及最终合成。该平台支持使用多种免费和付费工具来制作 AI 生成的视觉内容以及真实素材的纪录片蒙太奇。
78
4
VoxCPM
VoxCPM2 是一个无需分词器的 2B 参数文本转语音系统,利用扩散自回归架构实现高度自然的音频合成。该模型支持 30 种语言,并提供包括文本描述生成语音和可控声音克隆在内的高级功能。它能够输出录音室级别的 48kHz 音频,并以 Apache-2.0 许可证完全开源,支持商业用途。
78
5
ERNIE-Image
ERNIE-Image 是百度开发的一款基于单流 Diffusion Transformer 架构的开源文生图模型。该模型配备了轻量级提示词增强器,能够将简短输入转化为结构丰富的描述。凭借 8B 参数规模,它在处理复杂指令、文本渲染及结构化视觉任务方面表现出色,并支持在消费级 GPU 上高效部署。
78
6
JoyAI-Image
JoyAI-Image 是一个统一的多模态基础模型,它集成了 8B Multimodal Large Language Model 和 16B Multimodal Diffusion Transformer,以支持图像理解、生成和编辑。该模型利用理解与生成之间的闭环协作,增强了空间推理和可控编辑能力。它提供了一个可扩展的训练流水线,并支持多视图生成和精确空间操作等高级功能。
28
历史精选 (11)
Index-anisora
Index-AniSora 是一个专为高质量动漫视频生成和动画制作而设计的强大开源框架。该系统集成了全面的数据处理流水线、带有时空掩码的可控生成模型以及专业的评估基准。它支持多种创意任务,包括图像到视频生成、风格迁移、角色 3D 建模和多模态引导。
88
ArcReel
ArcReel 是一款基于 AI Agent 驱动的开源视频生成工作台,旨在实现从小说剧本到短视频成片的自动化生产。该平台通过多智能体架构编排任务,支持 Gemini、火山方舟、Grok 及 OpenAI 等多种主流供应商的图像与视频生成模型。用户可通过可视化界面管理项目,并利用异步任务队列与版本回滚功能,高效完成高质量的视频创作。
88
OpenMontage
OpenMontage 是一个开源的智能体系统,它将 AI 编程助手转变为功能全面的视频制作工作室。它实现了整个创作工作流的自动化,涵盖了研究、脚本编写、素材生成、剪辑以及最终合成。该平台支持使用多种免费和付费工具来制作 AI 生成的视觉内容以及真实素材的纪录片蒙太奇。
78
VoxCPM
VoxCPM2 是一个无需分词器的 2B 参数文本转语音系统,利用扩散自回归架构实现高度自然的音频合成。该模型支持 30 种语言,并提供包括文本描述生成语音和可控声音克隆在内的高级功能。它能够输出录音室级别的 48kHz 音频,并以 Apache-2.0 许可证完全开源,支持商业用途。
78
ERNIE-Image
ERNIE-Image 是百度开发的一款基于单流 Diffusion Transformer 架构的开源文生图模型。该模型配备了轻量级提示词增强器,能够将简短输入转化为结构丰富的描述。凭借 8B 参数规模,它在处理复杂指令、文本渲染及结构化视觉任务方面表现出色,并支持在消费级 GPU 上高效部署。
78
chinese-novelist-skill
Chinese-novelist 是一款专为 Claude Code 设计的技能插件,旨在帮助用户通过回答五个核心问题快速生成完整的小说大纲与人物档案。该工具通过自动化的章节追踪与连贯性管理,确保创作过程逻辑严密且情节引人入胜。用户确认规划后,AI 将进入自动创作模式,高效完成整部小说的初稿撰写。
76
chinese-novelist-skill
Chinese-novelist 是一个专为 Claude Code 设计的技能插件,旨在帮助用户通过简单的交互完成中文小说的全流程创作。用户只需回答五个核心问题,AI 即可自动生成详细的大纲、人物档案及连贯的章节内容。该工具内置了专业的创作法则与质量检查清单,能够确保小说情节的连贯性与吸引力。
74
Index-anisora
Index-AniSora 是由 Bilibili 开发的一套用于高质量动漫视频生成的综合开源系统。该项目提供了一个可控生成模型、专门的数据处理流水线以及针对动画美学定制的评估基准。它支持角色 3D 视频生成、视频风格迁移和多模态引导等高级功能,以促进多样化的动画制作任务。
68
gallery
Google AI Edge Gallery 是一款旨在直接在您的设备上运行强大的开源 Large Language Models 的移动应用程序。它为用户提供了一个完全离线且私密的环境,以体验先进的生成式 AI 功能,包括最新的 Gemma 4 系列。该应用程序提供了一套全面的工具,用于模型管理、基准测试和交互式 AI 功能。
42
VibeVoice
VibeVoice 是一系列开源语音 AI 模型,利用连续语音分词器和 next-token diffusion 框架来实现高保真音频处理。该项目提供了用于长文本自动语音识别、实时流式文本转语音以及多说话人合成的专用模型。这些模型专为研究目的而设计,提供诸如对长达一小时的音频进行单次处理以及支持超过 50 种语言等功能。
38
JoyAI-Image
JoyAI-Image 是一个统一的多模态基础模型,它集成了 8B Multimodal Large Language Model 和 16B Multimodal Diffusion Transformer,以支持图像理解、生成和编辑。该模型利用理解与生成之间的闭环协作,增强了空间推理和可控编辑能力。它提供了一个可扩展的训练流水线,并支持多视图生成和精确空间操作等高级功能。
28
相关主题
Deep Learning
(5)
Automation
(3)
Video Generation
(3)
Computer Vision
(3)
Machine Learning
(2)