ホーム › トピック › Generative AI

// トピック

Generative AI

17直近 90 日のトレンド·17累計

// 今月の新着

// エコシステム

AI 17

// 最近の新着

すべての新着 →

#1Toonflow-app: One-stop AI Short Drama Creation Workbench🆕 3 か月前↗ 312.31/d★ 7,460 #2ArcReel: Open-source AI-powered video generation workbench🆕 3 か月前↗ 91.86/d★ 2,045 #3ERNIE-Image: High-Performance Open-Source Text-to-Image Diffusion Model🆕 18 日前↗ 53.67/d★ 412 #4Agent Sprite Forge: AI-Powered 2D Game Asset Generation🆕 9 日前↗ 15.49/d★ 70 #5OpenMontage: The First Agentic Video Production System🆕 1 か月前↗ 5.78/d★ 68

// 今週の TOP 9

HBAI-Ltd / Toonflow-app

Toonflow-app は、無限キャンバスと3層の Agent 連携システムを通じて、脚本から動画までの全工程を自動化するショートドラマ制作向け AI ワークベンチです。本プラットフォームは、チャプターイベントグラフ駆動型の翻案をサポートし、多様な AI モデルを柔軟に統合できるプログラマブルなプロバイダーシステムを提供します。ユーザーは、永続的なメモリシステムとモジュール式のスキル構成を活用することで、ショートドラマ制作の効率と一貫性を大幅に向上させることができます。

baidu / ERNIE-Image

ERNIE-Image は Baidu が開発した Diffusion Transformer (DiT) アーキテクチャに基づくオープンソースの text-to-image モデルです。このモデルは短い入力を構造化された詳細な記述に変換する軽量な prompt enhancer を備えており、8B パラメータ規模で業界最高水準の生成結果を実現します。複雑なテキストレンダリングやマルチオブジェクトのレイアウト、指示追従タスクに優れており、コンシューマー向け GPU での効率的なデプロイをサポートします。

bilibili / Index-anisora

Index-AniSora は、高品質なアニメ動画生成とアニメーション制作のために設計された強力なオープンソースフレームワークです。このシステムは、包括的なデータ処理パイプライン、時空間マスキングを備えた制御可能な生成モデル、および専門的な評価ベンチマークを特徴としています。キャラクターの 3D 生成、動画のスタイル変換、正確なモーション制御のためのマルチモーダルガイダンスなど、多様なクリエイティブタスクをサポートします。

ArcReel / ArcReel

ArcReel は、小説のスクリプトから完成した動画までをマルチエージェントアーキテクチャで自動化するオープンソースの AI 動画生成ワークベンチです。このプラットフォームは Gemini、Volcengine Ark、Grok、OpenAI などの多様なプロバイダーとの統合をサポートし、キャラクターの一貫性維持やナラティブ追跡機能を提供します。ユーザーはビジュアルインターフェースを通じてプロジェクト管理やコスト追跡を行い、Jianying のドラフトをエクスポートすることで効率的な AI 支援動画制作を実現できます。

0x0funky / agent-sprite-forge

Agent Sprite Forge は、Codex を活用して自然言語のプロンプトからゲーム用の 2D スプライトやレイヤー化されたマップを生成するツールです。AI による画像生成と決定論的なローカルでの後処理を組み合わせることで、アセットのパイプラインを自動化し、クリーンアップやエクスポートを効率化します。このシステムは、アニメーションシート、透過 GIF、衝突判定データ、複雑なシーンレイアウトなど、多様な出力をサポートしています。

microsoft / VibeVoice

VibeVoice は、連続音声トークナイザーと次トークン拡散を用いて高忠実度な音声処理を実現するオープンソースの音声 AI モデル群です。本フレームワークには、長文の音声認識やリアルタイムのストリーミング text-to-speech 生成のための高度なツールが含まれています。これらのモデルは、音声合成コミュニティにおける協力と革新を促進するための研究目的で設計されています。

Anil-matcha / Open-Generative-AI

Open Generative AI は、商用 AI メディアツールの制限のない代替手段を提供する無料のオープンソースプラットフォームです。コンテンツフィルターやサブスクリプション料金なしで、画像、動画、リップシンク生成のための 200 以上の最先端モデルをサポートしています。ユーザーは、ローカルおよびリモートの推論をサポートする Web ベースのインターフェースまたはデスクトップアプリケーションを通じて、これらの機能にアクセスできます。

hugohe3 / ppt-master

PPT Master は、PDF、DOCX ファイル、URL などのドキュメントを完全に編集可能な PowerPoint プレゼンテーションに変換するオープンソースツールです。画像ベースの AI ツールとは異なり、PowerPoint 上で直接編集できるネイティブな DrawingML 図形、テキストボックス、グラフを生成します。このワークフローは AI IDE と統合されており、プロフェッショナルなスライドを作成するためのプライバシーを重視したローカルソリューションを提供します。

fspecii / ace-step-ui

ACE-Step UI は、オープンソースの AI 音楽生成モデルである ACE-Step 1.5 に対応した、Spotify 風のプロフェッショナルなインターフェースを提供します。ユーザーはサブスクリプション料金やクラウドの制限を受けることなく、高品質な楽曲、インストゥルメンタル、歌詞を完全にローカル環境で生成可能です。本プラットフォームにはオーディオ編集、ステム分離、バッチ処理のための高度なツールが搭載されており、クリエイターは音楽制作を完全にコントロールできます。

// 累計の注目 (17)

HBAI-Ltd / Toonflow-app

Toonflow-app は、無限キャンバスと3層の Agent 連携システムを通じて、脚本から動画までの全工程を自動化するショートドラマ制作向け AI ワークベンチです。本プラットフォームは、チャプターイベントグラフ駆動型の翻案をサポートし、多様な AI モデルを柔軟に統合できるプログラマブルなプロバイダーシステムを提供します。ユーザーは、永続的なメモリシステムとモジュール式のスキル構成を活用することで、ショートドラマ制作の効率と一貫性を大幅に向上させることができます。

baidu / ERNIE-Image

ERNIE-Image は Baidu が開発した Diffusion Transformer (DiT) アーキテクチャに基づくオープンソースの text-to-image モデルです。このモデルは短い入力を構造化された詳細な記述に変換する軽量な prompt enhancer を備えており、8B パラメータ規模で業界最高水準の生成結果を実現します。複雑なテキストレンダリングやマルチオブジェクトのレイアウト、指示追従タスクに優れており、コンシューマー向け GPU での効率的なデプロイをサポートします。

bilibili / Index-anisora

Index-AniSora は、高品質なアニメ動画生成とアニメーション制作のために設計された強力なオープンソースフレームワークです。このシステムは、包括的なデータ処理パイプライン、時空間マスキングを備えた制御可能な生成モデル、および専門的な評価ベンチマークを特徴としています。キャラクターの 3D 生成、動画のスタイル変換、正確なモーション制御のためのマルチモーダルガイダンスなど、多様なクリエイティブタスクをサポートします。

ArcReel / ArcReel

ArcReel は、小説のスクリプトから完成した動画までをマルチエージェントアーキテクチャで自動化するオープンソースの AI 動画生成ワークベンチです。このプラットフォームは Gemini、Volcengine Ark、Grok、OpenAI などの多様なプロバイダーとの統合をサポートし、キャラクターの一貫性維持やナラティブ追跡機能を提供します。ユーザーはビジュアルインターフェースを通じてプロジェクト管理やコスト追跡を行い、Jianying のドラフトをエクスポートすることで効率的な AI 支援動画制作を実現できます。

0x0funky / agent-sprite-forge

Agent Sprite Forge は、Codex を活用して自然言語のプロンプトからゲーム用の 2D スプライトやレイヤー化されたマップを生成するツールです。AI による画像生成と決定論的なローカルでの後処理を組み合わせることで、アセットのパイプラインを自動化し、クリーンアップやエクスポートを効率化します。このシステムは、アニメーションシート、透過 GIF、衝突判定データ、複雑なシーンレイアウトなど、多様な出力をサポートしています。

bilibili / Index-anisora

Index-AniSora は Bilibili が開発した高品質なアニメ動画生成のための包括的なオープンソースシステムです。本プロジェクトは制御可能な生成モデル、専門的なデータ処理パイプライン、およびアニメーションの美学に最適化された評価ベンチマークを提供します。キャラクターの 3D 動画生成、動画スタイル変換、マルチモーダルガイダンスといった高度な機能をサポートし、多様なアニメーション制作タスクを促進します。

calesthio / OpenMontage

OpenMontage は、AI コーディングアシスタントを包括的なビデオ制作スタジオへと変貌させるオープンソースのエージェント型システムです。リサーチ、スクリプト作成、アセット生成、編集、最終的な構成に至るまで、クリエイティブなワークフロー全体を自動化します。このプラットフォームは、多様な無料および有料ツールを活用し、AI 生成ビジュアルと実写ドキュメンタリーモンタージュの両方をサポートしています。

OpenBMB / VoxCPM

VoxCPM2 は、diffusion autoregressive アーキテクチャを活用して高品質で表現力豊かな音声を生成する、2B パラメータの tokenizer-free な text-to-speech システムです。本モデルは 30 言語に対応しており、ボイスデザイン、制御可能な voice cloning、スタジオ品質の 48kHz 出力といった高度な機能を提供します。Apache-2.0 ライセンスの下で完全にオープンソース化されており、vLLM-Omni や Nano-vLLM を介した本番環境向けのデプロイメントオプションも用意されています。

jd-opensource / JoyAI-Image

JoyAI-Image は 8B Multimodal Large Language Model と 16B Multimodal Diffusion Transformer を統合し、画像の理解・生成・編集をサポートする統一マルチモーダル基盤モデルです。本モデルは理解と生成のクローズドループな連携を活用し、空間推論能力と制御可能な編集機能を強化しています。スケーラブルな学習パイプラインを提供し、マルチビュー生成や精密な空間操作といった高度な機能をサポートします。

PenglongHuang / chinese-novelist-skill

Chinese-novelist は Claude Code 向けに設計されたスキルプラグインであり、簡単な対話を通じて中国語小説の執筆プロセス全体を完了できるよう支援します。ユーザーは 5 つの核心的な質問に答えるだけで、AI が詳細な構成案、キャラクター設定、一貫性のある章の内容を自動生成します。このツールは専門的な執筆原則と品質チェックリストを組み込んでおり、小説のプロットの一貫性と魅力を保証します。

PenglongHuang / chinese-novelist-skill

Chinese-novelist は Claude Code 専用のスキルプラグインであり、5 つの核心的な質問に答えることで小説の構成案やキャラクター設定を迅速に作成できるよう支援します。章ごとの追跡と整合性管理を自動化することで、創作プロセスにおける論理的な厳密さと物語の魅力を維持します。ユーザーが計画を承認すると、AI は自動執筆モードに移行し、小説全体の初稿を効率的に完成させます。

microsoft / VibeVoice

VibeVoice は、連続音声トークナイザーと次トークン拡散を用いて高忠実度な音声処理を実現するオープンソースの音声 AI モデル群です。本フレームワークには、長文の音声認識やリアルタイムのストリーミング text-to-speech 生成のための高度なツールが含まれています。これらのモデルは、音声合成コミュニティにおける協力と革新を促進するための研究目的で設計されています。

mnfst / awesome-free-llm-apis

このリポジトリは、テキスト推論に対して恒久的な無料枠を提供する LLM API プロバイダーの厳選リストです。サービスを直接プロバイダーの API とサードパーティの推論プラットフォームに分類し、モデルの機能、コンテキストウィンドウ、レート制限を詳細に解説しています。このコレクションは、さまざまな大規模言語モデルへのコスト効率の高いアクセスを求める開発者にとって包括的なリソースとなります。

google-ai-edge / gallery

Google AI Edge Gallery は、強力なオープンソースの Large Language Models をデバイス上で直接実行するために設計されたモバイルアプリケーションです。ユーザーが最新の Gemma 4 ファミリーを含む高度な生成 AI 機能を、完全にオフラインかつプライベートな環境で体験できるようにします。このアプリは、モデル管理、ベンチマーク、およびインタラクティブな AI 機能のための包括的なツールスイートを提供します。

Anil-matcha / Open-Generative-AI

Open Generative AI は、商用 AI メディアツールの制限のない代替手段を提供する無料のオープンソースプラットフォームです。コンテンツフィルターやサブスクリプション料金なしで、画像、動画、リップシンク生成のための 200 以上の最先端モデルをサポートしています。ユーザーは、ローカルおよびリモートの推論をサポートする Web ベースのインターフェースまたはデスクトップアプリケーションを通じて、これらの機能にアクセスできます。

hugohe3 / ppt-master

PPT Master は、PDF、DOCX ファイル、URL などのドキュメントを完全に編集可能な PowerPoint プレゼンテーションに変換するオープンソースツールです。画像ベースの AI ツールとは異なり、PowerPoint 上で直接編集できるネイティブな DrawingML 図形、テキストボックス、グラフを生成します。このワークフローは AI IDE と統合されており、プロフェッショナルなスライドを作成するためのプライバシーを重視したローカルソリューションを提供します。

fspecii / ace-step-ui

ACE-Step UI は、オープンソースの AI 音楽生成モデルである ACE-Step 1.5 に対応した、Spotify 風のプロフェッショナルなインターフェースを提供します。ユーザーはサブスクリプション料金やクラウドの制限を受けることなく、高品質な楽曲、インストゥルメンタル、歌詞を完全にローカル環境で生成可能です。本プラットフォームにはオーディオ編集、ステム分離、バッチ処理のための高度なツールが搭載されており、クリエイターは音楽制作を完全にコントロールできます。

// プロジェクト別ユースケース

01Novel-to-film adaptation and script development
02Short video content creation and asset generation
03AI-driven automated storyboarding and video production

01High-quality poster and infographic generation
02Multi-object and layout control under complex instructions
03Multi-style image creation and rapid inference acceleration

01Character 3D video generation from front-facing illustrations
02Video style transfer and frame interpolation for anime production
03Multimodal guidance for precise control over video motion and aesthetics

01Multi-agent automated video generation workflow based on the Claude Agent SDK
02Support for multi-provider image and video generation with character consistency and narrative tracking capabilities
03Built-in visual workbench supporting project management, cost tracking, and one-click export of Jianying drafts

agent-sprite-forge

01Generating character animations and spell effect sprite sheets
02Creating layered RPG maps with collision data and transparent props
03Building end-to-end playable game scenes with integrated assets

// 関連トピック

Computer Vision (5)Automation (4)Video Generation (4)Deep Learning (4)AI (2)