star ・機能・トレンドを横並び比較
Voicebox は、7 種類の TTS エンジンを使用して音声クローンや音声合成を行える、包括的なローカルファーストの音声合成スタジオです。マルチトラックタイムラインエディタを搭載しており、複雑なナレーションの作成や高度なポストプロセッシングエフェクトによる音声の調整が可能です。プライバシーとパフォーマンスを重視して設計されており、主要な OS 上でネイティブ動作するほか、開発者向けに堅牢な REST API を提供しています。
NeuTTS は、リアルタイムなパフォーマンスと高品質な音声合成を実現するために設計された、オープンソースのオンデバイス Text-to-Speech モデル群です。このフレームワークは軽量な LLM バックボーンとニューラルオーディオコーデックを活用し、わずか 3 秒の音声でインスタントなボイスクローニングを可能にします。これらのモデルはモバイルや組み込みデバイスへのデプロイに最適化されており、英語、スペイン語、ドイツ語、フランス語など多言語に対応しています。