Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービス
Kitten-TTS-Serverは、軽量なKittenTTSモデルの機能拡張サーバーを提供するオープンソースプロジェクトです。ユーザーはこのプロジェクトを使って独自の音声合成(TTS)サービスを構築することができます。このプロジェクトの核となる利点は、オリジナルのモデルをベースにしていることです。
FineShare:AIの音声と音楽を生成するオーサリングツール
FineShareはAI音声・映像技術に特化したプラットフォームで、ユーザーが高品質な音声・音楽・映像コンテンツを作成するための様々なツールを提供している。同サイトの主力製品には、音声生成・変換、AI音楽作成、バーチャルカメラ用のFineVoice、Singify、FineCamがある。
サイバースマート:テキストを音声に変換し、デジタルヒューマンビデオに変換する
Xunfei Zhizuoは、人工知能コンテンツ作成サービスを提供するためにXunfeiによって開発されたプラットフォームです。その中核機能は、ユーザーが入力したテキストを音声に変換することであり、このプロセスはしばしば「AIダビング」または「音声合成」と呼ばれる。ユーザーはプリセットされた様々なバーチャルボイス(すなわち「アンカー」)から選択することができる...
パロットTTS:ウェブテキストを自然な音声に変換する読み上げツール
Parrot TTSは、ウェブテキストを自然な音声に変換するために設計されたChrome拡張機能です。高度なAI技術を駆使して人間に近い音声体験を提供し、従来の音声合成ツールの機械的な音声の問題を解決します。ユーザーは、記事やニュース、研究資料をワンクリックで変換することができます...
Wavel AI:多言語映像の吹替・字幕を高速生成するツール
Wavel AIはAIベースのプラットフォームで、ビデオコンテンツの迅速な作成とローカライズを支援することに重点を置いている。音声クローニング、テキスト読み上げ、自動字幕生成などの機能により、ユーザーは多言語のビデオおよびオーディオコンテンツを簡単に作成することができます。このプラットフォームは70以上の言語をサポートし、1000以上の...
AIVocal:ポッドキャスト作成と音声処理のための無料AIツール
AIVocalは無料のAI音声処理プラットフォームで、音声合成(TTS)、音声テキスト化(STT)、人声分離、ポッドキャスト生成を提供します。ユーザーは登録なしで使用でき、24の言語と900以上の自然なトーンをサポートしており、ポッドキャスト、オーディオブック、ビデオダビングなどの作成に適しています。
Dia:超リアルな多人数対話生成のための音声合成モデル
Diaは、Nari Labs社によって開発されたオープンソースのテキスト音声合成(TTS)モデルであり、超リアルなダイアログ音声の生成に重点を置いている。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、笑いなどの非言語的表現まで生成します。
MiniMax Audio (Conch Speech): 自然な音声を生成するAIツール
MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、最大99%の音声合成類似度、スタジオ級の音質、30以上の言語と幅広い口語をサポートしています。
Text2Voice:シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース
Text2Voiceは、シリコンベースのモビリティAPIをベースにテキスト読み上げ機能を提供するオープンソースツールで、すっきりとしたグラフィカル・ユーザー・インターフェース(GUI)が最大の特徴だ。開発者のSheldon Lee氏によってGitHub上で作成され、ユーザーが簡単にテキストを音声に変換できるインターフェースとなっている。このプロジェクトではPy...
複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト
Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換することができ、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpenAI TTS、AWS Polly、MiniM...を統合している。
Mureka:崑崙のAI生成オリジナル音楽ツール
2025年3月26日、ムレカは世界初の音楽推論マクロモデル「ムレカO1」とベースモデル「ムレカV6」を発表した。
csm-mlx: Appleデバイス用csm音声生成モデル
csm-mlxは、Appleが開発したMLXフレームワークをベースに、CSM(Conversation Speech Model)音声対話モデルをApple Silicon専用に最適化したものです。このプロジェクトにより、ユーザーはAppleデバイス上で効率的な音声生成を簡単な方法で実行することができます。
Autiobooks: epub電子書籍をm4bオーディオブックに変換する
Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。Kokoroが提供する高品質の音声合成技術を使用し、自然で滑らかな音声を生成します。このツールはDavid Nesbittによって開発され、MIT ...
PlayHT:超リアルな音声を生成するAIツール
PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、テキストを自然でリアルな音声に素早く変換することができます。600以上のAI音声を提供し、60以上の言語と多様なアクセントをサポートし、ポッドキャスト制作、教育コンテンツ、マーケティング、プロモーションなど様々なシーンに適しています。ユーザーは入力するだけです...
Spark-TTS:自然な音声を生成する音声合成ツール
Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成(TTS)ツールです。高度なディープラーニング技術に基づいており、複数の言語と音声スタイルをサポートしています...
Azure TTS Importer:音声合成サービスを読み上げソフトウェアに統合する
TTS Importerは、Azure TTS(Text-to-Speech)音声合成サービスを様々な読み上げソフトに簡単にインポートするために設計されたオープンソースプロジェクトです。このツールは、Read (legado)、Love Reader、Source Readerなど、人気のある読み上げソフトをサポートしています。TTS Importe...
ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス
ココロWebGPUは、WebMLコミュニティがHugging Faceプラットフォーム上で提供しているココロ音声合成(TTS)モデルのWebGPUバージョンです。このプロジェクトでは、WebGPU技術を利用して、ユーザーがブラウザ上でローカルに効率的な音声合成を実行できるようにしています。
ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツール
ココロ-ONNXは、ONNXランタイムをベースにしたオープンソースの音声合成(TTS)ツールです。Kokoro-ONNXは、英語を含む複数の言語をサポートし、フランス語、日本語、韓国語、中国語をサポートする予定です。
OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。
OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質の音声出力を生成できるようにします。
トップに戻る