AIオーディオ

 ウェブサイトを投稿する

Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービス
Kitten-TTS-Serverは、軽量なKittenTTSモデルの機能拡張サーバーを提供するオープンソースプロジェクトです。ユーザーはこのプロジェクトを使って、独自の音声合成（TTS）サービスを構築することができます。このプロジェクトの核となる利点は、オリジナルのモデルに基づき、直感的なウェブページを追加していることです。.
4.7 Kをとおして0表彰される
0ブックマークに登録
FineShare：AIの音声と音楽を生成するオーサリングツール
FineShareはAI音声・映像技術に特化したプラットフォームで、ユーザーが高品質な音声・音楽・映像コンテンツを作成するための様々なツールを提供している。同サイトの主力製品には、音声生成・変換、AI音楽作成、バーチャルカメラ用のFineVoice、Singify、FineCamがある。
2.8 Kをとおして0表彰される
0ブックマークに登録
サイバースマート：テキストを音声に変換し、デジタルヒューマンビデオに変換する
Xunfei Zhizuoは、人工知能コンテンツ作成サービスを提供するためにXunfeiによって開発されたプラットフォームです。その中核機能は、ユーザーが入力したテキストを音声に変換することであり、このプロセスはしばしば「AIダビング」または「音声合成」と呼ばれる。ユーザーは、あらかじめプログラムされたさまざまなスタイルのバーチャルボイス（すなわち「キャスター」）から、ニュースキャスターやニュース番組などの音声を選ぶことができる。.
2.9 Kをとおして0表彰される
0ブックマークに登録
パロットTTS：ウェブテキストを自然な音声に変換する読み上げツール
Parrot TTSは、ウェブテキストを自然な音声に変換するために設計されたChrome拡張機能です。高度なAI技術を駆使し、人間に近い音声体験を提供することで、従来の音声合成ツールの機械的な音声の問題を解決しています。ユーザーは、記事、ニュース、研究資料をワンクリックで音声に変換でき、マルチタスクに適しています...
2.4 Kをとおして0表彰される
0ブックマークに登録
Wavel AI：多言語映像の吹替・字幕を高速生成するツール
Wavel AIはAIベースのプラットフォームで、ビデオコンテンツの迅速な作成とローカライズを支援することに重点を置いている。音声クローニング、テキスト読み上げ、自動字幕生成などの機能により、ユーザーは多言語の動画・音声コンテンツを簡単に作成できる。このプラットフォームは70以上の言語をサポートし、コンテンツ制作者のために1,000以上のリアルな音声を提供しています...
2.5 Kをとおして0表彰される
0ブックマークに登録
AIVocal：ポッドキャスト作成と音声処理のための無料AIツール
AIVocalは無料のAI音声処理プラットフォームで、Text-to-Speech (TTS)、Speech-to-Text (STT)、Human Voice Separation、Podcast Generationを提供する。ユーザーは登録なしで使用でき、24の言語と900以上の自然なトーンをサポートし、ポッドキャスト、オーディオブック、ビデオダビングなどの作成に適しています。このプラットフォームのインターフェースは直感的で...
3.3 Kをとおして0表彰される
0ブックマークに登録
Dia：超リアルな多人数対話生成のための音声合成モデル
Diaは、Nari Labs社によって開発されたオープンソースのテキスト音声合成（TTS）モデルで、超リアルなダイアログ音声の生成に特化しています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、笑いなどの非言語的な表現まで生成します。Diaの中核をなすのは、16億個のパラメータモデルです。.
3.5 Kをとおして0表彰される
0ブックマークに登録
MiniMax Audio (Conch Speech): 自然な音声を生成するAIツール
MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、最大99%の音声合成類似度、スタジオ級の音質、30以上の言語と幅広い口語をサポートしています。
8.7 Kをとおして1表彰される
0ブックマークに登録
Text2Voice：シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース
Text2Voiceは、シリコンベースのモビリティAPIをベースにテキスト読み上げ機能を提供するオープンソースツールで、すっきりとしたグラフィカル・ユーザー・インターフェース（GUI）が最大の特徴だ。開発者のSheldon Lee氏によってGitHub上で作成され、ユーザーが簡単にテキストを音声に変換できるインターフェースとなっている。このプロジェクトではPy...
3.6 Kをとおして0表彰される
0ブックマークに登録
複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト
Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換することができ、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpenAI TTS、AWS Polly、MiniM...を統合している。
3.5 Kをとおして0表彰される
0ブックマークに登録
Mureka：崑崙のAI生成オリジナル音楽ツール
2025年3月26日、ムレカは世界初の音楽推論マクロモデル「ムレカO1」とベースモデル「ムレカV6」を発表した。
5.9 Kをとおして0表彰される
0ブックマークに登録
csm-mlx: Appleデバイス用csm音声生成モデル
csm-mlxは、Appleが開発したMLXフレームワークをベースに、CSM（Conversation Speech Model）音声対話モデルをApple Silicon専用に最適化したものです。このプロジェクトにより、ユーザーはAppleデバイス上で効率的な音声生成を簡単な方法で実行することができます。
3.3 Kをとおして0表彰される
0ブックマークに登録
Autiobooks: epub電子書籍をm4bオーディオブックに変換する
Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。Kokoroが提供する高品質の音声合成技術を使用し、自然で滑らかな音声を生成します。このツールはDavid Nesbittによって開発され、MIT ...
3.2 Kをとおして0表彰される
0ブックマークに登録
PlayHT：超リアルな音声を生成するAIツール
PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、テキストを自然でリアルな音声に素早く変換することができます。600以上のAI音声を提供し、60以上の言語と多様なアクセントをサポートし、ポッドキャスト制作、教育コンテンツ、マーケティング、プロモーションなど様々なシナリオに適しています。ユーザーはテキストを入力し、適切な音声スタイルを選択するだけです。.
4.0 Kをとおして0表彰される
0ブックマークに登録
Spark-TTS：自然な音声を生成する音声合成ツール
Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成（TTS）ツールです。高度なディープラーニング技術に基づいており、複数の言語と音声スタイルをサポートしています...
4.3 Kをとおして0表彰される
0ブックマークに登録
Azure TTS Importer：音声合成サービスを読み上げソフトウェアに統合する
TTS Importerは、Azure TTS（Text-to-Speech）音声合成サービスを様々な読み上げソフトに簡単にインポートするために設計されたオープンソースプロジェクトです。このツールは、Read (legado)、Love Reader、Source Readerなど、人気のある読み上げソフトをサポートしています。TTS Importe...
3.5 Kをとおして0表彰される
0ブックマークに登録
ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス
ココロWebGPUは、WebMLコミュニティがHugging Faceプラットフォーム上で提供しているココロ音声合成（TTS）モデルのWebGPUバージョンです。このプロジェクトでは、WebGPU技術を利用して、ユーザーがブラウザ上でローカルに効率的な音声合成を実行できるようにしています。
4.3 Kをとおして0表彰される
0ブックマークに登録
ココロ-ONNX：多言語・多音声をサポートする効率的な音声合成ツール
ココロ-ONNXは、ONNXランタイムをベースにしたオープンソースの音声合成（TTS）ツールです。Kokoro-ONNXは、英語を含む複数の言語をサポートし、フランス語、日本語、韓国語、中国語をサポートする予定です。
5.7 Kをとおして0表彰される
0ブックマークに登録
OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。
OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成（TTS）APIを提供するオープンソースプロジェクトです。このプロジェクトは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質の音声出力を生成できるようにします。
5.5 Kをとおして0表彰される
0ブックマークに登録

AIオーディオ

クイック照会ステーションAIツール