
Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービス
Kitten-TTS-Server 是一个开源项目,它为轻量级的 KittenTTS 模型提供了一个功能增强的服务器。用户可以通过这个项目自己搭建一个文本转语音(TTS)服务。这个项目的核心优势在于它在原始模型的基础上,增加了一个直观的网页...

FineShare:AIの音声と音楽を生成するオーサリングツール
FineShareはAI音声・映像技術に特化したプラットフォームで、ユーザーが高品質な音声・音楽・映像コンテンツを作成するための様々なツールを提供している。同サイトの主力製品には、音声生成・変換、AI音楽作成、バーチャルカメラ用のFineVoice、Singify、FineCamがある。

サイバースマート:テキストを音声に変換し、デジタルヒューマンビデオに変換する
讯飞智作是科大讯飞公司开发的一个提供人工智能内容创作服务的平台。它的核心功能是将用户输入的文字转换成语音,这个过程通常被称为“AI配音”或“语音合成”。用户可以从多种预设的虚拟声音(即“主播”)中进行选择,这些声音具有不同的风格,比如新闻播...

パロットTTS:ウェブテキストを自然な音声に変換する読み上げツール
Parrot TTS 是一款 Chrome 浏览器扩展程序,专为将网页文本转化为自然语音设计。它使用先进的 AI 技术,提供接近人类的声音体验,解决传统文本转语音工具听起来机械的问题。用户可以一键将文章、新闻或研究资料转为音频,适合多任务处...

Wavel AI:多言語映像の吹替・字幕を高速生成するツール
Wavel AI 是一个基于人工智能的平台,专注于帮助用户快速创建和本地化视频内容。它通过语音克隆、文本转语音和自动字幕生成等功能,让用户轻松制作多语言视频和音频内容。平台支持超过 70 种语言,提供 1000 多种逼真语音,适合内容创作者...

AIVocal:ポッドキャスト作成と音声処理のための無料AIツール
AIVocal 是一个免费的 AI 音频处理平台,提供文本转语音(TTS)、语音转文本(STT)、人声分离和播客生成等功能。用户无需注册即可使用,支持 24 种语言和 900 多种自然音色,适合制作播客、有声书、视频配音等。平台界面直观,操...

Dia:超リアルな多人数対話生成のための音声合成モデル
Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表达,如笑声。Dia 的核心是 16 亿参数的模型,...

MiniMax Audio (Conch Speech): 自然な音声を生成するAIツール
MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、最大99%の音声合成類似度、スタジオ級の音質、30以上の言語と幅広い口語をサポートしています。

Text2Voice:シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース
Text2Voiceは、シリコンベースのモビリティAPIをベースにテキスト読み上げ機能を提供するオープンソースツールで、すっきりとしたグラフィカル・ユーザー・インターフェース(GUI)が最大の特徴だ。開発者のSheldon Lee氏によってGitHub上で作成され、ユーザーが簡単にテキストを音声に変換できるインターフェースとなっている。このプロジェクトではPy...

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト
Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換することができ、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpenAI TTS、AWS Polly、MiniM...を統合している。

Mureka:崑崙のAI生成オリジナル音楽ツール
2025年3月26日、ムレカは世界初の音楽推論マクロモデル「ムレカO1」とベースモデル「ムレカV6」を発表した。

csm-mlx: Appleデバイス用csm音声生成モデル
csm-mlxは、Appleが開発したMLXフレームワークをベースに、CSM(Conversation Speech Model)音声対話モデルをApple Silicon専用に最適化したものです。このプロジェクトにより、ユーザーはAppleデバイス上で効率的な音声生成を簡単な方法で実行することができます。

Autiobooks: epub電子書籍をm4bオーディオブックに変換する
Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。Kokoroが提供する高品質の音声合成技術を使用し、自然で滑らかな音声を生成します。このツールはDavid Nesbittによって開発され、MIT ...

PlayHT:超リアルな音声を生成するAIツール
PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用户只需输入文本,选择合适的语音风格,...

Spark-TTS:自然な音声を生成する音声合成ツール
Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成(TTS)ツールです。高度なディープラーニング技術に基づいており、複数の言語と音声スタイルをサポートしています...

Azure TTS Importer:音声合成サービスを読み上げソフトウェアに統合する
TTS Importerは、Azure TTS(Text-to-Speech)音声合成サービスを様々な読み上げソフトに簡単にインポートするために設計されたオープンソースプロジェクトです。このツールは、Read (legado)、Love Reader、Source Readerなど、人気のある読み上げソフトをサポートしています。TTS Importe...

ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス
ココロWebGPUは、WebMLコミュニティがHugging Faceプラットフォーム上で提供しているココロ音声合成(TTS)モデルのWebGPUバージョンです。このプロジェクトでは、WebGPU技術を利用して、ユーザーがブラウザ上でローカルに効率的な音声合成を実行できるようにしています。

ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツール
ココロ-ONNXは、ONNXランタイムをベースにしたオープンソースの音声合成(TTS)ツールです。Kokoro-ONNXは、英語を含む複数の言語をサポートし、フランス語、日本語、韓国語、中国語をサポートする予定です。

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。
OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質の音声出力を生成できるようにします。
トップに戻る