
CosyVoice 是一个开源的多语言语音生成模型,专注于高质量的文本转语音(TTS)技术。它支持多种语言的语音合成,提供零样本语音生成、跨语言语音克隆和细粒度情感控制等功能。Cos– yVoice 2.0 相比上一版本,显著降低了30%到...

MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、最大99%の音声合成類似度、スタジオ級の音質、30以上の言語と幅広い口語をサポートしています。

MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具,专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数,轻量高效,支持中英文混合语音生成和语音克隆。项目托管在 GitHub 上,提供代码和预训练模型供免费下载...

Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延迟低至 400 毫秒左右,适合在线会议、游戏或直播...

CSM Voice Cloningは、Isaiah Bjorkによって開発され、GitHubでホストされているオープンソースプロジェクトです。Sesame CSM-1Bモデルに基づいており、ユーザーは音声サンプルを提供するだけで、自分の声のクローンを作成し、自分の特徴を持った声を生成することができます。このツールはこの...

PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、テキストを自然でリアルな音声に素早く変換することができます。600以上のAI音声を提供し、60以上の言語と多様なアクセントをサポートし、ポッドキャスト制作、教育コンテンツ、マーケティング、プロモーションなど様々なシナリオに適しています。ユーザーはテキストを入力し、適切な音声スタイルを選択するだけです。.

Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成(TTS)ツールです。高度なディープラーニング技術に基づいており、複数の言語と音声スタイルをサポートしています...

Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川话)、可调节的语速和韵律风格(如说唱)。Step-...

Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型,能够生成高质量的语音输出。该工具支持多种语言,包括英语、日语、中文、法语和德语,并提供细致的音...

Weightsは、簡単な操作でボイスカバー、音声合成、画像、音楽、動画を作成できる、AIを活用したクリエイティビティのためのソーシャルプラットフォームです。このプラットフォームは、ユーザーがすぐに始められ、コミュニティと作品を共有できるよう、豊富なツールとテンプレートを提供しています。.

AnyVoiceは最先端のAI音声生成プラットフォームで、超リアルな音声生成と音声クローンサービスを提供します。このプラットフォームにより、ユーザーはテキストを自然な音声に変換し、数百のプリセット音声から選択することができます。もし適切な音声が見つからない場合は、たった3秒の録音でどんな音声でも無料でクローンすることができます。.

Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多种语言,还能实现情感表达和个性化语音克隆。Llas...

フィッシュ・スピーチ派生プロジェクト フィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAI音声クローニング・システムです。完全なエンドツーエンドの音声クローニング処理システムとして、その最大の特徴は、革新的なセマンティックタグレスアーキテクチャ設計を採用しており、Whisperのような従来のセマンティックコンパイラに依存する必要がないことです。.

ViiTor AIは、高品質な動画翻訳、音声クローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。ViiTor AIのビデオ翻訳機能は、自動的に字幕を生成し、インテリジェントにチューニングします。.

Voicemod是一款领先的实时变声器和声音特效软件,适用于Windows和macOS系统。无论你是在游戏中进行角色扮演、与朋友聊天,还是进行直播,Voicemod都能为你提供丰富的声音变化效果。通过AI技术,Voicemod能够实时改变你...

MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学により共同開発された完全非自律回帰型音声合成(TTS)モデルです。このモデルは明示的な音声合成情報を必要とせず、2段階の生成アプローチを採用しています。

Funmaru Thousand Voicesは、リアルで自然な音声生成ソリューションを提供する多言語AI音声合成プラットフォームです。ユーザーはテキストコンテンツを簡単にプロ級の音声に変換することができ、個人のニーズに合わせてゼロサンプルから専用のAIボイス(ボイスクローン)の作成をサポートします。また、このプラットフォームはビデオ翻訳機能も提供し、多言語コンテンツの迅速な変換を実現します。 特徴...

CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音合成。CosyVoice不仅支持多语言语音生成,还...

海螺AI视频生成器是由MiniMax公司开发的一款先进的AI视频生成工具。用户只需提供简单的文本描述或上传图片,海螺AI即可快速生成高质量的视频内容。该工具广泛应用于创作者、市场营销人员和故事讲述者,帮助他们将创意转化为生动的视频。海螺AI...
トップに戻る

