ボイスクローン機能を使うには、主に3つのステップがあります:
- 音の準備静かな環境で約1分間のクリアな音声を録音する(プロ用マイクを推奨)。
- トレーニングのアップロード音声選択メニューの "Clone Your Voice "をクリックし、WAV/MP3ファイルをアップロードすると、システムがディープニューラルネットワークを通じて声紋の特徴を抽出する(処理時間は約15〜30分)。
- 合成アプリケーショントレーニングが完了すると、クローン化されたサウンドがユーザー専用のサウンドライブラリに表示され、任意のビデオプロジェクトで使用するために選択することができます。
重要な注意事項
- 商業利用は、録画されたコンテンツの著作権が完全に所有されていることを保証します。
- 録音の質はクローニング効果に直接影響するので、サンプリングレートは44.1kHz以下にしないことを推奨する。
- システムは、中国語や英語などの主要言語のクローンをサポートしていますが、方言や特殊な発音は精度に影響する可能性があります。
- ユーザーはアカウント設定でいつでも音声モデルを削除できる
この答えは記事から得たものである。VisionStory:画像とテキストからAI説明ビデオを生成するについて





























