海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

CosyVoiceをゼロサンプル音声生成に使うには?

2025-08-23 727
直接リンクモバイルビュー
qrcode

ゼロサンプル音声生成はCosyVoiceの重要な機能の一つであり、その手順は以下の通りである:

  1. オーディオサンプルの準備16kHzのプロンプト音声ファイル(例:zero_shot_prompt.wav)が必要です。
  2. ジェネレーター関数の呼び出しreference_zero_shot メソッドを使用し、適切なパラメータを渡す:
    from cosyvoice import CosyVoice2
    import torchaudio
    cosyvoice = CosyVoice2('pretrained_models/CosyVoice2-0.5B')
    prompt_speech_16k = torchaudio.load('./asset/zero_shot_prompt.wav')[0]
    cosyvoice.inference_zero_shot('目标文本','提示文本',prompt_speech_16k)
  3. 出力の保存::
    torchaudio.save('output.wav', j['tts_speech'], cosyvoice.sample_rate)

警告だ:
- 公式サイトの効果を完全に再現したい場合は、text_frontend=Falseパラメータを設定する必要がある。
- 最良の結果を得るためには、CosyVoice 2-0.5Bモデルをお勧めします!
- この方法は、事前訓練なしで、ターゲット音色の短いサンプルに基づいて音声を生成する。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

新着情報

トップに戻る

ja日本語