CyberSmart社のボイスクローニングサービスは、特許取得済みの声紋モデリング技術を使用している:
- サンプリング要件中国語のすべての音素の組み合わせをカバーする標準的な発音音声(約200~300単語)を30分間録音する必要があります。
- モデリングプロセス比較学習アルゴリズムによる声紋特徴の抽出と、200次元以上の特徴を含むパーソナライズされた音響モデルの構築
- アプリケーション効果クローン音声類似度テストスコア85%以上、感情イントネーションの知的模倣をサポート。
この技術は、一貫したブランド・ボイスを維持する必要のある企業クライアントに特に適しており、実写吹き替えのコストを60%削減できることが示されている。すでに200以上のメディアが標準化された音声コンテンツを制作するためにこのサービスを利用している。
この答えは記事から得たものである。サイバースマート:テキストを音声に変換し、デジタルヒューマンビデオに変換するについて