Wavel AIのボイス・クローニング機能は、ディープ・ニューラル・ネットワーク・モデルを使用し、1~2分のサンプル音声を分析することでボーカルの特徴ライブラリを構築し、ブランド専用のボイスをデジタル保存して再利用することを可能にします。この技術的なブレークスルーにより、企業のCEOやブランドのスポークスパーソンといった重要人物のボイスラインを標準化し、あらゆる種類の販促物に適用することが可能になり、クロスプラットフォームやクロスリージョナル・コミュニケーションの一貫性を維持することができる。技術的な実現レベルでは、基本周波数、共鳴ピーク、リズムなど128次元の音響特徴を抽出し、敵対的生成ネットワーク(GAN)を通じて4.5/5の自然度を持つ合成音声を再構成する。
ある国際的なホテルチェーングループは、この機能を使って創業者の声をクローンし、世界30ヶ国語のウェルカムビデオに適用することで、ブランドの温かみを保ち、大規模な制作を実現している。注意すべき点は、使用する前に声の主から明確な許可を得る必要があること、そしてプラットフォームには著作権侵害のリスクを防ぐためのデジタル透かし技術が組み込まれていることだ。
この答えは記事から得たものである。Wavel AI:多言語映像の吹替・字幕を高速生成するツールについて