AIVocalは、プロ仕様のソースセパレーションを実現するために改良されたDemucsアーキテクチャを採用し、3層の残差U-Net構造により、ボーカル、ドラムキット、ベース、その他の楽器の4種類のトラックを正確に識別・抽出します。MUSDB18ベンチマークテストでは、ボーカルセパレーションのSDR値は94.7%に達し、S/N比は12.3dB改善され、従来のNMF手法のセパレーション効果を上回りました。
このテクノロジーは、音楽制作者に3つの画期的な機能を提供する。それは、あらゆるコマーシャルソングをミキシングと学習のためにスプリットトラック素材に分離すること、カバーレコーディングのために純粋なボーカルを抽出すること、そしてプロフェッショナルなバッキングトラックを作成するためにオリジナルのボーカルを除去することである。AIVocalは、10,000ドルのRX10ソフトウェアを必要とする従来のアプローチに比べ、3つのユニークな利点を提供します:
- クラウド処理により、高性能なローカル・ハードウェアが不要になる
- アルバム全体の一括アップロード処理に対応
- 原音に忠実な96kbps OPUSエンコード出力
実際、インディペンデント・ミュージシャンはこのプラットフォームを使ってサンプリング効率を4倍に高め、K-songアプリケーションはAPIを統合して伴奏生成コストを90%削減している。 分離されたトラックはDAWソフトウェアに直接インポートしてさらに編集することができ、音楽制作の完全なクローズドループを形成する。
この答えは記事から得たものである。AIVocal:ポッドキャスト作成と音声処理のための無料AIツールについて





























