背景
音楽生成における共通の悩みの一つは、単一の、あるいは制御不可能なスタイルでコンテンツを生成することである。
コアソリューション
- 多次元プロパティの説明を含む入力テキストサウンド(ポップ/ロックなど)、精神状態(例:陽気/憂鬱)、楽器説明(例:ピアノ+エレキギター)、その他のレーベル
- 構造化入力テンプレートスタイル: [値], ムード: [値], インストゥルメント: [値]」という標準的なフォーマットが推奨される。
- リファレンス・オーディオ・アシストターゲット・スタイルの理解を深めるために、類似したスタイルの3秒間のオーディオ・クリップをアップロードする。
作戦提案
入力テキストの例:
"スタイル:フォーク・ロック、ムード:ノスタルジックで温かい、楽器編成:アコースティック・ギターのリード+ハーモニカの間奏"
リファレンス・オーディオとの相性が良い。
この答えは記事から得たものである。SongGen: 曲の自動生成のための単段自己回帰変換器について































