Práticas recomendadas para o processamento estruturado de letras de música:
- Rotulagem obrigatória de segmentosCada verso deve começar com
[verse]
e[chorus]
etc., com quebras de linha entre os parágrafos - Modelos padrão de referência:: Comparação
conf/vocab.yaml
no arquivo, certifique-se de usar a opção[intro-short]
e outros rótulos legais - Princípios de controle de comprimentoRecomenda-se de 4 a 8 linhas de texto para cada parágrafo para evitar um texto muito curto, o que dificulta a conclusão do modelo.
- Verificação da consistência emocionalTags de sentimento na descrição (por exemplo
sad
) precisam corresponder ao conteúdo das letras, os conflitos podem levar a uma geração confusa - Ferramentas de correção gramaticalRecomenda-se que as letras em chinês sejam pré-processadas com uma ferramenta de detecção de rima, enquanto as letras em inglês devem prestar atenção à unidade de tempo verbal.
Essa resposta foi extraída do artigoSongGeneration: um modelo de IA de código aberto para gerar músicas e letras de alta qualidadeO