O Open-Sora oferece uma configuração muito flexível dos parâmetros de vídeo:
- Faixa de resoluçãoSuporta várias saídas de resolução de 144p a 768p, sendo 256p e 768p padrão na versão 2.0.
- Controle de duraçãoVídeo: Clipes de vídeo de 2 a 16 segundos podem ser gerados por meio do
--num_frames
Parâmetros para controlar com precisão o número de quadros (suporta até 129 quadros) - proporção de aspectoSuporte para uma ampla gama de índices comumente usados, incluindo:
- Paisagem 16:9 (para vídeo tradicional)
- Vertical 9:16 (adaptado para dispositivos móveis)
- Square 1:1 (comumente usado em mídias sociais)
- Outras proporções personalizadas
Na prática, essas configurações podem ser combinadas de forma flexível com parâmetros de linha de comando. Por exemplo, para gerar vídeo vertical de 768p:
torchrun ... --aspect_ratio 9:16 --resolution 768x1365
É importante observar que a geração de vídeo com resolução mais alta requer mais recursos de GPU, e recomenda-se 8 GPUs para o processamento paralelo de vídeo de 768p.
Essa resposta foi extraída do artigoOpen Sora: uma ferramenta de geração de vídeo de código aberto para otimizar a consistência facialO