Implementação de cenários de âncoras virtuais
O aplicativo de âncora virtual pode ser realizado em fases com base na funcionalidade de exibição existente:
- estágio de preparação do material::
- Tire fotos de imagem padrão da âncora (metade do corpo, fundo de cor sólida)
- Pré-gravar/gerar áudio de transmissão (texto para fala necessário com outras ferramentas de IA)
- Caminhos para a realização da tecnologia::
- Atualmente: geração em lote de videoclipes de palavras faladas por meio de scripts, pós-edição e composição
- Após o futuro código aberto: pode acessar o software de transmissão ao vivo, com entrada de voz em tempo real (requer processamento com atraso de cerca de 500 ms)
- Eficácia Otimização Foco::
- Definição de acionadores de gestos apropriados (por exemplo, gestos digitais correspondem a transmissões de dados importantes)
- Uso de modelos de treinamento em áudio do tipo noticiário (o tipo mais maduro nas apresentações atuais)
Observação: Os futuros protocolos de código aberto precisam ser confirmados antes da comercialização, e o efeito de âncora virtual no vídeo de demonstração atual pode ser usado como referência de prova de conceito.
Essa resposta foi extraída do artigoChatAnyone: uma ferramenta para gerar vídeos de retratos humanos digitais de meio corpo a partir de fotografiasO































