Composição e valor dos resultados analisados
O arquivo analysis.json gerado pela ferramenta usa uma estrutura de dados padronizada e contém três seções principais:
1. seção de metadados
- Informações básicas do vídeo: resolução, duração, tamanho
- Instantâneo da configuração de processamento: parâmetros do modelo/taxa de amostragem usada
- Analisar registros de data e hora: horários de início e término da tarefa
2. análise visual dos dados
- Sequência de quadros-chave: cada quadro contém:
- Carimbos de data e hora precisos (milissegundos)
- Texto que descreve a imagem (por exemplo, "5 pessoas sentadas em uma sala de conferência").
- Lista de objetos significativos e níveis de confiança - Detecção de mudança de cena: marcação do ponto em que a câmera muda
3. dados de transcrição de voz
- Texto segmentado: conteúdo de diálogo segmentado semanticamente
- Marcação de alto-falante: reconhecimento de impressão vocal com suporte opcional
- Alinhamento de tempo: os horários de início e término correspondentes a cada parágrafo do texto
Exemplos de aplicativos de dados::
- Como habilitar a pesquisa de conteúdo de vídeo com carimbos de data/hora
- Combinação de descrições de tela e texto transcrito para gerar legendas
- Frequência de ocorrência de produtos por meio da detecção de objetos
- Treinamento de modelos de IA personalizados com dados JSON
O formato de saída também suporta a conversão para legendas SRT ou tabelas estatísticas CSV.
Essa resposta foi extraída do artigoVideo Analyzer: analisa o conteúdo do vídeo e gera descrições detalhadasO































