Criação de um sistema inteligente de classificação de vídeo baseado no Tarsier
As organizações de mídia geralmente enfrentam o desafio de organizar suas filmagens de vídeo, o que pode ser feito com a combinação do Tarsier:
- Sistema de etiquetagem em vários níveisDefinição de critérios de classificação (por exemplo, rotulagem de três níveis de cenas, personagens, ações) por meio do parâmetro -instruction
- agrupamento de similaridadeCriação de um sistema de recuperação com a biblioteca FAISS usando vetores de características extraídos pelo CLIP-ViT
- Fluxos de trabalho automatizadosEscreva scripts Python para automatizar o processamento de novos vídeos recebidos, gerando metadados no formato CSV
- Filtragem de massaBloqueio automático de material de baixa qualidade em conjunto com as pontuações de avaliação do AutoDQ (limite de 0,65 recomendado).
Após a aplicação de uma estação de TV, o tempo de recuperação de material foi reduzido de uma média de 5 minutos para 30 segundos, e a precisão do reconhecimento de material duplicado atingiu 92%.
Essa resposta foi extraída do artigoTarsier: um modelo de compreensão de vídeo de código aberto para gerar descrições de vídeo de alta qualidadeO































