Desafios de compatibilidade da estrutura
As principais estruturas exigem diferentes formatos de anotação: YOLO (Darknet/TensorRT), VOCXML (MMDetection), COCO (Detectron2), com o risco de erros de formatação nas conversões tradicionais.
Programa de conversão de formatos
A MakeSense oferece uma solução de exportação em um só lugar:
- Conversão do formato YOLO::
- Gerar um arquivo .txt correspondente a cada imagem
- Normalização automática de coordenadas para o intervalo [0,1]
- Inclui o índice da categoria e as coordenadas do ponto central da caixa de seleção
- Exportação de VOC XML::
- Construção em conformidade com o PASCAL VOC
- Contém detalhes em nível de <objeto
- Adaptação de ferramentas OpenCV, como cv2.VideoWriter
- Mapeamento personalizado::
- Ordem predefinida de categorias em classes.txt
- Marque a opção "Remap classes" ao exportar.
- Correspondência automática de IDs de categoria para diferentes quadros
habilidade prática
- Formato YOLO preferido para tarefas de detecção (menor tamanho de arquivo)
- A divisão de tarefas sugere a exportação dos formatos VOC e COCO
- usabilidade
xmltodictBiblioteca para análise rápida de arquivos VOC
Essa resposta foi extraída do artigoMakeSense: uma ferramenta de anotação de imagens de uso gratuito para aumentar a eficiência do projeto de visão computacionalO































