框架兼容性挑战
主流框架需不同标注格式:YOLO(Darknet/TensorRT)、VOCXML(MMDetection)、COCO(Detectron2),传统转换存在格式错误风险。
格式转换方案
MakeSense提供一站式导出方案:
- YOLO格式转换::
- 生成每张图片对应的.txt文件
- 自动归一化坐标到[0,1]范围
- 包含类别索引和bbox中心点坐标
- VOC XML导出::
- 符合PASCAL VOC标准结构
- 包含<object>层级详细信息
- 适配OpenCV的cv2.VideoWriter等工具
- 自定义映射::
- 在classes.txt中预定义类别顺序
- 导出时勾选”Remap classes”选项
- 自动匹配不同框架的类别ID
habilidade prática
- 检测任务首选YOLO格式(文件体积最小)
- 分割任务建议同时导出VOC和COCO格式
- usabilidade
xmltodict
库快速解析VOC文件
Essa resposta foi extraída do artigoMakeSense: uma ferramenta de anotação de imagens de uso gratuito para aumentar a eficiência do projeto de visão computacionalO