框架兼容性挑战
主流框架需不同标注格式:YOLO(Darknet/TensorRT)、VOCXML(MMDetection)、COCO(Detectron2),传统转换存在格式错误风险。
格式转换方案
MakeSense提供一站式导出方案:
- YOLO格式转换:
- 生成每张图片对应的.txt文件
- 自动归一化坐标到[0,1]范围
- 包含类别索引和bbox中心点坐标
- VOC XML导出:
- 符合PASCAL VOC标准结构
- 包含<object>层级详细信息
- 适配OpenCV的cv2.VideoWriter等工具
- 自定义映射:
- 在classes.txt中预定义类别顺序
- 导出时勾选”Remap classes”选项
- 自动匹配不同框架的类别ID
实用技巧
- 检测任务首选YOLO格式(文件体积最小)
- 分割任务建议同时导出VOC和COCO格式
- 可用
xmltodict
库快速解析VOC文件
本答案来源于文章《MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率》