数据导出
如何导出 COCO / VOC / YOLO 格式数据集
这篇教程帮助你先想清楚下游到底需要哪种格式,再在导出后做最必要的结果检查。
6 分钟COCOVOCYOLO导出
先由下游需求决定格式
格式选择不该靠偏好,而该看训练脚本、客户或合作方到底要接什么。
YOLO 常见于检测训练。
VOC 常见于 XML 链路。
COCO 常见于更复杂的数据结构。
YOLO 导出看目录和类别顺序
YOLO 最常见的问题是训练配置和导出类别顺序不一致。
检查 images 与 labels。
确认类别顺序。
随机抽查 txt 标签。
VOC 和 COCO 更看结构完整性
VOC 要看 XML 字段完整性,COCO 要看 categories、images 和 annotations 的关联关系。
先让目标系统读一轮样本。
不要只看文件有没有导出成功。
把结构检查放在交付前完成。
FAQ
哪种格式最好? 没有统一答案,关键看下游系统需要什么。
导出后最先查什么? 先查结构,再查随机样本。