01
先确认模型到底要识别什么
YOLO 数据集最容易出错的地方是类目边界不清。先写清楚哪些对象必须标、哪些对象应该忽略。
为相似类目写一条边界规则。
决定遮挡和模糊目标怎么处理。
让第一批样本就暴露边界问题。
用小批量样本校准标注规则
先用代表性样本跑一轮,再扩大规模,返工会少很多。
02
上传覆盖典型场景与难例的首批图片。
03
先让少量成员完成一轮标注与抽检。
导出 YOLO 前先检查目录结构
导出成功不代表训练一定顺利。最先要看 images、labels 和类别顺序是否一致。
随机打开几条标签文件。
确认类别顺序与训练配置一致。
抽查训练集和验证集是否都正常。
dataset/
images/
train/
val/
labels/
train/
val/
data.yamlFAQ
第一次需要多少图片? 先用覆盖主要场景的小批量样本校准规则,再决定是否扩量。
什么时候开始复核最好? 从第一批样本开始,而不是等全部标完。