01
先確認模型到底要識別什麼
YOLO 資料集最容易出錯的地方是類別邊界不清。先寫清楚哪些物件必須標、哪些物件應該忽略。
為相似類別寫一條邊界規則。
決定遮擋和模糊目標怎麼處理。
讓第一批樣本就暴露邊界問題。
用小批量樣本校準標註規則
先用代表性樣本跑一輪,再擴大規模,返工會少很多。
02
上傳覆蓋典型場景與難例的首批圖片。
03
先讓少量成員完成一輪標註與抽檢。
匯出 YOLO 前先檢查目錄結構
匯出成功不代表訓練一定順利。最先要看 images、labels 和類別順序是否一致。
隨機打開幾條標籤檔案。
確認類別順序與訓練配置一致。
抽查訓練集和驗證集是否都正常。
dataset/
images/
train/
val/
labels/
train/
val/
data.yamlFAQ
第一次需要多少圖片? 先用覆蓋主要場景的小批量樣本校準規則,再決定是否擴量。
什麼時候開始覆核最好? 從第一批樣本開始,而不是等全部標完。