Skip to content

数据清洗

作用:把脏数据清理干净,让模型训练更稳定、精度更高。

目标检测里最关键的清洗就这 4 件事:

1. 去除损坏 / 无法读取的图片

打不开、全黑、全白、尺寸异常的图片直接删。

2. 标签校验(最重要)

  • 框坐标超出图片范围
  • 框宽 / 框高 = 0(无效框)
  • 类别 ID 错误、漏标、错标
  • 重复标注同一个目标

3. 过滤小目标 / 模糊目标

太小的框(<16×16)模型学不到,可删除或合并。

4. 类别均衡

  • 避免某类数量是另一类的几十倍,导致模型偏向多数类。
  • 少类别可以适当多增强,多类别可以少增强。

一句话:数据清洗 = 去脏 + 纠错 + 去无效 + 平衡类别。

京ICP备2024093538号-1