Appearance
YOLO 常用数据集
数据集按使用场景分类,包括:
🌐 1.通用目标检测
| 数据集 | 类别 | 图片数 | 特点 |
|---|---|---|---|
| COCO | 80类 | 118k | 最主流基准,Ultralytics 内置 |
| Pascal VOC | 20类 | 11k | 经典,入门首选 |
| ImageNet Det | 200类 | 456k | 大规模,训练慢 |
| Open Images v7 | 600类 | 1.9M | 谷歌出品,超大规模 |
🚗 2.交通 / 自动驾驶
| 数据集 | 说明 |
|---|---|
| BDD100K | 10类,10万张,含夜间/雨天 |
| KITTI | 自动驾驶经典,含3D标注 |
| VisDrone | 无人机视角,小目标多 |
| DOTA | 遥感图像,旋转框检测 |
👤 3.人体 / 人脸
| 数据集 | 说明 |
|---|---|
| WiderFace | 人脸检测标准基准 |
| CrowdHuman | 密集人群,遮挡场景 |
| MOT17/20 | 多目标跟踪 |
🏭 4.工业 / 垂直场景
| 数据集 | 说明 |
|---|---|
| SKU-110K | 货架商品检测,密集小目标 |
| DIOR | 遥感目标检测,20类 |
| PASCAL-Context | 场景理解 |
📥 怎么获取
1. Ultralytics 内置(一行代码自动下载)
python
model.train(data="coco.yaml") # COCO
model.train(data="VOC.yaml") # Pascal VOC
model.train(data="VisDrone.yaml") # VisDrone
model.train(data="SKU-110K.yaml") # SKU2. Roboflow(最方便,支持直接导出 YOLO 格式)
访问 https://universe.roboflow.com 搜索任意场景,选 YOLOv11 格式下载。
3. HuggingFace Datasets(HuggingFace 是一家公司,提供了大量机器学习相关的数据集、模型、工具)
python
from datasets import load_dataset
ds = load_dataset("detection-datasets/coco")💡 选数据集的原则
- 跑通环境 →
coco128(128张,几分钟) - 学习训练流程 →
VOC(小而完整) - 做论文基准 →
COCO(业界标准) - 垂直业务 → Roboflow 找现成的,或自己标注用 Label Studio / Roboflow Annotate