Skip to content

YOLO 常用数据集

数据集按使用场景分类,包括:

🌐 1.通用目标检测

数据集类别图片数特点
COCO80类118k最主流基准,Ultralytics 内置
Pascal VOC20类11k经典,入门首选
ImageNet Det200类456k大规模,训练慢
Open Images v7600类1.9M谷歌出品,超大规模

🚗 2.交通 / 自动驾驶

数据集说明
BDD100K10类,10万张,含夜间/雨天
KITTI自动驾驶经典,含3D标注
VisDrone无人机视角,小目标多
DOTA遥感图像,旋转框检测

👤 3.人体 / 人脸

数据集说明
WiderFace人脸检测标准基准
CrowdHuman密集人群,遮挡场景
MOT17/20多目标跟踪

🏭 4.工业 / 垂直场景

数据集说明
SKU-110K货架商品检测,密集小目标
DIOR遥感目标检测,20类
PASCAL-Context场景理解

📥 怎么获取

1. Ultralytics 内置(一行代码自动下载)

ultralytics 数据集介绍

python
model.train(data="coco.yaml")      # COCO
model.train(data="VOC.yaml")       # Pascal VOC
model.train(data="VisDrone.yaml")  # VisDrone
model.train(data="SKU-110K.yaml")  # SKU

2. Roboflow(最方便,支持直接导出 YOLO 格式)

访问 https://universe.roboflow.com 搜索任意场景,选 YOLOv11 格式下载。

3. HuggingFace Datasets(HuggingFace 是一家公司,提供了大量机器学习相关的数据集、模型、工具)

python
from datasets import load_dataset
ds = load_dataset("detection-datasets/coco")

💡 选数据集的原则

  • 跑通环境coco128(128张,几分钟)
  • 学习训练流程VOC(小而完整)
  • 做论文基准COCO(业界标准)
  • 垂直业务 → Roboflow 找现成的,或自己标注用 Label Studio / Roboflow Annotate

京ICP备2024093538号-1