文章作者：激萌の小宅

促销：￥0

价格：￥0

配送方式：购买后立即生效（如购买异常，请联系站长）

付款之后一定要等待自动跳转结束，否则购买可能会失败

0 天

有效期
0

总销量
0

累计评价

详细说明

<h1 style="font-size: 32px; font-weight: bold; border-bottom: 2px solid rgb(204, 204, 204); padding: 0px 4px 0px 0px; text-align: left; margin: 0px 0px 10px;">Detectron2 利用现有数据集进行训练</h1>本章节的作用是为后续自定义数据集训练做准备。在验证自定义数据集之前，我们需要先用现成气球数据集进行训练测试，等测试成功之后，再将气球的数据集替换成自定义的数据集即可。参考博客：<a href="https://blog.csdn.net/WhiffeYF/article/details/114309389" target="_blank">https://blog.csdn.net/WhiffeYF/article/details/114309389</a>气球数据集下载地址：<a href="https://www.kaggle.com/datasets/rkuo2000/balloon-dataset" target="_blank">https://www.kaggle.com/datasets/rkuo2000/balloon-dataset</a> 1、准备数据集将下载好的气球数据集解压工程的datasets目录下，如下：<img src="/upload/image/6381431222714447426240045.jpg" title="QQ截图20230313135027.jpg" alt="QQ截图20230313135027.jpg"/><img src="/upload/image/6381425512032266197377248.jpg" title="QQ截图20230312215842.jpg" alt="QQ截图20230312215842.jpg"/>2、可视化数据集<span style="color: rgb(77, 77, 77); font-family: -apple-system, "SF UI Text", Arial, "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", sans-serif; font-variant-ligatures: no-common-ligatures; background-color: rgb(255, 255, 255);">为了保证数据集加载的正确性，我们从训练集中随机选择一个进行可视化的标注。<span style="color: rgb(77, 77, 77); font-family: -apple-system, "SF UI Text", Arial, "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", sans-serif; font-variant-ligatures: no-common-ligatures; background-color: rgb(255, 255, 255);">可视化图片会保存到./<span style="color: rgb(77, 77, 77); font-family: -apple-system, "SF UI Text", Arial, "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", sans-serif; font-variant-ligatures: no-common-ligatures; background-color: rgb(255, 255, 255);">demo下创建的img文件夹下。<span style="color: rgb(77, 77, 77); font-family: -apple-system, "SF UI Text", Arial, "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", sans-serif; font-variant-ligatures: no-common-ligatures; background-color: rgb(255, 255, 255);"><span style="color: rgb(77, 77, 77); font-family: -apple-system, "SF UI Text", Arial, "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", sans-serif; font-variant-ligatures: no-common-ligatures; background-color: rgb(255, 255, 255);"><img src="/upload/image/6381431265523804896089040.jpg" title="QQ截图20230313135735.jpg" alt="QQ截图20230313135735.jpg"/>balloon1.py代码如下：<pre class="brush:python;toolbar:false"># if your dataset is in COCO format, this cell can be replaced by the following three lines: # from detectron2.data.datasets import register_coco_instances # register_coco_instances("my_dataset_train", {}, "json_annotation_train.json", "path/to/image/dir") # register_coco_instances("my_dataset_val", {}, "json_annotation_val.json", "path/to/image/dir") from detectron2.structures import BoxMode import torch, torchvision # Some basic setup: # Setup detectron2 logger import detectron2 from detectron2.utils.logger import setup_logger setup_logger() # import some common libraries import numpy as np import os, json, cv2, random # import some common detectron2 utilities from detectron2 import model_zoo from detectron2.engine import DefaultPredictor from detectron2.config import get_cfg from detectron2.utils.visualizer import Visualizer from detectron2.data import MetadataCatalog, DatasetCatalog import time def get_balloon_dicts(img_dir):     json_file = os.path.join(img_dir, "via_region_data.json")     with open(json_file) as f:         imgs_anns = json.load(f)     dataset_dicts = []     for idx, v in enumerate(imgs_anns.values()):         record = {}         filename = os.path.join(img_dir, v["filename"])         height, width = cv2.imread(filename).shape[:2]         record["file_name"] = filename         record["image_id"] = idx         record["height"] = height         record["width"] = width         annos = v["regions"]         objs = []         for _, anno in annos.items():             assert not anno["region_attributes"]             anno = anno["shape_attributes"]             px = anno["all_points_x"]             py = anno["all_points_y"]             poly = [(x + 0.5, y + 0.5) for x, y in zip(px, py)]             poly = [p for x in poly for p in x]             obj = {                 "bbox": [np.min(px), np.min(py), np.max(px), np.max(py)],                 "bbox_mode": BoxMode.XYXY_ABS,                 "segmentation": [poly],                 "category_id": 0,             }             objs.append(obj)         record["annotations"] = objs         dataset_dicts.append(record)     return dataset_dicts for d in ["train", "val"]:     DatasetCatalog.register("balloon_" + d, lambda d=d: get_balloon_dicts("..\\datasets\\balloon\\" + d))     MetadataCatalog.get("balloon_" + d).set(thing_classes=["balloon"]) balloon_metadata = MetadataCatalog.get("balloon_train") dataset_dicts = get_balloon_dicts("..\\datasets\\balloon\\train") for d in random.sample(dataset_dicts, 3):     img = cv2.imread(d["file_name"])     visualizer = Visualizer(img[:, :, ::-1], metadata=balloon_metadata, scale=0.5)     out = visualizer.draw_dataset_dict(d)     cv2.imwrite('./img/' + str(round(time.time() * 1000)) + '.jpg', out.get_image()[:, :, ::-1])</pre>效果就是下面这个样子的：<img src="/upload/image/6381431275302371415749930.jpg" title="1678681242201.jpg" alt="1678681242201.jpg"/> 3、数据集模型训练训练代码 balloon2.py（删除了可视化输出代码）这里里采用的CPU进行训练。<pre class="brush:python;toolbar:false">from detectron2.structures import BoxMode from detectron2.utils.logger import setup_logger setup_logger() import numpy as np import os, json, cv2 from detectron2 import model_zoo from detectron2.config import get_cfg from detectron2.data import MetadataCatalog, DatasetCatalog def get_balloon_dicts(img_dir):     json_file = os.path.join(img_dir, "via_region_data.json")     with open(json_file) as f:         imgs_anns = json.load(f)     dataset_dicts = []     for idx, v in enumerate(imgs_anns.values()):         record = {}         filename = os.path.join(img_dir, v["filename"])         height, width = cv2.imread(filename).shape[:2]         record["file_name"] = filename         record["image_id"] = idx         record["height"] = height         record["width"] = width         annos = v["regions"]         objs = []         for _, anno in annos.items():             assert not anno["region_attributes"]             anno = anno["shape_attributes"]             px = anno["all_points_x"]             py = anno["all_points_y"]             poly = [(x + 0.5, y + 0.5) for x, y in zip(px, py)]             poly = [p for x in poly for p in x]             obj = {                 "bbox": [np.min(px), np.min(py), np.max(px), np.max(py)],                 "bbox_mode": BoxMode.XYXY_ABS,                 "segmentation": [poly],                 "category_id": 0,             }             objs.append(obj)         record["annotations"] = objs         dataset_dicts.append(record)     return dataset_dicts for d in ["train", "val"]:     DatasetCatalog.register("balloon_" + d, lambda d=d: get_balloon_dicts("..\\datasets\\balloon\\" + d))     MetadataCatalog.get("balloon_" + d).set(thing_classes=["balloon"]) from detectron2.engine import DefaultTrainer cfg = get_cfg() cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")) cfg.DATASETS.TRAIN = ("balloon_train",) cfg.DATASETS.TEST = () cfg.DATALOADER.NUM_WORKERS = 0 cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")  # Let training initialize from model zoo cfg.SOLVER.IMS_PER_BATCH = 2 cfg.SOLVER.BASE_LR = 0.00025  # pick a good LR cfg.SOLVER.MAX_ITER = 50  # 300 iterations seems good enough for this toy dataset; you will need to train longer for a practical dataset cfg.SOLVER.STEPS = []  # do not decay learning rate cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 128  # faster, and good enough for this toy dataset (default: 512) cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1  # only has one class (ballon). (see https://detectron2.readthedocs.io/tutorials/datasets.html#update-the-config-for-new-datasets) cfg.MODEL.DEVICE = "cpu" # NOTE: this config means the number of classes, but a few popular unofficial tutorials incorrect uses num_classes+1 here. os.makedirs(cfg.OUTPUT_DIR, exist_ok=True) trainer = DefaultTrainer(cfg) trainer.resume_or_load(resume=False) trainer.train()</pre>训练完成之后，我们会生成一个model_final.pth文件，如下：<img src="/upload/image/6381431360720478292082083.jpg" title="QQ截图20230313141328.jpg" alt="QQ截图20230313141328.jpg"/> 4、验证pth模型直接使用下面代码对训练的pth模型进行测试：<pre class="brush:python;toolbar:false">from detectron2.utils.visualizer import Visualizer from detectron2.data.catalog import MetadataCatalog import cv2 from detectron2.config import get_cfg import os from detectron2.engine.defaults import DefaultPredictor from detectron2.utils.visualizer import ColorMode if __name__ == "__main__":     cfg = get_cfg()     cfg.merge_from_file("../configs/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")     cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth")     print('loading from: {}'.format(cfg.MODEL.WEIGHTS))     cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.3   # set the testing threshold for this model     cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1     cfg.DATASETS.TEST = ("fruits_nuts", )     cfg.MODEL.DEVICE = "cpu"     predictor = DefaultPredictor(cfg)     data_f = '..\\datasets\\balloon\\val\\000009.jpg'     im = cv2.imread(data_f)     outputs = predictor(im)     # v = Visualizer(im[:, :, ::-1], metadata=MetadataCatalog.get(cfg.DATASETS.TRAIN[0]),  scale=0.8, instance_mode=ColorMode.IMAGE_BW)     v = Visualizer(im[:, :, ::-1], metadata=MetadataCatalog.get(cfg.DATASETS.TRAIN[0]), instance_mode=ColorMode.SEGMENTATION)     v = v.draw_instance_predictions(outputs["instances"].to("cpu"))     cv2.imshow("Result", v.get_image()[:, :, ::-1])     cv2.waitKey(0)</pre>50次的迭代训练，效果如下：<img src="/upload/image/6381431401372660122065083.jpg" title="QQ截图20230313142015.jpg" alt="QQ截图20230313142015.jpg"/>

Detectron2 利用现有数据集进行训练

本章节的作用是为后续自定义数据集训练做准备。

在验证自定义数据集之前，我们需要先用现成气球数据集进行训练测试，等测试成功之后，再将气球的数据集替换成自定义的数据集即可。

参考博客：https://blog.csdn.net/WhiffeYF/article/details/114309389

气球数据集下载地址：https://www.kaggle.com/datasets/rkuo2000/balloon-dataset

1、准备数据集

将下载好的气球数据集解压工程的datasets目录下，如下：

QQ截图20230313135027.jpg

QQ截图20230312215842.jpg

2、可视化数据集

为了保证数据集加载的正确性，我们从训练集中随机选择一个进行可视化的标注。

可视化图片会保存到./demo下创建的img文件夹下。

QQ截图20230313135735.jpg

balloon1.py代码如下：

# if your dataset is in COCO format, this cell can be replaced by the following three lines:
# from detectron2.data.datasets import register_coco_instances
# register_coco_instances("my_dataset_train", {}, "json_annotation_train.json", "path/to/image/dir")
# register_coco_instances("my_dataset_val", {}, "json_annotation_val.json", "path/to/image/dir")

from detectron2.structures import BoxMode

import torch, torchvision

# Some basic setup:
# Setup detectron2 logger
import detectron2
from detectron2.utils.logger import setup_logger

setup_logger()

# import some common libraries
import numpy as np
import os, json, cv2, random

# import some common detectron2 utilities
from detectron2 import model_zoo
from detectron2.engine import DefaultPredictor
from detectron2.config import get_cfg
from detectron2.utils.visualizer import Visualizer
from detectron2.data import MetadataCatalog, DatasetCatalog

import time


def get_balloon_dicts(img_dir):
    json_file = os.path.join(img_dir, "via_region_data.json")
    with open(json_file) as f:
        imgs_anns = json.load(f)

    dataset_dicts = []
    for idx, v in enumerate(imgs_anns.values()):
        record = {}

        filename = os.path.join(img_dir, v["filename"])
        height, width = cv2.imread(filename).shape[:2]

        record["file_name"] = filename
        record["image_id"] = idx
        record["height"] = height
        record["width"] = width

        annos = v["regions"]
        objs = []
        for _, anno in annos.items():
            assert not anno["region_attributes"]
            anno = anno["shape_attributes"]
            px = anno["all_points_x"]
            py = anno["all_points_y"]
            poly = [(x + 0.5, y + 0.5) for x, y in zip(px, py)]
            poly = [p for x in poly for p in x]

            obj = {
                "bbox": [np.min(px), np.min(py), np.max(px), np.max(py)],
                "bbox_mode": BoxMode.XYXY_ABS,
                "segmentation": [poly],
                "category_id": 0,
            }
            objs.append(obj)
        record["annotations"] = objs
        dataset_dicts.append(record)
    return dataset_dicts


for d in ["train", "val"]:
    DatasetCatalog.register("balloon_" + d, lambda d=d: get_balloon_dicts("..\\datasets\\balloon\\" + d))
    MetadataCatalog.get("balloon_" + d).set(thing_classes=["balloon"])
balloon_metadata = MetadataCatalog.get("balloon_train")

dataset_dicts = get_balloon_dicts("..\\datasets\\balloon\\train")
for d in random.sample(dataset_dicts, 3):
    img = cv2.imread(d["file_name"])
    visualizer = Visualizer(img[:, :, ::-1], metadata=balloon_metadata, scale=0.5)
    out = visualizer.draw_dataset_dict(d)
    cv2.imwrite('./img/' + str(round(time.time() * 1000)) + '.jpg', out.get_image()[:, :, ::-1])

效果就是下面这个样子的：

3、数据集模型训练

训练代码 balloon2.py（删除了可视化输出代码）

这里里采用的CPU进行训练。

from detectron2.structures import BoxMode
from detectron2.utils.logger import setup_logger

setup_logger()

import numpy as np
import os, json, cv2
from detectron2 import model_zoo
from detectron2.config import get_cfg
from detectron2.data import MetadataCatalog, DatasetCatalog

def get_balloon_dicts(img_dir):
    json_file = os.path.join(img_dir, "via_region_data.json")
    with open(json_file) as f:
        imgs_anns = json.load(f)

    dataset_dicts = []
    for idx, v in enumerate(imgs_anns.values()):
        record = {}

        filename = os.path.join(img_dir, v["filename"])
        height, width = cv2.imread(filename).shape[:2]

        record["file_name"] = filename
        record["image_id"] = idx
        record["height"] = height
        record["width"] = width

        annos = v["regions"]
        objs = []
        for _, anno in annos.items():
            assert not anno["region_attributes"]
            anno = anno["shape_attributes"]
            px = anno["all_points_x"]
            py = anno["all_points_y"]
            poly = [(x + 0.5, y + 0.5) for x, y in zip(px, py)]
            poly = [p for x in poly for p in x]

            obj = {
                "bbox": [np.min(px), np.min(py), np.max(px), np.max(py)],
                "bbox_mode": BoxMode.XYXY_ABS,
                "segmentation": [poly],
                "category_id": 0,
            }
            objs.append(obj)
        record["annotations"] = objs
        dataset_dicts.append(record)
    return dataset_dicts

for d in ["train", "val"]:
    DatasetCatalog.register("balloon_" + d, lambda d=d: get_balloon_dicts("..\\datasets\\balloon\\" + d))
    MetadataCatalog.get("balloon_" + d).set(thing_classes=["balloon"])

from detectron2.engine import DefaultTrainer

cfg = get_cfg()
cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml"))
cfg.DATASETS.TRAIN = ("balloon_train",)
cfg.DATASETS.TEST = ()
cfg.DATALOADER.NUM_WORKERS = 0
cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")  # Let training initialize from model zoo
cfg.SOLVER.IMS_PER_BATCH = 2
cfg.SOLVER.BASE_LR = 0.00025  # pick a good LR
cfg.SOLVER.MAX_ITER = 50  # 300 iterations seems good enough for this toy dataset; you will need to train longer for a practical dataset
cfg.SOLVER.STEPS = []  # do not decay learning rate
cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 128  # faster, and good enough for this toy dataset (default: 512)
cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1  # only has one class (ballon). (see https://detectron2.readthedocs.io/tutorials/datasets.html#update-the-config-for-new-datasets)
cfg.MODEL.DEVICE = "cpu"

# NOTE: this config means the number of classes, but a few popular unofficial tutorials incorrect uses num_classes+1 here.

os.makedirs(cfg.OUTPUT_DIR, exist_ok=True)
trainer = DefaultTrainer(cfg)
trainer.resume_or_load(resume=False)
trainer.train()

训练完成之后，我们会生成一个model_final.pth文件，如下：

QQ截图20230313141328.jpg

4、验证pth模型

直接使用下面代码对训练的pth模型进行测试：

from detectron2.utils.visualizer import Visualizer
from detectron2.data.catalog import MetadataCatalog
import cv2
from detectron2.config import get_cfg
import os
from detectron2.engine.defaults import DefaultPredictor
from detectron2.utils.visualizer import ColorMode


if __name__ == "__main__":
    cfg = get_cfg()
    cfg.merge_from_file("../configs/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")
    cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth")
    print('loading from: {}'.format(cfg.MODEL.WEIGHTS))
    cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.3   # set the testing threshold for this model
    cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1
    cfg.DATASETS.TEST = ("fruits_nuts", )
    cfg.MODEL.DEVICE = "cpu"

    predictor = DefaultPredictor(cfg)

    data_f = '..\\datasets\\balloon\\val\\000009.jpg'
    im = cv2.imread(data_f)
    outputs = predictor(im)

    # v = Visualizer(im[:, :, ::-1], metadata=MetadataCatalog.get(cfg.DATASETS.TRAIN[0]),  scale=0.8, instance_mode=ColorMode.IMAGE_BW)
    v = Visualizer(im[:, :, ::-1], metadata=MetadataCatalog.get(cfg.DATASETS.TRAIN[0]), instance_mode=ColorMode.SEGMENTATION)

    v = v.draw_instance_predictions(outputs["instances"].to("cpu"))
    cv2.imshow("Result", v.get_image()[:, :, ::-1])
    cv2.waitKey(0)

50次的迭代训练，效果如下：

QQ截图20230313142015.jpg