文章作者：激萌の小宅

促销：￥0

价格：￥0

配送方式：购买后立即生效（如购买异常，请联系站长）

付款之后一定要等待自动跳转结束，否则购买可能会失败

0 天

有效期
0

总销量
0

累计评价

详细说明

<h1 style="font-size: 32px; border-bottom: 2px solid rgb(204, 204, 204); padding: 0px 4px 0px 0px; margin: 0px 0px 10px;">YOLOx 官方数据集训练方法2（COCO）</h1>1.准备工作下载数据集（这是博主目前找到的最小的数据集文件了，很多数据集都是好几个G，根本没法下载，太大了~）：<a href="https://www.kaggle.com/datasets/sagnik1511/thermal-dog-dataset-instance-segmentation" target="_blank">https://www.kaggle.com/datasets/sagnik1511/thermal-dog-dataset-instance-segmentation</a>该下载地址需要登录，但是注册比较麻烦，关于注册的问题，可以参考《<a href="/Course?id=1786721000327" target="_blank" title="YOLOv5 官方数据集训练方法" style="white-space: normal;">YOLOv5 官方数据集训练方法</a>》 数据集下载：链接：<a href="https://pan.baidu.com/s/113kJW9LUUi2C3rL058RByg" target="_blank">https://pan.baidu.com/s/113kJW9LUUi2C3rL058RByg</a>提取码：lce8<img src="/upload/image/6381115228225910369684176.jpg" title="QQ截图20230205000444.jpg" alt="QQ截图20230205000444.jpg"/>将数据集解压到“YOLOX-main\datasets”目录下<img src="/upload/image/6381115257442503203455035.jpg" title="QQ截图20230205000938.jpg" alt="QQ截图20230205000938.jpg"/> 文件含义说明：<table border="1" style="border-right: none; border-bottom: none; border-image: initial; border-left: 1px solid rgb(102, 102, 102); border-top: 1px solid rgb(102, 102, 102);"><tbody><tr class="firstRow"><td width="100" valign="top" style="border-width: 1px; border-color: windowtext rgb(102, 102, 102) rgb(102, 102, 102) windowtext; border-bottom-style: solid; border-right-style: solid; padding: 5px;"> </td><td width="214" valign="top" style="border-width: 1px; border-color: windowtext rgb(102, 102, 102) rgb(102, 102, 102) windowtext; border-bottom-style: solid; border-right-style: solid; padding: 5px;">训练集标签</td><td width="202" valign="top" style="border-width: 1px; border-color: windowtext rgb(102, 102, 102) rgb(102, 102, 102) windowtext; border-bottom-style: solid; border-right-style: solid; padding: 5px;">测试集标签</td></tr><tr><td width="100" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">目标检测</td><td width="214" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">instances_train2017.json</td><td width="202" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">instances_val2017.json</td></tr><tr><td width="100" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">关键点检测</td><td width="214" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">person_keypoints_train2017.json</td><td width="202" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">person_keypoints_val2017.json</td></tr><tr><td width="100" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">看图说话</td><td width="214" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">captions_train2017.json</td><td width="202" valign="top" style="border-left-width: 1px; border-left-color: windowtext; border-top: none; border-bottom: 1px solid rgb(102, 102, 102); border-right: 1px solid rgb(102, 102, 102); padding: 5px;">captions_val2017.json</td></tr></tbody></table>来源：<a href="https://www.ai2news.com/blog/2950594/#google_vignette" target="_blank">https://www.ai2news.com/blog/2950594/#google_vignette</a> 2.修改文件1、将"datasets/coco annotations/annotations"文件夹，拷贝到“datasets/train”目录下，不然训练会出错。2、将“datasets/validation/val2017”文件夹，拷贝到“datasets/train”目录下，不然训练会出错。就像下面这样：<img src="/upload/image/6381115395069428635614415.jpg" title="QQ截图20230205003225.jpg" alt="QQ截图20230205003225.jpg"/>3、第一个需要修改的文件是“YOLOX-main\YOLOX-main\yolox\data\datasets\coco_classes.py”打开“instances_train2017.json”文件，可以知道，里面涉及到的种类有两种。我们修改如下：<pre class="brush:python;toolbar:false">#!/usr/bin/env python3 # -*- coding:utf-8 -*- # Copyright (c) Megvii, Inc. and its affiliates. COCO_CLASSES = (     "Human",     "Dog" )</pre>4、第二个修改修改的文件是“YOLOX-main\YOLOX-main\exps\example\custom\yolox_s.py” 该文件记录了训练图片的路径，修改如下：<pre class="brush:python;toolbar:false">#!/usr/bin/env python3 # -*- coding:utf-8 -*- # Copyright (c) Megvii, Inc. and its affiliates. import os from yolox.exp import Exp as MyExp class Exp(MyExp):     def __init__(self):         super(Exp, self).__init__()         self.depth = 0.33         self.width = 0.50         self.exp_name = os.path.split(os.path.realpath(__file__))[1].split(".")[0]         # Define yourself dataset path         self.data_dir = "datasets/train"         self.train_ann = "instances_train2017.json"         self.val_ann = "instances_val2017.json"         # 种类数         self.num_classes = 2         # 训练次数         self.max_epoch = 100         # 线程数，windows下要设置成0         self.data_num_workers = 0         # 每训练10次就进行一次评估         self.eval_interval = 10</pre> 2.官方图库训练流程注意：训练时如果报下面这个错误，则需要配置环境变量。 <pre class="brush:bash;toolbar:false"> Command '['where', 'cl']' returned non-zero exit status 1.</pre>参考博客：<a href="https://blog.csdn.net/SINPER123/article/details/124920875" target="_blank">https://blog.csdn.net/SINPER123/article/details/124920875</a>主要操作也就是添加下面两个环境变量（需要最新的Visual Studio环境）1、新建环境变量INCLUDE，添加:（Include可能有多个版本，经验是选择新的）<table style="border-left: 1px solid rgb(102, 102, 102); border-top: 1px solid rgb(102, 102, 102);"><tbody><tr class="firstRow"><td width="1644" valign="top" style="border-color: rgb(221, 221, 221) rgb(102, 102, 102) rgb(102, 102, 102) rgb(221, 221, 221); word-break: break-all; border-bottom-width: 1px; border-bottom-style: solid; border-right-width: 1px; border-right-style: solid; padding: 5px;">C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.34.31933\Include; C:\Program Files (x86)\Windows Kits\10\Include\10.0.22000.0\Ucrt; C:\Program Files (x86)\Windows Kits\10\Include\10.0.22000.0\Um; C:\Program Files (x86)\Windows Kits\10\Include\10.0.22000.0\shared;</td></tr></tbody></table>2、新建环境变量LIB, 添加:<table style="border-left: 1px solid rgb(102, 102, 102); border-top: 1px solid rgb(102, 102, 102);"><tbody><tr class="firstRow"><td width="1644" valign="top" style="border-color: rgb(221, 221, 221) rgb(102, 102, 102) rgb(102, 102, 102) rgb(221, 221, 221); word-break: break-all; border-bottom-width: 1px; border-bottom-style: solid; border-right-width: 1px; border-right-style: solid; padding: 5px;">C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.34.31933\Lib\X64;C:\Program Files (x86)\Windows Kits\10\Lib\10.0.22000.0\Ucrt\X64; C:\Program Files (x86)\Windows Kits\10\Lib\10.0.22000.0\Um\X64;</td></tr></tbody></table> 说明：如果想使用GPU进行训练，请在train.py文件的前面添加下面代码<pre class="brush:python;toolbar:false">import os os.environ['CUDA_VISIBLE_DEVICES']='0'</pre><img src="/upload/image/6381153581332236886182212.jpg" title="QQ图片20230209103654.jpg" alt="QQ图片20230209103654.jpg"/>然后执行训练命令：<pre class="brush:python;toolbar:false">python tools/train.py -f exps/example/custom/yolox_s.py -d 1 -b 8 --fp16 -c yolox_s.pth</pre><img src="/upload/image/6381115568219493824950425.jpg" title="QQ截图20230205010119.jpg" alt="QQ截图20230205010119.jpg"/>编译完了就生成下面这些文件了。<img src="/upload/image/6381115607067887211107126.jpg" title="QQ截图20230205010752.jpg" alt="QQ截图20230205010752.jpg"/>然后使用best_ckpt.pth文件去测试我们的图片，命令如下：<pre class="brush:python;toolbar:false">python tools/demo.py image -f exps/example/custom/yolox_s.py -c ./YOLOX_outputs/yolox_s/best_ckpt.pth --path assets/me.jpg --conf 0.3 --nms 0.65 --tsize 640 --save_result</pre>识别结果保存在“YOLOX-main\YOLOX_outputs\yolox_s\vis_res\2023_02_09_20_29_18”目录下面：<img src="/upload/image/6381157145352556891380885.jpg" title="me.jpg" alt="me.jpg"/>

YOLOx 官方数据集训练方法2（COCO）

1.准备工作

下载数据集（这是博主目前找到的最小的数据集文件了，很多数据集都是好几个G，根本没法下载，太大了~）：

https://www.kaggle.com/datasets/sagnik1511/thermal-dog-dataset-instance-segmentation

该下载地址需要登录，但是注册比较麻烦，关于注册的问题，可以参考《YOLOv5 官方数据集训练方法》

数据集下载：

链接：https://pan.baidu.com/s/113kJW9LUUi2C3rL058RByg

提取码：lce8

QQ截图20230205000444.jpg

将数据集解压到“YOLOX-main\datasets”目录下

QQ截图20230205000938.jpg

文件含义说明：

	训练集标签	测试集标签
目标检测	instances_train2017.json	instances_val2017.json
关键点检测	person_keypoints_train2017.json	person_keypoints_val2017.json
看图说话	captions_train2017.json	captions_val2017.json

来源：https://www.ai2news.com/blog/2950594/#google_vignette

2.修改文件

1、将"datasets/coco annotations/annotations"文件夹，拷贝到“datasets/train”目录下，不然训练会出错。

2、将“datasets/validation/val2017”文件夹，拷贝到“datasets/train”目录下，不然训练会出错。

就像下面这样：

QQ截图20230205003225.jpg

3、第一个需要修改的文件是“YOLOX-main\YOLOX-main\yolox\data\datasets\coco_classes.py”

打开“instances_train2017.json”文件，可以知道，里面涉及到的种类有两种。我们修改如下：

#!/usr/bin/env python3
# -*- coding:utf-8 -*-
# Copyright (c) Megvii, Inc. and its affiliates.

COCO_CLASSES = (
    "Human",
    "Dog"
)

4、第二个修改修改的文件是“YOLOX-main\YOLOX-main\exps\example\custom\yolox_s.py”

该文件记录了训练图片的路径，修改如下：

#!/usr/bin/env python3
# -*- coding:utf-8 -*-
# Copyright (c) Megvii, Inc. and its affiliates.
import os

from yolox.exp import Exp as MyExp


class Exp(MyExp):
    def __init__(self):
        super(Exp, self).__init__()
        self.depth = 0.33
        self.width = 0.50
        self.exp_name = os.path.split(os.path.realpath(__file__))[1].split(".")[0]

        # Define yourself dataset path
        self.data_dir = "datasets/train"
        self.train_ann = "instances_train2017.json"
        self.val_ann = "instances_val2017.json"
        # 种类数
        self.num_classes = 2
        # 训练次数
        self.max_epoch = 100
        # 线程数，windows下要设置成0
        self.data_num_workers = 0
        # 每训练10次就进行一次评估
        self.eval_interval = 10

2.官方图库训练流程

注意：训练时如果报下面这个错误，则需要配置环境变量。

 Command '['where', 'cl']' returned non-zero exit status 1.

参考博客：https://blog.csdn.net/SINPER123/article/details/124920875

主要操作也就是添加下面两个环境变量（需要最新的Visual Studio环境）

1、新建环境变量INCLUDE，添加:（Include可能有多个版本，经验是选择新的）

C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.34.31933\Include;
C:\Program Files (x86)\Windows Kits\10\Include\10.0.22000.0\Ucrt;
C:\Program Files (x86)\Windows Kits\10\Include\10.0.22000.0\Um;
C:\Program Files (x86)\Windows Kits\10\Include\10.0.22000.0\shared;

2、新建环境变量LIB, 添加:

C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.34.31933\Lib\X64;

C:\Program Files (x86)\Windows Kits\10\Lib\10.0.22000.0\Ucrt\X64;
C:\Program Files (x86)\Windows Kits\10\Lib\10.0.22000.0\Um\X64;

说明：如果想使用GPU进行训练，请在train.py文件的前面添加下面代码

import os
os.environ['CUDA_VISIBLE_DEVICES']='0'

QQ图片20230209103654.jpg

然后执行训练命令：

python tools/train.py -f exps/example/custom/yolox_s.py -d 1 -b 8 --fp16 -c yolox_s.pth

QQ截图20230205010119.jpg

编译完了就生成下面这些文件了。

QQ截图20230205010752.jpg

然后使用best_ckpt.pth文件去测试我们的图片，命令如下：

python tools/demo.py image -f exps/example/custom/yolox_s.py -c ./YOLOX_outputs/yolox_s/best_ckpt.pth --path assets/me.jpg --conf 0.3 --nms 0.65 --tsize 640 --save_result

识别结果保存在“YOLOX-main\YOLOX_outputs\yolox_s\vis_res\2023_02_09_20_29_18”目录下面：