码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • YOLOv5:修改backbone为SPD-Conv


    YOLOv5:修改backbone为SPD-Conv

    • 前言
    • 前提条件
    • 相关介绍
    • SPD-Conv
      • YOLOv5修改backbone为SPD-Conv
        • 修改common.py
        • 修改yolo.py
        • 修改yolov5.yaml配置
    • 参考

    在这里插入图片描述

    前言

    • 记录在YOLOv5修改backbone操作,方便自己查阅。
    • 由于本人水平有限,难免出现错漏,敬请批评改正。
    • 更多精彩内容,可点击进入YOLO系列专栏、自然语言处理
      专栏或我的个人主页查看
    • 基于DETR的人脸伪装检测
    • YOLOv7训练自己的数据集(口罩检测)
    • YOLOv8训练自己的数据集(足球检测)
    • YOLOv5:TensorRT加速YOLOv5模型推理
    • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
    • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
    • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
    • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
    • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
    • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
    • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

    前提条件

    • 熟悉Python

    相关介绍

    • Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
    • PyTorch 是一个深度学习框架,封装好了很多网络和深度学习相关的工具方便我们调用,而不用我们一个个去单独写了。它分为 CPU 和 GPU 版本,其他框架还有 TensorFlow、Caffe 等。PyTorch 是由 Facebook 人工智能研究院(FAIR)基于 Torch 推出的,它是一个基于 Python 的可续计算包,提供两个高级功能:1、具有强大的 GPU 加速的张量计算(如 NumPy);2、构建深度神经网络时的自动微分机制。
    • YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。它是一个在COCO数据集上预训练的物体检测架构和模型系列,代表了Ultralytics对未来视觉AI方法的开源研究,其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。

    SPD-Conv

    • SPD-Conv由一个空间到深度(SPD)层和一个非跨行卷积(Conv)层组成,可以应用于大多数CNN架构。SPD-Conv在不丢失可学习信息的情况下对特征图进行下采样,完全抛弃了目前广泛使用的跨行卷积和池化操作。该论文实验结果表明,在小物体和低分辨率图像上有显著的性能提高。
    • 论文地址:https://arxiv.org/abs/2208.03641
    • 官方源代码地址:https://github.com/LabSAINT/SPD-Conv
    • 有兴趣可查阅论文和官方源代码地址。

    在这里插入图片描述
    以下是使用Python实现SPD-Conv的简单例子,目的是方便大家理解SPD-Conv的操作。

    import cv2
    import torch
    from torch import nn
    
    ############## SPD-Conv ##############
    class space_to_depth(nn.Module):
        # Changing the dimension of the Tensor
        def __init__(self, dimension=1):
            super().__init__()
            self.d = dimension
    
        def forward(self, x):
             return torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1)
    ############## SPD-Conv ##############
    
    
    if __name__=="__main__":
    
        img_tensor = torch.Tensor([[[[ 1, 2, 3, 4],
                                     [ 5, 6, 7, 8],
                                     [ 9, 10, 11, 12],
                                     [ 13, 14, 15, 16]],
    
                                     [[ 1, 2, 3, 4],
                                     [ 5, 6, 7, 8],
                                     [ 9, 10, 11, 12],
                                     [ 13, 14, 15, 16]],
    
                                     [[ 1, 2, 3, 4],
                                     [ 5, 6, 7, 8],
                                     [ 9, 10, 11, 12],
                                     [ 13, 14, 15, 16]]]])
        # print('img_tensor:',img_tensor)
        print('img_tensor.shape:',img_tensor.shape)
        spd = space_to_depth()
        res = spd.forward(img_tensor)
        # print('res:',res)
        print('res.shape:',res.shape)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    img_tensor.shape: torch.Size([1, 3, 4, 4])
    res: tensor([[[[ 1.,  3.],
           		[ 9., 11.]],
    	
    	         [[ 1.,  3.],
    	          [ 9., 11.]],
    	
    	         [[ 1.,  3.],
    	          [ 9., 11.]],
    	
    	         [[ 5.,  7.],
    	          [13., 15.]],
    	
    	         [[ 5.,  7.],
    	          [13., 15.]],
    	
    	         [[ 5.,  7.],
    	          [13., 15.]],
    	
    	         [[ 2.,  4.],
    	          [10., 12.]],
    	
    	         [[ 2.,  4.],
    	          [10., 12.]],
    	
    	         [[ 2.,  4.],
    	          [10., 12.]],
    	
    	         [[ 6.,  8.],
    	          [14., 16.]],
    	
    	         [[ 6.,  8.],
    	          [14., 16.]],
    	
    	         [[ 6.,  8.],
    	          [14., 16.]]]])
    res.shape: torch.Size([1, 12, 2, 2])
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37

    YOLOv5修改backbone为SPD-Conv

    在这里插入图片描述

    修改common.py

    将以下代码,添加进common.py。

    ############## SPD-Conv ##############
    class space_to_depth(nn.Module):
        # Changing the dimension of the Tensor
        def __init__(self, dimension=1):
            super().__init__()
            self.d = dimension
    
        def forward(self, x):
             return torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1)
    ############## SPD-Conv ##############
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    修改yolo.py

            elif m is space_to_depth:
                c2 = 4 * ch[f]
    
    • 1
    • 2

    在这里插入图片描述

    修改yolov5.yaml配置

    # Parameters
    nc: 80  # number of classes
    depth_multiple: 0.33  # model depth multiple
    width_multiple: 0.50  # layer channel multiple
    anchors:
      - [10,13, 16,30, 33,23]  # P3/8
      - [30,61, 62,45, 59,119]  # P4/16
      - [116,90, 156,198, 373,326]  # P5/32
    
    # YOLOv5 v6.0 backbone
    backbone:
      # [from, number, module, args]
      [[-1, 1, Focus, [64, 3]],     # 0-P1/2
       [-1, 1, Conv, [128, 3, 1]],  # 1
       [-1,1,space_to_depth,[1]],   # 2 -P2/4
       [-1, 3, C3, [128]],          # 3
       [-1, 1, Conv, [256, 3, 1]],  # 4
       [-1,1,space_to_depth,[1]],   # 5 -P3/8
       [-1, 6, C3, [256]],          # 6
       [-1, 1, Conv, [512, 3, 1]],  # 7-P4/16
       [-1,1,space_to_depth,[1]],   # 8 -P4/16
       [-1, 9, C3, [512]],          # 9
       [-1, 1, Conv, [1024, 3, 1]], # 10-P5/32
       [-1,1,space_to_depth,[1]],   # 11 -P5/32
       [-1, 3, C3, [1024]],         # 12
       [-1, 1, SPPF, [1024, 5]],    # 13
      ]
    
    # YOLOv5 v6.0 head
    head:
      [[-1, 1, Conv, [512, 1, 1]],                    # 14
       [-1, 1, nn.Upsample, [None, 2, 'nearest']],    # 15
       [[-1, 9], 1, Concat, [1]],                     # 16 cat backbone P4
       [-1, 3, C3, [512, False]],                     # 17
    
       [-1, 1, Conv, [256, 1, 1]],                    # 18
       [-1, 1, nn.Upsample, [None, 2, 'nearest']],    # 19
       [[-1, 6], 1, Concat, [1]],                     # 20 cat backbone P3
       [-1, 3, C3, [256, False]],                     # 21 (P3/8-small)
    
       [-1, 1, Conv, [256, 3, 1]],                    # 22
       [-1,1,space_to_depth,[1]],                     # 23 -P2/4
       [[-1, 18], 1, Concat, [1]],                    # 24 cat head P4
       [-1, 3, C3, [512, False]],                     # 25 (P4/16-medium)
    
       [-1, 1, Conv, [512, 3, 1]],                    # 26
       [-1,1,space_to_depth,[1]],                     # 27 -P2/4
       [[-1, 14], 1, Concat, [1]],                    # 28 cat head P5
       [-1, 3, C3, [1024, False]],                    # 29 (P5/32-large)
    
       [[21, 25, 29], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
      ]
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52

    在这里插入图片描述

    参考

    [1] Raja Sunkara, Tie Luo. No More Strided Convolutions or Pooling: A New CNN Building Block for Low-Resolution Images and Small Objects. 2022
    [2] https://github.com/LabSAINT/SPD-Conv
    [3] https://github.com/ultralytics/yolov5.git

    • 由于本人水平有限,难免出现错漏,敬请批评改正。
    • 更多精彩内容,可点击进入YOLO系列专栏、自然语言处理
      专栏或我的个人主页查看
    • 基于DETR的人脸伪装检测
    • YOLOv7训练自己的数据集(口罩检测)
    • YOLOv8训练自己的数据集(足球检测)
    • YOLOv5:TensorRT加速YOLOv5模型推理
    • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
    • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
    • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
    • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
    • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
    • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
    • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目
  • 相关阅读:
    巧记大小端字节序
    ABAP Web Service 调用的一个例子
    Redis相关概念
    DX 的 HLSL 和 GL 的 GLSL的 矩阵构建的行列区别
    青少年python系列 45.文件操作1
    用Rust写一个链表,非常详细,一遍看懂
    (附源码)spring boot新闻管理系统 毕业设计 211113
    运营商三要素核验接口-手机实名验证API
    web前端大一实训 HTML+CSS+JavaScript王者荣耀(60页) web课程设计网页规划与设计 HTML期末大作业 HTML网页设计结课作业
    Spring Cloud Stream函数式编程整合消息中间件
  • 原文地址:https://blog.csdn.net/FriendshipTang/article/details/133101342
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号