码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【YOLO系列】YOLO.v3算法原理详解


    YOLO(You Only Look Once)算法原理

    前言 :详细介绍了yolo系列目标检测算法的原理和发展过程。

    系列:
    【YOLO系列】YOLO.v1算法原理详解
    【YOLO系列】YOLO.v2算法原理详解
    【YOLO系列】YOLO.v3算法原理详解
    【YOLO系列】YOLO.v4算法原理详解
    【YOLO系列】YOLO.v5算法原理详解

    文章目录

    • YOLO(You Only Look Once)算法原理
      • 3. YOLO.v3
        • 3.1 基本概述
        • 3.2 算法改进
          • 3.2.0 网络架构
          • 3.2.1 特征提取网络
          • 3.2.2 多尺度检测
          • 3.2.3 分类器
          • 3.2.4 分类损失
        • 3.3 具体实现
          • 2.3.1 卷积网络结构(DarkNet-53)
        • 3.4 总结

    3. YOLO.v3

    3.1 基本概述

    论文参考:YOLOv3:An Incrementatal Improvement

    3.2 算法改进

    3.2.0 网络架构

    整体网络架构如下图所示:

    简易版:

    在这里插入图片描述

    详细版:

    在这里插入图片描述

    相较于 v2,改进点主要集中在一下方面

    • 特征提取网络
    • 多尺度检测
    • 分类器
    • 分类损失

    注意 :

    1. 此时 yolov3 论文中还没有提出 backbone、neck、head 等概念。
    2. 以输入图像 416 × 416 × 3 416\times 416\times 3 416×416×3 为例,数据变化如上图所示。

    3.2.1 特征提取网络

    特征提取网络使用了更深的 DarkNet-53, 网络中引入了残差结构。

    3.2.2 多尺度检测

    在特征提取过程中,即 Backbone ,从上图中可以看到,
    过程中进行了 5 次下采样。

    下采样是通过 Res_n 结构中 CBL 卷积操作来实现,即设定 stride = 2。

    其中,最终使用了 32倍、16倍、8倍 下采样后的提取到的特征,对应于后面的 output1, output2, output3 ,从而实现小、中、大目标的检测。

    3.2.3 分类器

    分类器不再使用 Softmax,主要考虑到 Softmax 无法进行多标签分类,同时Softmax 可以被独立的多个 Logistic 分类器替代。

    3.2.4 分类损失

    分类损失不再使用均方误差,而使用 binary cross-entropy loss,即二分类交叉熵损失。

    3.3 具体实现

    2.3.1 卷积网络结构(DarkNet-53)

    论文所用卷积神经网络结构,即Backbone 是基于 DarkNet,确切地说是 DarkNet-53。

    完整网络如下所示

    在这里插入图片描述

    同样的,yolo v3 使用了图中蓝色框选位置的结构。

    黑色框选位置即为 Res_n 单元。

    3.4 总结

    • yolo v3 更改了特征提取网络,进行多尺度检测,建构出了 yolo 系列的经典框架。后续 v4, v5 基本都是在此框架上进行改动的。
    • yolo v3 是 yolo 系列的经典版本。达到了一个里程碑。也使得 yolo 在目标检测任务得到广泛实践。
  • 相关阅读:
    Windows下安装与配置Docker
    A Framework to Evaluate Fusion Methods for Multimodal Emotion Recognition
    CleanMyPC比360管家好用N倍的电脑清理软件
    使用变基整合别人的操作
    【Java Web】用Redis优化登陆模块
    跟着播客学英语-Why I use vim ? part two
    Golang应用 ━━ 安装与配置hugo博客系统
    展锐UDX710:u-Boot 初始化流程分析
    抗疫行动题材网页设计 大学生最美逆行者感动人物网页代码 众志成城万众一心抗击疫情HTML网页设计
    淘宝扭蛋机一番赏小程序的玩法介绍
  • 原文地址:https://blog.csdn.net/deepsprings/article/details/126289025
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号