计算机视觉(YOLO算法系类)—V1

前言：
✌ 作者简介：CC++Edge淇，大家可以叫我--斯淇。(CSDN优质博主建议加这一条！)
📑 个人主页：CC++Edge淇主页
📫 如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步👀
🔥 如果感觉博主的文章还不错的话，还请不吝👍关注、点赞、收藏三连支持👍一下博主哦
💬 人生格言：这世界形形色色，做好自己才是真!-——从入门到现在不容易~💬
每日推荐书：《opencv基础教程》

一、前言（百度百科）

YOLO系列是one-stage且是基于深度学习的回归方法，而R-CNN、Fast-RCNN、Faster-RCNN等是two-stage且是基于深度学习的分类方法。

016年，Joseph Redmon、Santosh Divvala、Ross Girshick等人提出了一种单阶段（one-stage）的目标检测网络。它的检测速度非常快，每秒可以处理45帧图片，能够轻松地实时运行。由于其速度之快和其使用的特殊方法，作者将其取名为：You Only Look Once（也就是我们常说的YOLO的全称），并将该成果发表在了CVPR 2016上，从而引起了广泛地关注。

YOLO 的核心思想就是把目标检测转变成一个回归问题，利用整张图作为网络的输入，仅仅经过一个神经网络，得到bounding box（边界框）的位置及其所属的类别。

深度学习经典检测方法：

TWO-STAGE(两阶段)：Faster-rcnn Mask-Rcnn系列
ONE-stage(单阶段)：YOLO系列

ONE-stage：

最核心的优势：速度非常快，适合做实时检测任务！

但是缺点也是有的，效果通常情况下不会太好！

个人理解：这个算法衡量的（两个指标）1.FPS的速度是快还是慢，2.mAP值的好坏！

TWO-STAGE：

速度通常比较慢（5FPS），但是效果通常还是不错的
非常实用的通用框架MaskRcnn，建议熟悉下！

指标分析

map指标：综合衡量检测效果；单看精度和recall不太行！

关于.YOLO系列指标分析：

TP的意思:true positives (TP正类判定位正类)

FP就是负类判定为正类“存伪”

FN：正类判断为负类“去真”，明明是小狗偏给判断为小猫！

TN：负类判定为负类！

检测任务中的精度和召回率分别代表

基于置信度阈值来计算，例如分别计算0.9；0.8；0.7

0.9时：TP+FP = 1，TP = 1 ；FN = 2；Precision=1/1；Recall=1/3；

YOLO-V1

把检测问题转化成回归问题，一个CNN就搞定了！

可以对视频进行实时检测，应用领域非常广！

YOLOv1采用的是“分开使用的”的策略，将一张图片平均分成7×7个网格，每个网格分别负责预测中心点落在该网格内的目标。通过这种方式，我们就不需要再额外设计一个RPN网络，这正是YOLOv1作为单阶段网络的简单快捷之处！

网络架构：

网络输入：448×448×3的彩色图片。
中间层：由若干卷积层和最大池化层组成，用于提取图片的抽象特征。
全连接层：由两个全连接层组成，用来预测目标的位置和类别概率值。
网络输出：7×7×30的预测结果。
YOLO在输入连接里面有一个全连接层，所以说这里必须做一个限制输入数据的大小（必须是448*448*3）
并且需要杂计算机里面设计一个损失函数，在损失函数里面（设置好损失的最小值）

每个数字的含义：

1.10 =(X,Y,H,W,C)*B（2个）

2.当前数据集中有20个类别

3.7*7表示最终网格的大小

4.（S*S）*（B*5+C）给出最终预测结果等于多少！

损失函数：

损失由三部分组成，分别是：坐标预测损失、置信度预测损失、类别预测损失

定位误差比分类误差更大，所以增加对定位误差的惩罚，使λ c o o r d = 5 λ。

YOLO-V1 （V1 内容介绍一遍）

优点：快速，简单！

问题1：每个Cell只预测一个类别，如果重叠无法解决

问题2：小物体检测效果一般，长宽比可选的但单一

具体说明一点优点：

YOLO检测的速度其实非常快，拿标准版的YOLO来说每秒可以处理的图像为40-45秒每张图片！当然极速版的可以处理150帧的图像！！！！这也就是YOLO优于其他的方式！！
YOLO的检测能力要比其他的监测系统快两倍！其迁移能力强，能过运用于多种的新的领域！

局限：

YOLO对于小的群体的检测效果并不好，如果同时检测两个框，并且属于同一个类可能会出现错误！！
损失函数的问题也同样影响大，定位误差以及检测效果的偏移，和不同之间的角度问题上同样偏弱！

相关阅读:
界面控件DevExpress WPF流程图组件，完美复制Visio UI！(一)
【学习笔记】设计算法（Design Algorithm）
java中(String)类常用方法
librosa音频处理教程
Android入门第21天-Android里TextClock的使用
elasticsearch-head安装及详细配置
2023山东健博会/营养健康展/特医食品展/山东大健康展
IO多路转接 ——— select、poll、epoll
vivado产生报告阅读分析5-时序报告1
我的Mysql突然挂了（Communications link failure）

原文地址：https://blog.csdn.net/m0_64148096/article/details/125897724