码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 机器学习笔记 - 图解对象检测任务(1)


    一、对象检测概述

    1、我们希望能够做到

            视觉场景理解、 即图像中的内容和位置、更进一步对象类别、标识、属性、活动、关系等…

    2、如何定义对象?

            定义那些是对象,那些是连续背景

    3、识别任务都包含什么?

            分类、定位、分割三大任务

    4、面临的挑战

            背景杂乱

             遮挡和截断

             类内变异

    5、检测的目的和应用

            用于图像理解和检索的空间关系、视觉问答、物体抓取/跟踪等

             物体追踪

             预防撞击

    二、滑动窗口检测器

    1、滑动窗口

            使用子窗口,在正确的位置,没有杂乱的存在,滑动窗口检测物体更改窗口大小以按比例搜索

            基本组件:二元分类器

            滑动窗口:对位置和比例的详尽搜索(可以在图像的空间金字塔上使用相同大小的窗口)

    2、特征提取

             手动特征提取

    3、存在的问题

            搜索的计算成本问题、粒度问题(有限的网格)、纵横比、占用、部分遮挡/截断、多重响应

    三、改进:滑动窗口+HOG+SVM

    1、架构如下

            代码参考 

    Opencv学习笔记 基于HOG和SVM的行人检测OpenCV提供了一个基于HOG和SVM且经过训练的行人检测器。和级联分类器一样,可以用这个SVM分类器以不同尺度的窗口扫描图像,在完整的图像中检测特定物体。主要原理就是一句话,使用HOG进行图像特征提取,然后构建SVM分类器,用于训练。https://skydance.blog.csdn.net/article/details/123281193

    2、HOG

    数字图像处理 定向梯度直方图(HOG)描述符特征描述符是图像或图像块的表示,它通过提取有用信息并丢弃无关信息来简化图像。通常,特征描述符将大小为宽 x 高 x 3(通道)的图像转换为长度为 n 的特征向量/数组。在 HOG 特征描述符的情况下,输入图像的大小为 64 x 128 x 3,输出特征向量的长度为 3780。但也可以使用其它大小计算 HOG 描述符。但怎么定义是“有用的”,“无关紧要的”?要定义“有用”,我们需要知道它“有用”是为了什么?显然,特征向量对于查看图像是没有用的。但是,它对于图像识别和对象检测等任务非常有用。https://skydance.blog.csdn.net/article/details/122037239

    3、HOG和CNN比较

     4、基本原理

    (1)网格表示的好处

            平铺定义(记录)空间对应
            分类器可以专注于网格单元的视觉可变性

     (2)特征图

     (3)模型学习

     5、精度评估

             例如 用于检测图像中的风筝
            检测器预测盒子,每个盒子都有一个置信度分数
            如何确定预测是否正确(与基本事实一致)?

             有关于IOU等指标,可参考下面文章 

    机器学习笔记 - IOU、mAP、ROC、AUC、准确率、召回率、F分数一、什么是交并比?1、交并比(IOU)概述交并比(Intersection over Union) 是一种评估指标,用于衡量目标检测器在特定数据集上的准确性。任何提供预测边界框作为输出的算法都可以使用 IoU 进行评估。只要有测试集手工标记的边界框和我们模型预测的边界框。就可以计算交并比。R1:真实的边界框矩形的范围;R2:预测出来的矩形的范围;Rol:R1和R2重合的范围。 如下图所示 IOU值体现了单个对象...https://skydance.blog.csdn.net/article/details/123738525

    四、采用深度学习的对象检测

            篇幅原因,见另一篇

    机器学习笔记 - 图解对象检测任务(2)icon-default.png?t=M4ADhttps://skydance.blog.csdn.net/article/details/124997116

  • 相关阅读:
    使用Lychee搭建个人图片存储系统并进行远程访问设置实现公网访问本地私人图床
    js控制input数字输入[情况差不多全部考虑到了]
    ID VS UUID 主键详解
    【红外图像】利用红外图像处理技术对不同制冷剂充装的制冷系统进行性能评估(Matlab代码实现)
    xss攻击与csrf攻击
    PHP Web 开发基础
    VS2019编译配置Easy3D
    【Vue】入门及生命周期(前后端分离)
    Linux起源
    AJAX 入门笔记
  • 原文地址:https://blog.csdn.net/bashendixie5/article/details/124993441
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号