• 初识CNN1


    深度学习可以说救了计算机视觉

    卷积神经网络可以做的事情

    • 检测任务
      • 在摄像头中检测或者追踪
      • 图像遍历分割
      • 分类和检索
      • 超分辨率重构
      • 医学任务
      • 无人驾驶
      • 人脸识别

    只要有特征了,还有什么东西不能做!~

    GPU 图像处理单元

    • 处理图像任务
    • 做卷积
    • 做全连接
    • 做各种运算

    比CPU快100倍!!

    在学习阶段我们还是可以用CPU来跑代码,在实际的项目中我们推荐使用GPU来跑

    但凡能跟图像搭上边的,都可用神经网络或者卷积神经网络来做

    CNN卷积神经网络来做点东西

    神经网络是用来干什么的?

    神经网络是用来做特征提取的

    卷积神经网络CNN也是用来做特征提取的

    • 解决当前存在的问题,视频说白了就是图像的数据

    如何进行特征提取?

    需要的训练比较高

    提出一种做卷积的特征提取方法


    卷积网络和传统网络的区别

    • NN传统神经网络

      • 看起来像二维
      • 输入的东西是784像素点,是一维的列向量
    • CNN卷积神经网络

      • 像三维
      • 输入28281的长方体矩阵,三维的
      • hwc

    c表示的是3维的

    在这里插入图片描述

    整体架构

    • 输入层
      • 28281
    • 卷积层
      提取特征
    • 池化层
      压缩特征
    • 全连接层
      通过权重

    在这里插入图片描述

    卷积做的事

    把一张图像分成好多部分

    • 先把图像进行分割成一块块的小区域
    • 每个小区域的图像特征是不一样的
    • 选择一种计算方法,计算每一个区域他应该的特征值是多少

    在1号区域进行特征提取特征值

    使用权重参数得到特 征值

    • x1是我们拿到的当前区域
    • w1是权重参数矩阵

    找到最好的权重参数矩阵
    使得最后的特征提取效果最好

    把绿色的东西叫做特征图


    图像颜色通道

    32323
    图像是有通道的

    • 让每个通道的颜色单独去做计算
    • 把每个通道的结果卷积在一起

    过程

    • 每个区域单独计算单独通道的值。其实是3个通道
    • 3个通道的值分别加在一起。

    在这里插入图片描述

    • 找一个三维的立体区域
    • 找特征值
    • 分区域对当前的数据进行特征提取

    维度必须是一样的

    输入的东西是7*7*3的
    
    意思是表格的长是7
    宽度是7
    总共3维,3个
    
    • 1
    • 2
    • 3
    • 4
    • 5

    输入的东西中c是多少,filter中的个数 也必须和他一起对应

    filter中的数据3*3*3

    前面的两个3*3表示的是在原始图像中每多大的小区域选取一个特征
    
    • 1

    对应的是一个特征值

    在这里插入图片描述

    从图片中我们可以观察到从原始图像中计算的3个不同通道的值是不一样的。

    卷积核的值按权重计算

  • 相关阅读:
    python: float64与float32转换、压缩比较与转换偏差
    反转字符串中的元音字母
    php session 的封装 (收藏)
    西祠胡同社区彻底消失
    Java项目:SSM邮件收发管理系统
    B. Snow Walking Robot
    docker基本概念与部署和基础命令
    es索引同步
    20240603每日通信--------springboot使用netty-socketio集成即时通信WebSocket
    spring bean实例化过程及顺序
  • 原文地址:https://blog.csdn.net/weixin_44943389/article/details/127586912