• 深度学习模型理解-CNN-手写数据字代码


    系列文章目录

    提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加
    例如:第一章 Python 机器学习入门之pandas的使用


    提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档


    前言

    提示:这里可以添加本文要记录的大概内容:

    例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


    提示:以下是本篇文章正文内容,下面案例可供参考

    一、卷积神经网络是什么

    什么是卷积

    对图像(不同的数据窗口数据)和滤波矩阵(一组固定的权重:因为每个神经元的多个权重固定,所以又可以看做一个恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作,也是卷积神经网络的名字来源。

    非严格意义上来讲,下图中红框框起来的部分便可以理解为一个滤波器,即带着一组固定权重的神经元。多个滤波器叠加便成了卷积层。
    在这里插入图片描述

    整体结果
    在这里插入图片描述

    卷积神经网络是一种带有卷积结构的深度神经网络,卷积结构可以减少深层网络占用的内存量,其三个关键的操作,其一是局部感受野,其二是权值共享,其三是pooling层,有效的减少了网络的参数个数,缓解了模型的过拟合问题。。

    网络结构

    **卷积神经网络整体架构**: 卷积神经网络是一种多层的监督学习神经网络,隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能的核心模块。该网络模型通过采用梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过频繁的迭代训练提高网络的精度。卷积神经网络的低隐层是由卷积层和最大池采样层交替组成,高层是全连接层对应传统多层感知器的隐含层和逻辑回归分类器。第一个全连接层的输入是由卷积层和子采样层进行特征提取得到的特征图像。最后一层输出层是一个分类器,可以采用逻辑回归,Softmax回归甚至是支持向量机对输入图像进行分类。
    上图中CNN要做的事情是:给定一张图片,是车还是马未知,是什么车也未知,现在需要模型判断这张图片里具体是一个什么东西,总之输出一个结果:如果是车 那是什么车

    • 最左边是数据输入层

    对数据做一些处理,比如去均值(把输入数据各个维度都中心化为0,避免数据过多偏差,影响训练效果)、归一化(把所有的数据都归一到同样的范围)、PCA/白化等等。CNN只对训练集做“去均值”这一步。

    • 中间是

    CONV:卷积计算层,线性乘积 求和。
    RELU:激励层,上文2.2节中有提到:ReLU是激活函数的一种。
    POOL:池化层,简言之,即取区域平均或最大。

    • 最右边是

    FC:全连接层
    这几个部分中,卷积计算层是CNN的核心,下文将重点阐述。

    二、动图理解

    卷积计算过程

    在CNN中,滤波器filter(带着一组固定权重的神经元)对局部输入数据进行卷积计算。每计算完一个数据窗口内的局部数据后,数据窗口不断平移滑动,直到计算完所有数据。这个过程中,有这么几个参数:
      a. 深度depth:神经元个数,决定输出的depth厚度。同时代表滤波器个数。
      b. 步长stride:决定滑动多少步可以到边缘。
      c. 填充值zero-padding:在外围边缘补充若干圈0,方便从初始位置以步长为单位可以刚好滑倒末尾位置,通俗地讲就是为了总长能被步长整除。
    在这里插入图片描述
    示例过程:
    在这里插入图片描述

    激活函数

    实际梯度下降中,sigmoid容易饱和、造成终止梯度传递,因为反向传播时求导可能为0,且没有0中心化。咋办呢,可以尝试另外一个激活函数:ReLU,其图形表示如下

    这里是引用
    ReLU的优点是收敛快,求梯度简单。

    池化层

    作用减小数据大小,有平均池化和最大赤化
    在这里插入图片描述
    上图所展示的是取区域最大,即上图左边部分中 左上角2x2的矩阵中6最大,右上角2x2的矩阵中8最大,左下角2x2的矩阵中3最大,右下角2x2的矩阵中4最大,所以得到上图右边部分的结果:6 8 3 4。很简单不是?

    全连接层

    采用softmax全连接,得到的激活值即卷积神经网络提取到的图片特征。

    不同的卷积核会得到不同的效果

    在下图对应的计算过程中,输入是一定区域大小(width*height)的数据,和滤波器filter(带着一组固定权重的神经元)做内积后等到新的二维数据。

    具体来说,左边是图像输入,中间部分就是滤波器filter(带着一组固定权重的神经元),不同的滤波器filter会得到不同的输出数据,比如颜色深浅、轮廓。相当于如果想提取图像的不同特征,则用不同的滤波器filter,提取想要的关于图像的特定信息:颜色深浅或轮廓。

    如下图所示

    在这里插入图片描述

    三、手写数字数据集代码

    数据集查看

    数据集分析

    使用keras.datasets库的mnist.py文件中的load_data方法加载数据

    import tensorflow as tf
    mnist=tf.keras.datasets.mnist
    #
  • 相关阅读:
    Anaconda和Conda的使用
    汽车自动驾驶是人工智能吗,自动驾驶是人工智能
    springboot企业客户信息反馈平台springboot39
    网易传媒基于 Arctic 的低成本准实时计算实践
    MySQL(一)基本语句(列排名、去掉重复行、运算符与分页排序)详解
    【分布式应用】消息队列之卡夫卡 + EFLFK集群部署
    Open sesame! universal black box jailbreaking of large language models - 论文翻译
    【源码+文档+调试讲解】微信小程序家政项目小程序
    ArcMap安装OSM路网数据编辑插件ArcGIS Editor for OSM的方法
    多线程进阶2 - 哈希表
  • 原文地址:https://blog.csdn.net/guguo666/article/details/127097895