码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 深度学习入门之GRU


    目录

    • 1. 什么是GRU
    • 2. GRU浅析
      • 2.1 GRU的输入输出结构
      • 2.2 GRU的内部结构

    原文链接:https://zhuanlan.zhihu.com/p/32481747

    这里的内容是对台大李宏毅老师课程视频的一些记录以及自己的一些整理和思考。

    1. 什么是GRU

    GRU(Gate Recurrent Unit)是循环神经网络(Recurrent Neural Network, RNN)的一种。和LSTM(Long-Short Term Memory)一样,也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。

    GRU和LSTM在很多情况下实际表现上相差无几,那么为什么我们要使用新人GRU(2014年提出)而不是相对经受了更多考验的LSTM(1997提出)呢。

    下图1-1引用论文中的一段话来说明GRU的优势所在。
    在这里插入图片描述

    简单译文:我们在我们的实验中选择GRU是因为它的实验效果与LSTM相似,但是更易于计算。

    简单来说就是贫穷限制了我们的计算能力…

    相比LSTM,使用GRU能够达到相当的效果,并且相比之下更容易进行训练,能够很大程度上提高训练效率,因此很多时候会更倾向于使用GRU。

    OK,那么为什么说GRU更容易进行训练呢,下面开始介绍一下GRU的内部结构。

    2. GRU浅析

    2.1 GRU的输入输出结构

    GRU的输入输出结构与普通的RNN是一样的。

    有一个当前的输入 x t x^t xt,和上一个节点传递下来的隐状态(hidden state) h t − 1 h^{t-1} ht−1 ,这个隐状态包含了之前节点的相关信息。

    结合 x t x^t xt 和 h t − 1 h^{t-1} ht−1,GRU会得到当前隐藏节点的输出 y t y^t yt 和传递给下一个节点的隐状态 h t h^t ht 。

    在这里插入图片描述

    图2-1 GRU的输入输出结构

    那么,GRU到底有什么特别之处呢?下面来对它的内部结构进行分析!

    2.2 GRU的内部结构

    首先,我们先通过上一个传输下来的状态 h t − 1 h^{t-1} ht−1 和当前节点的输入 x t x^t xt 来获取两个门控状态。如下图2-2所示,其中 r r r 控制重置的门控(reset gate), z z z 为控制更新的门控(update gate)。

    Tips: σ 为sigmoid函数,通过这个函数可以将数据变换为0-1范围内的数值,从而来充当门控信号。

    在这里插入图片描述

  • 相关阅读:
    【11.3】【VP】Codeforces Round #724 (Div. 2)
    紧跟新时代消费趋势,荟语酒店以创新思维打造“幸福感”消费新体验
    流程变量的设置和获取
    MySQL和Oracle区别
    Vue中 引入使用 element-resize-detector 监听 Dom 元素 宽度、高度 变化
    MFC程序设计——用button更改静态文本+显示内容并弹出新内容+静态文本动态打开位图
    Android面试题——高级开发面试题一
    经济数据预测 | Python实现机器学习(MLP、XGBoost)金融市场预测
    Java项目:SSM汽车维修管理系统源码
    秒级使网站变灰,不改代码不上线,如何做到?
  • 原文地址:https://blog.csdn.net/weixin_46713695/article/details/126109962
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号