码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【AI】推理引擎中的模型小型化问题


    随着深度学习模型的发展,模型越来越大,网络参数越来越多,对算力的要求也越来越高。但在端侧和云端部署时,其算力相对有限,因此如何缩小模型成为一个问题。

    一、基础参数

    • FLOPs,浮点运算次数(Floating-point Operations),可以认为是计算量,用于衡量模型的时间复杂度。
    • FLOPS,每秒执行的浮点运算次数(Floating-point Operations Per Second),可以理解为计算速度,用于衡量模型速度的指标。
    • MACs,乘-加操作次数(Multiply-accumulate Operations),MACs 大约是 FLOPs 的一半,因为一次卷积操作包含一次浮点加法和一次浮点乘法操作。
    • Params,模型含有多少参数直接决定了模型的大小,也影响推断时对内存的占用量,单位通常以 M(兆)
      个表示,参数通常用 float32(4 字节)表示,因此模型大小是参数数量的 4 倍左右。

    例如,10M Params = 10M x 4 byte = 40 MB

    • MAC,内存访问代价(Memory Access Cost),指的是输入单个样本,模型 / 卷积层完成一次前向传播所发生的内存交换总量,即模型的空间复杂度,单位是 byte。
    • Bandwidth,内存带宽(Memory Bandwidth)表示将数据从 RAM 移动到处理单元(xPU)的速度,比计算速度更有代表性,它取决于内存和处理单元间的数据传输速度。

    二、CNN 模型小型化工作

    这些工作慢慢看
    在这里插入图片描述

    三、Transformer 模型小型化工作

    在这里插入图片描述

  • 相关阅读:
    【无标题】
    LeNet-5学习笔记
    阿里云国际站服务器设置自动开关机的攻略
    基于MS16F3211芯片的触摸控制灯的状态变化和亮度控制总结版(11.22)
    激活函数总结(四十四):激活函数补充(NLSIG、EvoNorms)
    [NewStarCTF 2023 公开赛道] week1 Crypto
    go的日志库logrus
    【吴恩达机器学习-笔记整理】异常检测与高斯分布
    A loam位姿结果缺1帧;rosbag收不到第1帧;kittihelper转的bag
    sklearn中make_blobs方法:聚类数据生成器
  • 原文地址:https://blog.csdn.net/weixin_45651194/article/details/132918410
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号