码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • CUDA 基础 01 - 概念


    最近在GPU编译器测试方面遇到一些瓶颈,准备学习下cuda 相关的基础知识。

    warp/sm/index/grid等。

    CPU VS GPU

    GPU最重要的一点是可以并行的实现数据处理。

    这一点在数据量大、运算复杂度不高的条件下极为适用。可以简单地把一块GPU想象成一个超多核的CPU运算部件。这些CPU有自己的寄存器,还有供数据交换用的共享内存、缓存,同时周围还有取指部件和相应的调度机制,保证指令能够在之上执行。

    这里有一张典型的CPU和GPU的对比图片,CPU和GPU就呈现出非常不同的架构

    图片

    • 鲜绿色:计算单元ALU(Arithmetic Logic Unit)
    • 橙红色:存储单元(cache)
    • 橙黄色:控制单元(control)

    GPU:数量众多的计算单元和超长的流水线,只有简单的控制逻辑并省去了Cache
    CPU:被Cache占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路。

    图片

    这个比喻就很恰当:

    GPU的工作大部分就是这样,计算量大,而且要重复很多很多次。就像你有个工作需要算几亿次一百以内加减乘除一样

  • 相关阅读:
    09.2. 长短期记忆网络(LSTM)
    STC89C51基础及项目第12天:IIC协议、OLED显示字符和图片
    如何在外网访问内网服务器数据库
    威胁狩猎大合集
    Linux升级OpenSSH 常见问题
    UI设计师面试时如何自我介绍优漫动游
    2022.7.27好题选讲
    CocosCreator 面试题(十)Cocos Creator 内存管理
    小程序授权获取昵称
    微信小程序 picker-view 组件构建一个上下拖动选择器
  • 原文地址:https://blog.csdn.net/weixin_42514606/article/details/126805750
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号