码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Windows安装配置CUDA12.5


    搞大模型往往都需要GPU加速,本次在家里的PC上安装CUDA来实现GPU加速。

    一、环境准备

    操作系统:Windows11 23H2

    GPU:RTX 4070 Ti Super

    显卡驱动:555.99 (NVIDIA GeForce 驱动程序 - N 卡驱动 | NVIDIA)

    注意:尽量安装Studio版本的驱动(否则需要在安装过程中取消很多组件的安装) 

    (可选)尽量已安装Visual Studio,笔者安装的是Visual Studio 2022 (不赘述)。

    二、安装CUDA

    1. 查看当前的英伟达显卡驱动版本

    按Win+R,输入cmd,在命令行中输入 nvidia-smi,即可查看显卡驱动版本

    本机的显卡驱动版本为555.99。

    在1. CUDA 12.5 Release Notes — Release Notes 12.5 documentation 中查看适合当前显卡驱动版本对应的CUDA版本

    本机的显卡驱动版本为555.99,因此可以安装CUDA 12.5。

    若你的显卡驱动版本较低,又想装高版本CUDA,需要对显卡驱动进行升级。

    在英伟达官网上下载CUDA,地址:

    https://developer.nvidia.com/cuda-toolkit-archive

    选择相应的系统、架构、系统版本、以及安装模式,点击download进行下载。

    下载完成后双击安装即可(安装过程中大部分可以保持默认设置,直接下一步)。

    提取安装文件的临时存放位置,保持默认,点击OK

    选择【精简】或【自定义】均可,建议选【自定义】

    】

    安装位置可以点击浏览自选

    安装完毕

    测试CUDA是否安装成功,重新打开命令行,切换到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.5\extras\demo_suite下,运行bandwidthTest.exe测试程序,看结果是否为“PASS”(成功)。

    三、安装cuDNN

    下载合适的cuDNN版本,下载地址:https://developer.nvidia.com/rdp/cudnn-archive

    选择:Download cuDNN v8.9.7 (December 5th, 2023), for CUDA 12.x下的Windows压缩包进行下载。注意下载时要注册账号。

    下载完成直接解压,将其中的这三个文件夹复制到CUDA安装路径(默认路径C:\Program Files\NVlDlA GPU Computing Toolkit\CUDA\v12.5)下对应的文件夹,与原先同名文件合并。

    四、配置环境变量

    点击【此电脑】—【右键】—【属性】—【高级系统设置】—【环境变量】,打开环境变量窗口。

    找到Path变量并双击,添加指向CUDA Development 安装路径下的 bin文件夹和libnvvp 文件夹(实际安装过程中已自动添加,~~省事)。

    重新打开命令行窗口,输入nvcc -V,出现如下信息,表示安装成功。

    注:至此安装已结束,网上还有一些教程说需要安装zlib。对于新版本的CUDA来说不需要,且最新的官方安装文档显式Windows下已无需安装zlib。

    五、在PyTorch中测试CUDA

    安装PyTorch

    pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

    如果网速慢无法下载,直接下载安装包:https://download.pytorch.org/whl/cu121/torch-2.3.1%2Bcu121-cp311-cp311-win_amd64.whl

    编写如下Python代码:

    1. # -*- coding: utf-8 -*-
    2. import time
    3. import torch
    4. def torch_cuda():
    5. # 判断是否有cuda
    6. print(torch.cuda.is_available())
    7. # 查看cuda设备数量
    8. print(torch.cuda.device_count())
    9. # 查看当前CUDA设备名称
    10. print(torch.cuda.get_device_name(0))
    11. # 查看当前CUDA使用详情
    12. print(torch.cuda.memory_summary())
    13. # 使用cuda进行矩阵乘法
    14. start_time1 = time.time()
    15. x = torch.randn(20000, 20000).to("cuda")
    16. y = torch.randn(20000, 20000).to("cuda")
    17. z = torch.matmul(x, y)
    18. end_time1 = time.time()
    19. print("Time1 (With CUDA): ", end_time1 - start_time1)
    20. # 不使用cuda进行矩阵乘法
    21. start_time2 = time.time()
    22. xx = torch.randn(20000, 20000)
    23. yy = torch.randn(20000, 20000)
    24. zz = torch.matmul(xx, yy)
    25. end_time2 = time.time()
    26. print("Time2 (Without CUDA): ", end_time2 - start_time2)
    27. if __name__ == '__main__':
    28. torch_cuda()

    结果如下:

    有CUDA加速的情况下,20000*20000的矩阵乘法耗时降为原先的1/8。

    六、常见问题

    CUDA安装失败

    解决方案:再重新运行CUDA安装包,安装模式选【自定义】,然后取消相关失败的组件即可。

    参考:

    Installing cuDNN on Windows — NVIDIA cuDNN v9.2.0 documentation

    Installation Guide :: NVIDIA cuDNN Documentation

    CUDA超详细安装教程(windows版)_windows安装cuda-CSDN博客

  • 相关阅读:
    数据库 高阶语句
    零基础学前端(四)重点讲解 CSS:盒子模型、样式选择器、flex布局
    深入理解MySQL索引:从原理到最佳实践
    C Primer Plus(6) 中文版 第11章 字符串和字符串函数 11.7 ctype.h字符函数和字符串
    算法分析与设计考前冲刺 (算法基础、数据结构与STL、递归和分治、 动态规划、贪心算法、 回溯算法)
    print() 函数
    Linux中ls和find命令后接的通配符字符串要不要加双引号?
    dpdk实现dns
    c++ 连接mysql数据库
    Docker 学习笔记总结(二)
  • 原文地址:https://blog.csdn.net/zhujiahui622/article/details/139689667
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号