码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • PyTorch编译尝试笔记


    发现手上的GT-740M,已经太老,算力3.0,早被pytorch抛弃,想要学习下深度学习,基于没好卡,刚好时间还有点,花了一天的时间编译了一下,发现显存是个大难题,可以把数据或模型搞小点吧!
    主要参考了这两个,基本上是个体力活,只按按照版本来的话是不会报错的,当然,也是挺花时间的,需要6个小时以上,i3-3120M,双核2.5G Hz的CPU。
    Windows环境下老显卡跑PyTorch GPU版本【图文】_mob604756e4006a_51CTO博客

    https://blog.csdn.net/qq_43051923/article/details/108393510

    所需软件下载安装

    这里cuda已经安装过了10.1,还需要编译所需的几个软件和组件。

    # vs
    https://download.visualstudio.microsoft.com/download/pr/067fd8d0-753e-4161-8780-dfa3e577839e/4776935864d08e66183acd5b3647c9616da989c60afbfe100d4afc459f7e5785/vs_BuildTools.exe
    # cudnn
    https://ossci-windows.s3.amazonaws.com/cudnn-10.1-windows10-x64-v7.6.4.38.zip
    解压后直接复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1,对应文件夹会自动合并
    https://s3.amazonaws.com/ossci-windows/magma_2.5.4_cuda101_release.7z
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    准备分享github的,发现文件大小限制100M,上传pypi,也是同样的限制,于是,分享到百度网盘了。
    参考了多个链接,终于编译成功,不过2G显存的GPU实在hold不住大项目,学习用下还是可以的,欢迎测试反馈!
    链接: https://pan.baidu.com/s/1IuX9K2mI2iR_J31d8aeYcQ?pwd=xy2s

    解决out of memroy

    显存不足可以有几个方法曲线救国

    1. pytorch-LMS

    已经不再活跃更新了,上一次更新是在2020年,conda可以安装1.3版本,只有linux版本,github上是1.5,如果win应该要编译下。
    https://github.com/mtbrandy/pytorch

    2. 使用koila

    号称一行代码解决CUDA error: out of memory error,应该是最好的解决办法吧,看star已经有1.5K啦,应该不错。

    1.3 并行计算?

    能否使用一张显卡? fairscale
    最后,又发现一个AMD核显可用的ROCm,也就是AMD版的CUDA,Bruhnspace ROCm project for AMD APUs - Bruhnspace
    不知道效果如何,鉴于AMD ROCm版本的Pytorch刚提供支持,可能坑比较多。

    比官方的4830.7足足低了两个数量级呀,硬件差了不只一点呀,就学习用了!开心的是,batch改到200至少完成啦!
    官网
    7.6. 残差网络(ResNet) — 动手学深度学习 2.0.0-beta0 documentation (d2l.ai)
    看起来更像是CUDA核心数不够,利用率是锯齿形的。

    看看谷歌的免费GPU的能力,差别是明显的!测试数据足够了。

    TPU,可能是旧版本,或者资源给的不足,速度和我的740M差不多,而且还超时运行,不给资源啦!

  • 相关阅读:
    【多线程 - 11、死锁】
    人工智能与大数据面试指南——Python
    万物并作,吾以观复|OceanBase 政企行业实践
    493. 翻转对
    Docker的overlay2目录占用磁盘根目录的解决办法
    Qt实战案例(53)——利用QDrag实现拖拽拼图功能
    【Java】jdk9为何要将String的底层实现由char[]改为byte[]
    非零基础自学Java (老师:韩顺平) 第2章 Java概述 2.18 Java代码规范 && 2.19 DOS命令
    java计算机毕业设计停车场信息管理系统源码+系统+数据库+lw文档+mybatis+运行部署
    Python面试宝典:Python中与常用的机器学习库相关的面试笔试题(1000加面试笔试题助你轻松捕获大厂Offer)
  • 原文地址:https://blog.csdn.net/zd200572/article/details/127173929
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号