码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 推荐一个对pytorch代码详细注释的github项目


    文章目录

    • 论文实现
      • Transformers
      • Eleuther GPT-NeoX
      • Diffusion models
      • Generative Adversarial Networks
      • Recurrent Highway Networks
      • LSTM
      • HyperNetworks - HyperLSTM
      • ResNet
      • ConvMixer
      • Capsule Networks
      • U-Net
      • Sketch RNN
      • Graph Neural Networks
      • Reinforcement Learning
      • Counterfactual Regret Minimization (CFR)
      • Optimizers
      • Normalization Layers
      • Distillation
      • Adaptive Computation
      • Uncertainty
      • Activations
      • Language Model Sampling Techniques
      • Scalable Training/Inference
    • 查看实例

    今天在无意间找一个pytorch代码和注释的Github项目。
    先上项目:
    https://github.com/labmlai/annotated_deep_learning_paper_implementations

    这个项目还有个网站,地址:https://nn.labml.ai/
    这个项目将论文和pytorch代码结合起来,大大方便了大家的学习。

    论文实现

    Transformers

    Multi-headed attention
    Transformer building blocks
    Transformer XL
    Relative multi-headed attention
    Rotary Positional Embeddings (RoPE)
    Attention with Linear Biases (ALiBi)
    RETRO
    Compressive Transformer
    GPT Architecture
    GLU Variants
    kNN-LM: Generalization through Memorization
    Feedback Transformer
    Switch Transformer
    Fast Weights Transformer
    FNet
    Attention Free Transformer
    Masked Language Model
    MLP-Mixer: An all-MLP Architecture for Vision
    Pay Attention to MLPs (gMLP)
    Vision Transformer (ViT)
    Primer EZ
    Hourglass

    Eleuther GPT-NeoX

    Generate on a 48GB GPU
    Finetune on two 48GB GPUs
    LLM.int8()

    Diffusion models

    Denoising Diffusion Probabilistic Models (DDPM)
    Denoising Diffusion Implicit Models (DDIM)
    Latent Diffusion Models
    Stable Diffusion

    Generative Adversarial Networks

    Original GAN
    GAN with deep convolutional network
    Cycle GAN
    Wasserstein GAN
    Wasserstein GAN with Gradient Penalty
    StyleGAN 2

    Recurrent Highway Networks

    LSTM

    HyperNetworks - HyperLSTM

    ResNet

    ConvMixer

    Capsule Networks

    U-Net

    Sketch RNN

    Graph Neural Networks

    Graph Attention Networks (GAT)
    Graph Attention Networks v2 (GATv2)

    Reinforcement Learning

    Proximal Policy Optimization with Generalized Advantage Estimation
    Deep Q Networks with with Dueling Network, Prioritized Replay and Double Q Network.

    Counterfactual Regret Minimization (CFR)

    Solving games with incomplete information such as poker with CFR.

    Kuhn Poker

    Optimizers

    Adam
    AMSGrad
    Adam Optimizer with warmup
    Noam Optimizer
    Rectified Adam Optimizer
    AdaBelief Optimizer

    Normalization Layers

    Batch Normalization
    Layer Normalization
    Instance Normalization
    Group Normalization
    Weight Standardization
    Batch-Channel Normalization
    DeepNorm

    Distillation

    Adaptive Computation

    PonderNet

    Uncertainty

    Evidential Deep Learning to Quantify Classification Uncertainty

    Activations

    Fuzzy Tiling Activations

    Language Model Sampling Techniques

    Greedy Sampling
    Temperature Sampling
    Top-k Sampling
    Nucleus Sampling

    Scalable Training/Inference

    Zero3 memory optimizations

    查看实例

    我们一起看一下ResNet的例子,地址:https://nn.labml.ai/resnet/index.html

    在这里插入图片描述
    这是Block。
    在这里插入图片描述
    这是Block里面的内容。

    这样的方式理解pytorch代码是不是简单了许多。

  • 相关阅读:
    Whisper 从0安装教程 windows
    最大流=最小割 简单证明
    完整boot引导代码详解(完整无注释代码boot.asm+简单loader.asm)
    神经网络训练结果都是1,神经网络训练效果不好
    记录Kettle连不上mysql8
    寻找数字(dfs)
    阿里架构师在GitHub上花费半年整理22年面试总结,看完横扫BATJ
    天软特色因子看板(2023.10 第12期)
    docker安装
    Android组件化架构搭建
  • 原文地址:https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/128150126
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号