在开始之前,请确保您已经为您的 Linux 发行版安装了 NVIDIA 驱动程序。
同时要满足:
1.内核版本 > 3.10 的 GNU/Linux x86_64。
2.Docker >= 19.03(推荐,但某些发行版可能包含旧版本的 Docker。支持的最低版本为 1.12)。
3.架构 >= Kepler(或计算能力 3.0)的 NVIDIA GPU(即9系显卡及以上)。
4.NVIDIA Linux 驱动程序>= 418.81.07(请注意,不支持较旧的驱动程序版本或分支。)。
curl https://get.docker.com | sh \
&& sudo systemctl --now enable docker

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
不报错即为成功:

更新包列表后安装nvidia-docker2包(和依赖项):
sudo apt-get update
sudo apt-get install -y nvidia-docker2
设置默认运行时后重启 Docker 守护进程完成安装:
sudo systemctl restart docker
通过运行基本 CUDA 容器来测试工作设置:
sudo docker run --rm --gpus all nvidia/cuda:11.0.3-base-ubuntu20.04 nvidia-smi
sudo docker run --gpus all -it --rm -p 8888:8888 -v ~:/workspace \
--ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \
nvcr.io/nvidia/pytorch:22.07-py3
大概需要下载6个G的包,下载完后会自动进入docker的环境中:
