Nvidia Docker安装

  1. 1 安装Nvidia驱动
    1. 1.1 Cudn
    2. 1.2 Cudnn
  2. 2. 安装Nvidia Docker
    1. 配置nvidia docker仓库
    2. 安装nvidia docker
    3. 配置docker默认runtime

nvidia-docker是能够直接在容器中使用Nvidia GPU而不需要额外的其他处理。结合k8s的插件k8s-device-plugin能够在k8s集群中使用GPU。

1 安装Nvidia驱动

1.1 Cudn

通常情况下cudn中已经包含了driver。

1.2 Cudnn

注意:cudnn需要注册nvidia账号

https://developer.nvidia.com/rdp/cudnn-download

下载安装时注意Cudn的版本

2. 安装Nvidia Docker

nvidia-docker是能够直接在容器中使用Nvidia GPU而不需要额外的其他处理。结合k8s的插件k8s-device-plugin能够在k8s集群中使用GPU。

nvidia-docker官方安装说明 https://github.com/NVIDIA/nvidia-docker。

配置nvidia docker仓库

  • 追加nvidia docker官方的gpg密钥

      curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
      sudo apt-key add -
  • 追加nvidia docker仓库

      distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
      curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
      sudo tee /etc/apt/sources.list.d/nvidia-docker.list

安装nvidia docker

  • 更新apt包目录

      sudo apt-get update
  • 安装最新版本的nvidia docker

      sudo apt-get install -y nvidia-docker2
      sudo pkill -SIGHUP dockerd
  • 验证安装

      docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi

    如果正常输出则说明安装成功

      +-----------------------------------------------------------------------------+
      | NVIDIA-SMI 418.40.04    Driver Version: 418.40.04    CUDA Version: 10.1     |
      |-------------------------------+----------------------+----------------------+
      | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
      | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
      |===============================+======================+======================|
      |   0  GeForce GTX 1060    On   | 00000000:01:00.0 Off |                  N/A |
      | N/A   50C    P5     6W /  N/A |    901MiB /  6078MiB |      3%      Default |
      +-------------------------------+----------------------+----------------------+
      +-----------------------------------------------------------------------------+
      | Processes:                                                       GPU Memory |
      |  GPU       PID   Type   Process name                             Usage      |
      |=============================================================================|
      +-----------------------------------------------------------------------------+

配置docker默认runtime

nvidia docker安装时会覆盖/etc/docker/daemon.json,为私有镜像库修改的配置将会被覆盖掉,所以需要追加私有镜像库配置。
为了能够让nvidia docker默认运行,需要设置docker的runtime为nvidia。

最终配置:(其中runtimes以实际为准)

{
    "default-runtime": "nvidia",
    "runtimes": {
        "nvidia": {
            "path": "/usr/bin/nvidia-container-runtime",
            "runtimeArgs": []
        }
    },
    "insecure-registries": [
        "192.168.1.192:5000","dev.teamx.work"
    ]
}

转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 wind.kaisa@gmail.com

文章标题:Nvidia Docker安装

本文作者:kaisawind

发布时间:2019-04-24, 08:57:44

最后更新:2020-12-01, 10:28:14

原始链接:https://kaisawind.gitee.io/2019/04/24/2019-04-24-nvidia-docker/

版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。

目录
×

喜欢就点赞,疼爱就打赏