Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)

387
0
2020年8月3日 09时52分

修正:Ubuntu 18.04+RTX2080Ti建议安装cuda10.0,cudnn7.5.1,pytorch1.4.0+cu100 / torchvision0.5.0+cu100,tensorflow-gpu1.14.0
修正日期:20200611

 

安装方式与下文描述类似,只要选择上面的版本安装即可


一、安装cuda(准备工作

1、检查Linux版本是否支持CUDA
Ubuntu18.04 + RTX2080ti 支持

 

2、检查系统是否安装gcc

gcc --version

 

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图

 

3、 检查是否安装了kernel header和 package development

 

在终端中输入: uname -r 可以查看自己的kernel版本信息
在终端中输入: sudo apt-get install linux-headers-$(uname -r)
可以安装对应kernel版本的kernel headerpackage development

 

4、运行nvidia-smi 查看现有驱动支持的cuda版本

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(1)

 

(重要)根据上述运行结果查看driver version和CUDA Version的版本。此外,如果需要安装pytorch或者tensorflow,可登陆pytorch官网进行查看当前pytorch支持的cuda的版本,根据对应的版本下载pytorch。

 

5、下载官网run文件:cuda官网

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(2)

下载完成后,继续下一步。

 

6、runfile安装

A) 禁用 nouveau
终端中运行: lsmod | grep nouveau,如果有输出则代表nouveau正在加载。
因为我早就安装了NVIDIA的显卡驱动,禁用了nouveau,所以没有输出。

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(3)

 

B) 切换到.run安装文件的路径,运行
sudo sh cuda_10.1.105_418.39_linux.run (10.2版本类似)!

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(4)

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(5)

注意:不安装driver,否则重启之后电脑一直蓝屏(踩坑)。

 

7、设置环境变量

 

终端输入:sudo gedit /etc/profile,输密码后进入,打开文件末尾,加入以下两行后保存。(10.2版本类似)

export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda10.1/lib64 

1)在终端输入sudo gedit ~/.bashrc

2)在文本的最后输入

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export PATH=$PATH:/usr/local/cuda-10.1.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1

 

目录要对应自己的cuda版本
3)然后source ~/.bashrc 激活环境

4)在终端输入nvcc -V出现下面画面则安装成功

!blog.csdnimg.cn/20200528154419611.png

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(6)

(图片参考:https://blog.csdn.net/hou9021/article/details/104311088)


重启:sudo reboot
开始测试cuda是否安装成功:
命令如下:

cd /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

 

最后结果显示,如下:

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(7)

(图片参考:https://blog.51cto.com/14204744/2464180?source=dra)

 

有些地方可能会不一样,只要最后是Result = PASS就代表这cuda10.1安装成功了。


CUDA卸载:

cd /usr/local/cuda/bin
sudo ./cuda-uninstaller

CUDNN安装

安装cuDNN 7.6.5版本,转到官网下载,下载前先注册一下,填个调查问卷,根据自己的环境和架构选择包,下载到本地。

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(8)

注意:具体的版本请参照官网,只需要与cuda的版本对应即可

 

切换到下载目录 cd Downloads ,然后按照以下操作进行,

 

解压: cuDNN Library for Linux
输入: tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz

 

将解压出来的文件复制到安装的CUDA环境中,输入:

sudo cp cuda/include/cudnn.h /usr/local/cuda/inlude
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64  

 

更改权限,输入:

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*  

 

注意:如果系统提示找不到cudnn.h,可复制cuda/include/cudnn.h/usr/local/cuda/include/目录下

 

安装PyTorch1.3

进入PyTorch官网安装合适的版本。

 

输入: pip3 install torch torchvision ,等待安装结束(现在官网最新版本为1.5)

 

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(9)

 

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(10)

 

安装完成后,进入python3环境,验证是否成功。

输入: python3

再输入:

import torch
import torchvision

 

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(11)

 

没有报错,说明安装成功。

 

最后验证下GPU能否使用,输入: print(torch.cuda.is_available()) ,输出True,说明没问题。

 

Ubuntu 18.04+RTX2080Ti+CUDA10.1+CUDNN7.6.5+Pytorch1.3环境部署(详细教程)插图(12)

 

参考文章:https://www.cnblogs.com/booturbo/archive/2019/11/11/11834661.html

 

 

发表评论

后才能评论