配置:ubuntu16.04+gtx1080ti+cuda10.0+cudnn7.4.2/cudnn7.6.4+显卡驱动NVIDIA-Linux-x86_64-410.78
tensorflow1.13.1、tensorflow1.13.0rc2 、pytorch1.0.0、pytorch1.4.0可行
一、首先所需要下载的包:
驱动:NVIDIA-Linux-x86_64-410.78.run
cuda:cuda_10.0.130_410.48_linux.run 、cuda_10.0.130.1_linux.run 后面是补丁(下载地址:/cuda-10.0-download-archive)
cudnn:cudnn-10.0-linux-x64-v7.4.1.5.tgz(下载地址:/rdp/cudnn-archive)
注:一般去官网下载驱动,若采用ubuntu推荐的,则因为显卡驱动导致黑屏开不起机,解决方案:
1.重启
2.进入高级选项
3.resume之后进如反复登录页面,然后按Alt+Ctrl+F1进入命令行模式
4.输入账号密码
5.删掉对应驱动:
sudo apt-get purge nvidia-驱动号
sudo apt-get purge nvidia*
sudo reboot
重启后就可以进入ubuntu,重新安装对的显卡。
(参考:/hanlin_tan/article/details/49451727)
二、准备安装以上的包
2.1安装驱动之前禁用nouveau
打开终端输入:sudo gedit /etc/modprobe.d/blacklist.conf
在文件最后部分插入以下两行内容
blacklist nouveau
options nouveau modeset=0
接着
sudo update-initramfs -u
重启电脑
lsmod | grep nouveau
验证是否被禁用:无输出信息说明成功
2.2驱动安装
进入驱动包所在盘
sudo chmod a+x NVIDIA-Linux-x86_64-410.78.run
sudo ./NVIDIA-Linux-x86_64-410.78.run -no-x-check -no-nouveau-check -no-opengl-files
顺带一提, 可能会弹出Unable to find a suitable destination to install 32-bit compatibility libraries on Ubuntu 18.04 Bionic Beaver Linux的bug, 然后你需要下面三条指令
sudo dpkg --add-architecture i386
sudo apt update
sudo apt install libc6:i386
————————————————
参考:/s793223706/article/details/88370591
到了NVIDIA安装驱动的界面,选择按钮:continue installation、No、No、No、Ok。安装完毕
在终端里输入:nvidia-smi 检测安装
三、cuda10.0安装
3.1cuda包终端输入:sudo sh cuda_10.0.130_410.48_linux.run –no-opengl-files
接下来进入英文选择界面按住空格键可以快速浏览
在安装过程中选项选择:
accept #同意安装
n #不安装Driver,因为已安装驱动**(这里需要强调一下)**
y #安装CUDA Toolkit
#安装到默认目录
n #创建安装目录的软链接,不选择是因为自己去建立软连接方便cuda版本的随意切换
n #不复制Samples,因为在安装目录下有/samples
3.2添加环境变量
home文件下 ctrl+H显示隐藏文件 打开 .bashrc文件在最后添加
export LD_LIBRARY_PATH= L D L I B R A R Y P A T H : / u s r / l o c a l / c u d a / l i b 64 e x p o r t P A T H = LD_LIBRARY_PATH:/usr/local/cuda/lib64 export PATH= LDLIBRARYPATH:/usr/local/cuda/lib64exportPATH=PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
##注意现在/usr/local/下还没有cuda这个文件,需要建立软连接cuda去指向cuda-10.0
保存退出
source ~/.bashrc 保存操作
建立软连接:
#进入路径:
cd /usr/local
sudo ln -s cuda-10.0 cuda
#此时会有一个cuda软连接指向cuda-10.0
nvcc --version 检查cuda是否安装成功
cat /usr/local/cuda/version.txt
查看cuda版本
测试cuda的Samples
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
sudo ./deviceQuery
四、cudnn7.4.1安装
4.1准备好cuda相对应的cudnn文件,将文件解压得到cuda文件夹,在终端中打开cuda文件夹的位置输入以下命令:
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64/
sudo chmod a+r /usr/local/cuda-10.0/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.0/lib64/libcudnn*
4.2查看cudnn版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
到此为止,nvidia驱动、cuda10.0和cudnn全部安装成功
二至四参考:/j879159541/article/details/93590342
五、其余命令
5.1删除并更新cudnn
sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
重新进行4.1安装新的cudnn
5.2卸载驱动再装其它版本
5.2.1禁用 nouveau,参考2.1
5.2.2卸载,首先进入驱动包所在盘,记住所在盘。
进入纯命令行ctrl+alt+f1
sudo service lightdm stop
输入命令sudo ./NVIDIA-Linux-x86_64-390.59.run --uninstall 版本号自己改。
reboot
5.2.3安装显卡,参考2.2