文章目录
一、安装Nvidia显卡驱动1.1 添加 ELRepo 源:1.2 删除已安装的驱动,如果是之前没有安装过显卡驱动的这步可以跳过1.3 安装显卡检查程序:1.4 检测显卡型号,并选择对应的驱动:1.5 Nvidia官网下载对应显卡驱动1.6 将 nouveau 驱动禁用1.7 安装Nvidia显卡驱动二、安装CUDA2.1 查看适合该显卡的CUDA版本,由上面的nvidia-smi命令得到的`CUDA Version:11.2`2.2 去[CUDA官网](/cuda-toolkit-archive)下载对应版本2.3 复制链接,使用`wget`下载:2.4 安装CUDA三、CuDNN3.1 查看CUDA版本3.2 [cuDNN官网下载](/rdp/cudnn-download)3.3 下载完成后,进行解压,进入解压好的文件夹中3.4 使用指令进行对应文件的复制即可3.5 最后验证下四. Anaconda一、安装Nvidia显卡驱动
1.1 添加 ELRepo 源:
elrepo是CentOS十分有用的稳定的软件源,与其他软件源不一样的是,这个第三方源主要是提供硬件驱动、内核更新方面的支持,如显卡、无线网卡、内核等等,现在已经支持centos7.x+,更新较快。
添加 ELRepo 源:$ sudo rpm --import /RPM-GPG-KEY-$ sudo rpm -Uvh /elrepo-release-7.0-2.el7.elrepo.noarch.rpm
1.2 删除已安装的驱动,如果是之前没有安装过显卡驱动的这步可以跳过
$ sudo yum remove nvidia*
1.3 安装显卡检查程序:
$ sudo yum install nvidia-detect
1.4 检测显卡型号,并选择对应的驱动:
$ nvidia-detect -vProbing for supported NVIDIA devices...[10de:1c03] NVIDIA Corporation GP106 [GeForce GTX 1060 6GB]This device requires the current 440.64 NVIDIA driver kmod-nvidia
根据 nvidia-detect 的输出信息,可以知道显卡的型号,以及要使用的驱动版本 460.39。
安装显卡驱动
若驱动版本为 460.xx,则安装 460xx 版本:
1.5 Nvidia官网下载对应显卡驱动
1、去到 Nvidia显卡驱动官网 ,选择匹配你的显卡的驱动。
《CentOS安装TeslaV100显卡驱动》:https://blog.90.vc/archives/507.
2、看到适合自己的版本就可以下载,因为我选择的版本是 460.30,点击 【下载】
3、进入详情页,再次点击下载
4、待安装包下载好,官方下载的是 .run 版本的,用此安装包进行安装
安装过程中可能报错:
Verifying archive integrity…
Error in check sums 3466312881 624779739(md5验证不一致,可能是下载的文件有问题
)
解决:用wget下载到指定文件夹
$ wget https://cn./XFree86/Linux-x86_64/460.39/NVIDIA-Linux-x86_64-460.39.run /home/jimmy2/package
1.6 将 nouveau 驱动禁用
首先说明下什么是Nouveau,为什么有些系统安装N卡驱动的时候会提示之类的错误:
ERROR: The Nouveau kernel driver is currently in use by your system. Thisdriver is incompatible with the NVIDIA driver……
Nouveau是由第三方为NVIDIA显卡开发的一个开源3D驱动,也没能得到NVIDIA的认可与支持。
使用命令打开配置文件/lib/modprobe.d/dist-blacklist.conf
$ vim /lib/modprobe.d/dist-blacklist.conf
1、注释掉 #blacklist nvidiafb
2、然后添加以下语句:
blacklist nouveau
options nouveau modeset=0
3、重建initramfs image步骤
$ mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak$ dracut /boot/initramfs-$(uname -r).img $(uname -r)
4、重启系统
重启之后,屏幕分辨率会变得很低,那是因为我们禁用nouveau显卡驱动的缘故,在成功安装Nvidia显卡驱动后,这个问题自然会得到解决。
5、查看nouveau是否已经禁用
$ lsmod|grep nouveau
如果没有显示相关的内容,说明已禁用。
1.7 安装Nvidia显卡驱动
1、查看【 显示操作系统的发行版号】
$ uname -r3.10.0-1160.15.2.el7.x86_64
2、获取 kernel source命令:
注意:命令中的x.x.x-x
是刚刚使用uname -r
得出来的, 我的指令是 yum install linux-headers-3.10.0-1160-generic
yum install linux-headers-3.10.0-1160-generic
3、给驱动增加执行权限,否则无法安装
$ chmod a+x NVIDIA-Linux-x86_64-460.39.run
4、安装驱动
$ ./NVIDIA-Linux-x86_64-460.39.run -no-x-check -no-nouveau-check -no-opengl-files
命令解析:
-no-x-check
:安装驱动时关闭X服务-no-nouveau-check
:安装驱动时禁用nouveau-no-opengl-files
:只安装驱动文件,不安装OpenGL文件, 只有禁用OpenGL这样安装才不会出现循环登陆的问题
Install NVIDIA's 32-bit compatibility libraries?
选择No
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
,选择Yes
5、检查驱动是否安装成功
nvidia-smi 和 lspci |grep NVIDIA
输出如下就表明安装成功:
6、重启reboot
二、安装CUDA
2.1 查看适合该显卡的CUDA版本,由上面的nvidia-smi命令得到的CUDA Version:11.2
2.2 去CUDA官网下载对应版本
2.3 复制链接,使用wget
下载:
1)选择对应版本的cuda,我这里选择的是11.2
,然后进入配置界面:Linux,X86_64,CentOS,7,runfile(local)
.
复制最下方的两行下载
和安装
命令
2)下载CUDA软件包并保存到指定文件夹,我这里是/home/jimmy2/package
wget https://developer./compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run /home/jimmy2/package
也可以将下载链接拷贝到下载软件中下载
2.4 安装CUDA
用sh命令安装CUDA
sudo sh cuda_11.2.0_460.27.04_linux.run
1)出现一个文档,输入accept
2)取消选中Driver
,已经安装了显卡驱动之后,这里会导致冲突报错,一定要取消!
3)确认无误之后,选择Install
4)等待一段时间,会弹出这个警告信息,其出现的原因是因为刚刚没有选择安装 Driver ,我们事先安装好了显卡的 Driver,这里友好提示,忽略即可
5)添加环境变量
vim ~/.bashrc
6) 在.bashrc
文件最后写入并保存:
export PATH=/usr/local/cuda-10.2/bin:$PATHexport LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.2/lib64
source ~/.bashrc
8)测试 CUDA 命令,显示如下证明成功!
cat /proc/driver/nvidia/versionnvcc -V
三、CuDNN
3.1 查看CUDA版本
nvcc -V
3.2 cuDNN官网下载
选择适配 CNDA 版本的 cuDNN版本 进行下载;
3.3 下载完成后,进行解压,进入解压好的文件夹中
解压参考
《在centos7.5中解压.tgz》
3.4 使用指令进行对应文件的复制即可
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.2/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.2/lib64/ sudo chmod a+r /usr/local/cuda-10.2/include/cudnn.h sudo chmod a+r /usr/local/cuda-10.2/lib64/libcudnn*
(安装cuDNN
sudo rpm -ivh libcudnn7-7.4.2.24-1.cuda9.0.x86_64.rpmsudo rpm -ivh libcudnn7-devel-7.4.2.24-1.cuda9.0.x86_64.rpmsudo rpm -ivh libcudnn7-doc-7.4.2.24-1.cuda9.0.x86_64.rpm
然后测试
cdcd cudnn_samples_v7/mnistCUDNN/sudo make cleansudo make./mnistCUDNN)
3.5 最后验证下
cat /usr/local/cuda-10.2/include/cudnn.h | grep CUDNN_MAJOR -A 2
四. Anaconda
4.1 进入Anaconda官网.进行下载,在导航栏选择合适的版本进行下载
4.2 拉到下面可以看到下载的链接
4.3 如果你想下载旧版本的 Anaconda,可以到 清华大学开源软件镜像站 进行下载:
4.4 下载好后,进行安装
bash Anaconda3-.11-Linux-x86_64.sh
4.5 一直Eneter
到底就行了,最后需要输入yes
4.6 可以选择安装的路径,如果安装到默认位置直接Enter
,如果需要指定填入绝对路径即可
注意:
默认路径是/root路径,这里是安装在指定路径/usr/local/anaconda3,并把该路径的权限分配给其他用户)
4.7Do you wish the installer to initialize Anaconda3 by running conda init?
是询问是否加入环境变量,写yes
即可
4.8 安装完成!
4.9 关闭终端重开一个,可以看到进入了base
环境, 输入conda --version
测试,打印出版本号即表明安装成功!
4.10 添加环境变量, 打开~/.bashrc
文件
vim ~/.bashrc
4.11 输入,并保存
export PATH="/usr/local/anaconda3/bin:$PATH"
4.12source
一下
source ~/.bashrc
感谢以下文章:
《Ubuntu18.04 安装Nvidia驱动+CUDA+cuDNN+Anaconda3(图文超详细)》
《centos7安装NVIDIA driver,cuda,cudnn,anaconda》.