实验室配了2080ti,下面分享一下深度学习环境的搭建。在进行下面的操作前最好先安装好ssh,如果在安装驱动时出现循环登录的问题,还可以在另外的电脑上进行补救,配置过程也方便些。
该系统已经正常良好的运行了一个星期!!
一 、安装nvidia驱动,再此我选择的是nvidia-driver-410驱动,最新的驱动是418,为了避免不必要的麻烦,我没有安装最新的驱动。
1下载驱动
/drivers/beta-legacy 在这个界面选择你的显卡以及系统
2下载好的安装包一般会在Dowonload文件夹下,打开终端界面
(1)删除原有的驱动:sudo apt-get remove --purge nvidia*
(2)禁用nouveau,删除原来自带的驱动
打开文件:sudo gedit /etc/modprobe.d/blacklist.conf
在文本最后添加下面的两个语句:
blacklist nouveau
options nouveau modeset=0
保存后退出,执行:sudo update-initramfs -u 。
禁用图形界面服务:
sudo service lightdm stop
输入命令:reboot (重启)
重启后输入命令: lsmod | grep nouveau ,没有任何输出代表禁用成功。
3安装nvidia驱动
这个过程最后在是另外一台电脑,通过ssh远程安装。
去到你存放文件的路径,一般默认是在Download文件夹下:cd ~/download/
可以输入 ls 回车,查看该文件夹下的文件
赋予文件执行权限:sudo chmod a+x NVIDIA-Linux-x86_64-410.78.run
执行安装文件:sudo ./NVIDIA-Linux-x86_64-410.78.run
最后查看是否已经安装好了:nvidia-smi (如果没有显示可以重启下)
实时查看指令:watch -n 1 nvidia-smi (以后会用到)
重新启动图形界面:sudo service lightdm start
二、安装cuda 9.0
1.下载文件
官网地址:/cuda-90-download-archive 选择适合自己的版本
2.安装
cd Download (进入存储路径下,如果存储路径有变,修改)
sudo bash ××.run (××为cuda安装文件)
不断回车后,或者直接输入q,会询问你是否接受刚刚看的协议,输入:accept
第一个问题是询问你是否需要安装nvidia驱动,我们已经装了,所以这里输入:n
其它选项输入y, 安装路径回车默认就可以
3.安装成功后,添加环境变量
sudo gedit ~/.bashrc 在文件的最后添加下面的代码
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-9.0
export PATH=/usr/local/cuda-9.0/bin:$PATH
保存退出,后执行:source ~./bashrc
4.在终端输入:nvcc --version 查看CUDA版本信息
如此显示,就安装好了
三 安装cudnn7.3
1.下载文件 这里需要注册一个账号才能下载,也可以用微信登录
在Download 目录下解压下载好的cudnn文件 tar zxvf simple-examples.tgz
2. 将制定的文件复制到cuda的制定目录下:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
3.查看cudnn版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
如上图显示,则成功
四、安装anaconda3.6
清华大学开源软件镜像站:https://mirrors.tuna./anaconda/archive/
在这里可以找到anaconda所有的版本,我们要下载 Anaconda3-4.3.1-Linux-x86_64.sh 文件
下载完成后,进入存储文件,在终端输入:bash Anaconda3-4.3.1-Linux-x86_64.sh
第一个选项输入 :yes
安装完成后,会询问你是添加环境变量,输入yes
如果手速太快,输入: sudo gedit ~/.bashrc
在文件最后输入:
# added by Anaconda3 4.3.1 installer
export PATH="/home/zhangyu/anaconda3/bin:$PATH"
保存后,执行:source ~/.bashrc
至此anaconda安装成功
在终端输入:spyder,既可打开spyder界面
五、安装tensorlow-gpu版本
在安装完成anaconda后,打开终端,输入 pip install tensorflow-gpu==1.12.0
等待安装完成后,在终端输入:python
再输入import tensorflow
如果没有报错,环境即配置成功。
我另外谢了一篇通过邮箱监控gpu温度的文章,有需要的可以参考下:
/u012236671/article/details/89370796
至此所有工作都已经完成,在准备以上工作前,最好先更换国内阿里源。
如果有疑问可以通过zhangyu_guanggong@ 联系我。