当安装 cuda 时,需要我们需要安装NVIDIA driver, driver 用来支撑cuda 库的调用,在满足官方文档(见 Table1)对于cuda 版本对于driver版本的要求情况下,装了之后会出现登陆不进去的情况。driver 可以用来支持cuda 调用,但不一定用来支持显示,默认安装时会安装,NVIDIA 的 opengl 库,这个库是用来支持显示的库,它会屏蔽掉系统本来的库,这时就会出现不兼容的情况。此时我们可以在安装 driver 的时候用no-opengl-files 来避免安装 NVIDIA 的opengl 库。
具体操作如下,如果已经安装了 NVIDIA的 driver, 运行
> sudo apt remove --purge nvidia*
卸载 NVIDIA 驱动, 然后再进入 runlevel3 模式, 同时用
> sudo service lightdm stop
关掉 lightdm, 然后再安装 NVIDIA, 同时加上 --no-opengl-files
> sudo NVIDIA-Linux-x86_64-xxx.xx.run --no-opengl-files
参考文献:
1/cuda/cuda-toolkit-release-notes/index.html
2/cuda/cuda-installation-guide-linux/index.html#removing-cuda-tk-and-driver