🔥알림🔥
① 테디노트 유튜브 - 구경하러 가기!
② LangChain 한국어 튜토리얼 바로가기 👀
③ 랭체인 노트 무료 전자책(wikidocs) 바로가기 🙌

1 분 소요

Ubuntu 18.04 환경을 기준으로 CUDA 10.2 에서 CUDA 10.0으로 clean 삭제 후 재설치 하는 과정에 대한 내용입니다.

먼저, 삭제 후 재설치를 진행하는 이유는 Tensorflow-gpu가 아직 CUDA 10.2를 지원하지 않기 때문입니다. 그렇기 때문에, keras의 gpu 지원을 못받기 때문에 CUDA 10.0으로 downgrade를 진행하였습니다.

결론부터 말씀드리자면, Ubuntu 18.04 환경에서 CUDA 10.0으로 재설치 후 TensorFlow, Keras의 GPU 지원을 확인하였을 뿐만아니라, PyTorch의 GPU 지원도 확인하였습니다.

본 가이드는 TensorFlow 공식웹사이트의 설치 가이드를 참조하였습니다.

(This post is written with a reference of official website’s installation guide)

공식웹사이트 설치가이드(official website guide)

설치 환경

  • Ubuntu 18.04.3 (Bionic Beaver)

STEP 1. 기존에 설치된 CUDA 제거

sudo apt-get purge nvidia* && sudo apt-get autoremove && sudo apt-get autoclean && sudo rm -rf /usr/local/cuda*

STEP 2. REBOOT

sudo reboot now

STEP 3. Add NVIDIA Package repositories

# Add NVIDIA package repositories
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update

STEP 4. Install NVIDIA driver

sudo apt-get install --no-install-recommends nvidia-driver-418

STEP 5. REBOOT

sudo reboot now

STEP 6. Install Runtime & Development Libraries (cuDNN)

sudo apt-get install --no-install-recommends cuda-10-0 libcudnn7=7.6.2.24-1+cuda10.0 libcudnn7-dev=7.6.2.24-1+cuda10.0

STEP 7. Install TensorRT

sudo apt-get install -y --no-install-recommends libnvinfer5=5.1.5-1+cuda10.0 libnvinfer-dev=5.1.5-1+cuda10.0

Reboot 후 설치 된 NVIDIA driver 확인

# 설치된 nvidia-smi
nvidia-smi

참고로, 저의 경우에는 nvidia-smi를 입력해도 자꾸 CUDA 10.2 버젼이 잡혀 있어서, /usr/local/에 위치한 cuda의 버젼을 다시 체크해 보았습니다. 그런데, 해당 위치에는 cuda 10.0이 잘 설치되어 있음을 확인 하였고 symbolic link도 정상적으로 걸려있어서 일단, 그냥 무시하였습니다.

아래의 명령어로 진짜 잡혀있는 cuda의 버젼을 한 번 더 체크해 보시기 바랍니다.

# nvcc로 cuda의 버전체크
nvcc --version

혹시 ~/.bashrc에 잡혀있는 cuda path도 꼭 체크하셔서 변경해주시기 바랍니다.

GPU 정상 동작 체크하기

GPU 정상 동작을 체크하는 내용은 아래 포스팅에서 확인하실 수 있습니다.

Tensorflow, Keras, Pytorch GPU 사용여부 체크하기

댓글남기기