Driver/Library 버전 불일치로인한 nvidia-smi 오류
문제 설명
nvidia-smi 명령어가 입력 시 아래의 문구와 함께 조회가 안됩니다.
Failed to initialize NVML: Driver/library version mismatch
원인
이 현상은 부팅 시점의 드라이버 버전과 현재 로드된 라이브러리 버전이 달라 발생합니다.
- VM 내부에서 실수로 드라이버가 업데이트/설치됨
(패키지 설치 과정 중 함께 설치되는 경우 포함) - 라이브러리 버전 꼬임
- 드라이버 모듈이 제대로 로드되지 않음
해결 방법
1. 드라이버 모듈을 재로드 합니다.
#Unload modules
sudo modprobe -r nvidia_drm
sudo modprobe -r nvidia_modeset
sudo modprobe -r nvidia_uvm
sudo modprobe -r nvidia
#Load again
sudo modprobe nvidia_drm
sudo modprobe nvidia_modeset
sudo modprobe nvidia_uvm
sudo modprobe nvidia
2. 드라이버 모듈 재로드 후에도 문제 발생 시 재부팅을 진행합니다.
⚠️ 중요: VM을 포털에서 중지하는 것이 아닌, VM 내부에서
reboot하는 것은 OS만 재시작하는 것이므로 캐시 데이터는 보존됩니다.
sudo reboot