メインコンテンツまでスキップ

Driver/Library 버전 불일치로인한 nvidia-smi 오류

문제 설명

nvidia-smi 명령어가 입력 시 아래의 문구와 함께 조회가 안됩니다.
Failed to initialize NVML: Driver/library version mismatch

원인

이 현상은 부팅 시점의 드라이버 버전과 현재 로드된 라이브러리 버전이 달라 발생합니다.

  • VM 내부에서 실수로 드라이버가 업데이트/설치됨
    (패키지 설치 과정 중 함께 설치되는 경우 포함)
  • 라이브러리 버전 꼬임
  • 드라이버 모듈이 제대로 로드되지 않음

해결 방법

1. 드라이버 모듈을 재로드 합니다.

#Unload modules
sudo modprobe -r nvidia_drm
sudo modprobe -r nvidia_modeset
sudo modprobe -r nvidia_uvm
sudo modprobe -r nvidia

#Load again
sudo modprobe nvidia_drm
sudo modprobe nvidia_modeset
sudo modprobe nvidia_uvm
sudo modprobe nvidia

2. 드라이버 모듈 재로드 후에도 문제 발생 시 재부팅을 진행합니다.

⚠️ 중요: VM을 포털에서 중지하는 것이 아닌, VM 내부에서 reboot 하는 것은 OS만 재시작하는 것이므로 캐시 데이터는 보존됩니다.

sudo reboot