PyTorch CUDA 호환성 문제
개요
GPU 가상머신에서 nvidia-smi는 정상 동작하지만 PyTorch에서 GPU를 인식하지 못하는 경우가 있습니다. 원인은 크게 두 가지입니다.
- PyTorch-CUDA 버전 불일치: 설치된 PyTorch가 요구하는 CUDA 버전이 가상머신 드라이버보다 높음
- CUDA 드라이버 초기화 실패 (Error 802):
nvidia-smi는 정상이지만 CUDA runtime이 초기화되지 않음
GPU 가상머신에서 nvidia-smi는 정상 동작하지만 PyTorch에서 GPU를 인식하지 못하는 경우가 있습니다. 원인은 크게 두 가지입니다.
nvidia-smi는 정상이지만 CUDA runtime이 초기화되지 않음