Google Kubernetes에서 gpu pool을 사용할 일이 생겨서 클러스터를 새로 생성하는 와중에 nvidia의 드라이버 버전을 최신버전(418)을
써야하는 이슈가 생겼다. (ffmpeg에서 gpu를 써야하는 상황이였는데 cuda버전이 10.1이였어야 했다.)
구글 gpu 문서(https://cloud.google.com/kubernetes-engine/docs/how-to/gpus#installing_drivers)를
보고 따라했지만 nvidia-smi 명령어를 쳐보니 410버전에 cuda 10.0 버전이여서 버전을 변경할 필요가 있어서
DaemonSet을 재설정해서 포드가 생성될때 인젝션 되는 nvidia driver version을 직접 설정해주었다.
기존 DaemonSet
cos-nvidia-installer를 직접 까보면 entrypoint.sh에 nvidia version이 따로 명시되어 있어서 해당 버전만 바꿔주면 된다.
cos-gpu-installer-docker/entrypoint.sh에서 NVIDIA_DRIVER_VERSION="${NVIDIA_DRIVER_VERSION:-410.79}" 해당 부분을
NVIDIA_DRIVER_VERSION="${NVIDIA_DRIVER_VERSION:-418.40.04}"로 변경한다.
해당 cos-gpu-installer/cos-gpu-installer-docker 폴더에서 아래 커멘드를 실행해서 이미지를 gcp에 업로드한다.