주요 콘텐츠로 건너뛰기
지원 지식 베이스

GPU에 대한 모델 로드 시간이 CPU보다 긴 이유는 무엇입니까?

콘텐츠 유형: 유지 관리 및 성능   |   문서 ID: 000057525   |   최종 검토: 2026-03-05

환경

OpenVINO™ 툴킷 GPU 플러그인 CPU 플러그인

설명

입력 모델의 중간 표현(IR)을 GPU에 로드하는 것은 동일한 모델을 CPU에 로드하는 것보다 시간이 더 오래 걸립니다.

해결 방법

응용 프로그램의 작업 디렉터리에 cl_cache 디렉터리를 수동으로 만듭니다.

드라이버는 이 디렉터리를 사용하여 컴파일된 커널의 이진 표현을 저장합니다. 이는 지원되는 모든 OS에서 작동합니다.

또는 환경 변수를 설정합니다.

export INTEL_OPENCL_CACHE=1

추가 정보

대기 시간을 최적화하려면 Model Caching 개요에 대한 이 문서를 참조하십시오.

GPU 스택은 OpenCL*을 기반으로 하기 때문에 IR(Intermediate Representation) 형식의 입력 모델을 GPU에 로드하는 것은 동일한 모델을 CPU에 로드하는 것보다 시간이 더 오래 걸립니다. 로드 시간은 OpenCL* 커널의 컴파일 시간에 따라 다릅니다.

cl_cache 활성화하면 모델을 처음 로드할 때 OpenCL* 커널이 컴파일되기 때문에 시간이 오래 걸립니다. 그러나 동일한 모델의 각 후속 로드는 훨씬 빠릅니다.

OpenVINO™ 2026.0의 프로그래밍 방식 캐시 구성:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})

관련 정보

OpenVINO™ 2026.0 GPU 플러그인 문서

관련 제품

이 문서는 1개의 제품에 적용됩니다.

부인 정보

이 페이지의 콘텐츠는 원본 영어 콘텐츠에 대한 사람 번역 및 컴퓨터 번역의 조합으로 완성되었습니다. 이 콘텐츠는 편의와 일반적인 정보 제공을 위해서만 제공되었으며, 완전하거나 정확한 것으로 간주되어선 안 됩니다. 이 페이지의 영어 버전과 번역 간 모순이 있는 경우, 영어 버전이 우선적으로 적용됩니다. 이 페이지의 영어 버전을 확인하십시오.

추가적인 도움이 필요하십니까?

지원팀 문의
지원팀 문의