문서 ID: 000057525 콘텐츠 형태: 유지 관리 및 성능 마지막 검토일: 2023-01-31

GPU에 대한 모델 로드 시간이 CPU보다 길어지는 이유는 무엇입니까?

환경

OpenVINO™ 툴킷 GPU 플러그인 CPU 플러그인

BUILT IN - ARTICLE INTRO SECOND COMPONENT
요약

GPU에서 모델 로드 시간을 개선하기 위한 빠른 단계

설명

입력 모델의 중간 표현(IR)을 GPU에 로드하는 데는 동일한 모델을 CPU에 로드하는 것보다 더 오래 걸립니다.

해결 방법

응용 프로그램의 작업 디렉토리에서 수동으로 cl_cache 디렉토리를 생성합니다.

드라이버는 이 디렉토리를 사용하여 컴파일된 커널의 바이너리 표현을 저장합니다. 이 작업은 지원되는 모든 OSes에서 작동합니다.

추가 정보

cl_cache 관리에 대한 자세한 내용은  문서를 참조하십시오.

GPU 스택이 OpenCL*을 기반으로 하므로 입력 모델을 중간 표현(IR) 형식으로 GPU에 로드하는 데는 동일한 모델을 CPU에 로드하는 것보다 더 오래 걸립니다. 로드 시간은 OpenCL* 커널의 컴파일 시간에 따라 달라집니다.

cl_cache 활성화하면 OpenCL* 커널이 컴파일되기 때문에 모델을 처음 로드하는 데는 여전히 오랜 시간이 소요됩니다. 그러나 동일한 모델의 각 후속 로드는 훨씬 빨라집니다.

관련 제품

이 문서는 다음 항목에 적용됩니다. 2 제품

이 페이지의 콘텐츠는 원본 영어 콘텐츠에 대한 사람 번역 및 컴퓨터 번역의 조합으로 완성되었습니다. 이 콘텐츠는 편의와 일반적인 정보 제공을 위해서만 제공되었으며, 완전하거나 정확한 것으로 간주되어선 안 됩니다. 이 페이지의 영어 버전과 번역 간 모순이 있는 경우, 영어 버전이 우선적으로 적용됩니다. 이 페이지의 영어 버전을 확인하십시오.