주요 콘텐츠로 건너뛰기
지식 기술 자료

GPU에 대한 모델 로드 시간이 CPU보다 길어지는 이유는 무엇입니까?

콘텐츠 형태: 유지 관리 및 성능   |   문서 ID: 000057525   |   마지막 검토일: 2023-01-31

환경

OpenVINO™ 툴킷 GPU 플러그인 CPU 플러그인

설명

입력 모델의 중간 표현(IR)을 GPU에 로드하는 데는 동일한 모델을 CPU에 로드하는 것보다 더 오래 걸립니다.

해결 방법

응용 프로그램의 작업 디렉토리에서 수동으로 cl_cache 디렉토리를 생성합니다.

드라이버는 이 디렉토리를 사용하여 컴파일된 커널의 바이너리 표현을 저장합니다. 이 작업은 지원되는 모든 OSes에서 작동합니다.

추가 정보

cl_cache 관리에 대한 자세한 내용은  문서를 참조하십시오.

GPU 스택이 OpenCL*을 기반으로 하므로 입력 모델을 중간 표현(IR) 형식으로 GPU에 로드하는 데는 동일한 모델을 CPU에 로드하는 것보다 더 오래 걸립니다. 로드 시간은 OpenCL* 커널의 컴파일 시간에 따라 달라집니다.

cl_cache 활성화하면 OpenCL* 커널이 컴파일되기 때문에 모델을 처음 로드하는 데는 여전히 오랜 시간이 소요됩니다. 그러나 동일한 모델의 각 후속 로드는 훨씬 빨라집니다.

관련 제품

이 문서는 4개의 제품에 적용됩니다.
인텔® 제온 Phi™ 프로세서 소프트웨어 OpenVINO™ toolkit 성능 라이브러리

단종된 제품

인텔® 에지용 DevCloud

부인 정보

이 페이지의 콘텐츠는 원본 영어 콘텐츠에 대한 사람 번역 및 컴퓨터 번역의 조합으로 완성되었습니다. 이 콘텐츠는 편의와 일반적인 정보 제공을 위해서만 제공되었으며, 완전하거나 정확한 것으로 간주되어선 안 됩니다. 이 페이지의 영어 버전과 번역 간 모순이 있는 경우, 영어 버전이 우선적으로 적용됩니다. 이 페이지의 영어 버전을 확인하십시오.

추가적 도움이 필요하십니까?

지원팀 연락처
지원팀 연락처