주요 콘텐츠로 건너뛰기
지식 기술 자료

OpenVINO™ 툴킷을 사용하는 동안 모델의 FP32 형식과 비교할 때 FP16 형식에서 성능 향상이 없음

콘텐츠 형태: 유지 관리 및 성능   |   문서 ID: 000095716   |   마지막 검토일: 2023-08-01

환경

OpenVINO 2023.0 우분투 20.04 LTS 인텔(R) 코어(TM) i7-9850H CPU 인텔® UHD 그래픽 630

설명

FP16 형식은 FP32 형식의 동일한 모델과 비교할 때 더 빠른 추론을 수행할 것으로 예상됩니다. benchmark_app를 사용하여 두 포맷 모두에 대해 애플리케이션의 기본 설정으로 추론을 실행하지만, FP16 포맷 모델과 FP32 포맷 모델을 비교할 때 성능 향상(더 높은 FPS)은 없습니다.

  • $ omz_downloader --name bert-large-uncased-whole-word-masking-squad-0001
  • $ benchmark_app -m FP32/bert-large-uncased-whole-word-masking-squad-0001.xml -api async -t 5 -hint throughput -d {CPU, GPU}
  • $ benchmark_app -m FP16/bert-large-uncased-whole-word-masking-squad-0001.xml -api async -t 5 -hint throughput -d {CPU, GPU}

해결 방법

benchmark_app 사용하면서 FP32 모델을 F32 형식으로 실행하려면 선택한 장치에 -infer_precision f32추가합니다.

예를 들어:
$ benchmark_app -m intel/bert-large-uncased-whole-word-masking-squad-0001/FP32/bert-large-uncased-whole-word-masking-squad-0001.xml -d GPU -t 5 -api async -hint throughput -infer_precision f32

추가 정보

GPU 플러그인의 경우 정밀도로 실행되는 <compressed f16 OpenVINO IR 형식을 제외하고 GPU 프리미티브의 부동 소수점 정밀도는 OpenVINO IR의 작업 정밀도를 f16 기반으로 선택됩니다.
CPU 플러그인의 경우 CPU 프리미티브의 기본 부동 소수점 정밀도는 f32입니다. f16 OpenVINO™ IR을 지원하기 위해 플러그인은 내부적으로 모든 f16 값을 f32로 변환하고 모든 계산은 f32의 기본 정밀도를 사용하여 수행됩니다. 기본적으로 bfloat16 계산을 지원하는 플랫폼(AVX512_BF16 또는 AMX 확장자가 있음)에서는 성능 향상을 위해 f32 대신 bf16 유형이 자동으로 사용됩니다(실행 모드 힌트 참조).

CPU/GPU 플러그인의 데이터 타입에 대한 자세한 내용은 다음을 참조하십시오.

관련 제품

이 문서는 3개의 제품에 적용됩니다.
인텔® 제온 Phi™ 프로세서 소프트웨어 OpenVINO™ 툴킷 성능 라이브러리

부인 정보

이 페이지의 콘텐츠는 원본 영어 콘텐츠에 대한 사람 번역 및 컴퓨터 번역의 조합으로 완성되었습니다. 이 콘텐츠는 편의와 일반적인 정보 제공을 위해서만 제공되었으며, 완전하거나 정확한 것으로 간주되어서는 안 됩니다. 이 페이지의 영어 버전과 번역 사이에 모순이 있는 경우 영어 버전이 우선적으로 적용됩니다. 이 페이지의 영어 버전을 확인하십시오.

추가적 도움이 필요하십니까?

지원팀 연락처
지원팀 연락처