주요 콘텐츠로 건너뛰기
지식 기술 자료

정량화된 모델 형식이 INT8 대신 FP32로 남아 있는 이유는 무엇입니까?

콘텐츠 형태: 제품 정보 및 문서   |   문서 ID: 000095064   |   마지막 검토일: 2023-06-13

설명

  • FP32 정밀 포맷의 ONNX 모델을 정량화했습니다.
  • 교육 후 Quantization를 수행한 후 빈 파일 크기를 줄이기 위해 compress_model_weights 기능을 실행했습니다.
  • 모델을 컴파일하고 모델의 출력이 INT8 대신 FP32에 있음을 발견했습니다.

해결 방법

정량화 중에는 성능 측면에서 필요한 작업만 정량화되었습니다. 나머지 작업은 출력에서 FP32로 유지됩니다.

추가 정보

OpenVINO™ 저밀도 변환을 참조하십시오.

관련 제품

이 문서는 3개의 제품에 적용됩니다.
인텔® 제온 Phi™ 프로세서 소프트웨어 OpenVINO™ toolkit 성능 라이브러리

부인 정보

이 페이지의 콘텐츠는 원본 영어 콘텐츠에 대한 사람 번역 및 컴퓨터 번역의 조합으로 완성되었습니다. 이 콘텐츠는 편의와 일반적인 정보 제공을 위해서만 제공되었으며, 완전하거나 정확한 것으로 간주되어선 안 됩니다. 이 페이지의 영어 버전과 번역 간 모순이 있는 경우, 영어 버전이 우선적으로 적용됩니다. 이 페이지의 영어 버전을 확인하십시오.

추가적 도움이 필요하십니까?

지원팀 연락처
지원팀 연락처