FPGA 추론을 위한 양자화된 뉴럴 네트워크
신경망을 위한 저정밀도 양자화는 동일한 풋프린트에 대해 더 높은 처리량을 제공하거나 리소스 사용량을 줄여 AI 애플리케이션 사양을 지원합니다. 블록 부동 소수점(BFP)은 높은 다이내믹 레인지로 인해 정확도를 유지하면서 정밀도를 낮출 수 있기 때문에 이 시나리오에서 특히 유용합니다. 정확도 감소는 오픈 소스 소프트웨어를 사용하여 재교육하여 만회할 수 있습니다.
신경망을 위한 저정밀도 양자화는 동일한 풋프린트에 대해 더 높은 처리량을 제공하거나 리소스 사용량을 줄여 AI 애플리케이션 사양을 지원합니다. 블록 부동 소수점(BFP)은 높은 다이내믹 레인지로 인해 정확도를 유지하면서 정밀도를 낮출 수 있기 때문에 이 시나리오에서 특히 유용합니다. 정확도 감소는 오픈 소스 소프트웨어를 사용하여 재교육하여 만회할 수 있습니다.