문서 ID: 000073889 콘텐츠 형태: 문제 해결 마지막 검토일: 2019-06-20

OpenCL™용 인텔® FPGA SDK로 벡터 추가 예제 디자인을 컴파일할 때 성능이 저하되는 이유는 무엇입니까?

환경

  • 인텔® Quartus® Prime Pro Edition
  • OpenCL™용 인텔® FPGA SDK
  • BUILT IN - ARTICLE INTRO SECOND COMPONENT
    설명

    인텔® FPGA SDK for OpenCL™ 버전 18.1 이상의 문제로 인해 동일한 vector_add 예제 디자인 코드를 컴파일할 때 성능이 저하될 수 있습니다. 성능은 다음과 같습니다.

    인텔® FPGA SDK for OpenCL™ 버전

    성능

    V16.1 버전

    V18.0 버전

    V18.1 버전

    V19.1 버전

    ~3밀리세컨드

    ~3밀리세컨드

    ~170밀리세컨드

    ~170밀리세컨드

    해결 방법

    이 문제를 해결하려면 필요한 작업 그룹 크기를 설정하는 vector_add.cl 특성을 추가하십시오.

    __attribute__((reqd_work_group_size(1, 1, 1)))
    __kernel void vector_add(__global const float *x,
    __global const float *y,
    __global float *z 제한)
    {
    작업 항목의 인덱스 가져오기
    int 인덱스 = get_global_id(0);
    벡터 요소 추가
    z[인덱스] = x[인덱스] y[인덱스];
    }

    이 문제는 OpenCL™용 인텔® FPGA SDK의 향후 릴리스에서 수정될 예정입니다.

    관련 제품

    이 문서는 다음 항목에 적용됩니다. 2 제품

    인텔® Arria® 10 FPGA 및 SoC FPGA
    인텔® Stratix® 10 FPGA 및 SoC FPGA

    이 페이지의 콘텐츠는 원본 영어 콘텐츠에 대한 사람 번역 및 컴퓨터 번역의 조합으로 완성되었습니다. 이 콘텐츠는 편의와 일반적인 정보 제공을 위해서만 제공되었으며, 완전하거나 정확한 것으로 간주되어선 안 됩니다. 이 페이지의 영어 버전과 번역 간 모순이 있는 경우, 영어 버전이 우선적으로 적용됩니다. 이 페이지의 영어 버전을 확인하십시오.