인텔® FPGA SDK for OpenCL™ 버전 18.1 이상의 문제로 인해 동일한 vector_add 예제 디자인 코드를 컴파일할 때 성능이 저하될 수 있습니다. 성능은 다음과 같습니다.
인텔® FPGA SDK for OpenCL™ 버전 | 성능 |
V16.1 버전 V18.0 버전 V18.1 버전 V19.1 버전 | ~3밀리세컨드 ~3밀리세컨드 ~170밀리세컨드 ~170밀리세컨드 |
이 문제를 해결하려면 필요한 작업 그룹 크기를 설정하는 vector_add.cl 특성을 추가하십시오.
__attribute__((reqd_work_group_size(1, 1, 1)))
__kernel void vector_add(__global const float *x,
__global const float *y,
__global float *z 제한)
{
작업 항목의 인덱스 가져오기
int 인덱스 = get_global_id(0);
벡터 요소 추가
z[인덱스] = x[인덱스] y[인덱스];
}
이 문제는 OpenCL™용 인텔® FPGA SDK의 향후 릴리스에서 수정될 예정입니다.