• <Intel.com에 대한 자세한 내용

Intel® Xeon Phi™ Product Family

Highly parallel processing to power your breakthrough innovations

Intel® Xeon Phi™ Coprocessor

Power your breakthrough innovations with the highly parallel processing of the Intel® Xeon Phi™ coprocessor. We have packed over a teraFLOPS of double-precision peak performance into every chip.

Life science applications

Life sciences is one of the largest commercial market segments for high-performance computing. Life sciences includes many disciplines, such as chemistry, bio-chemistry, molecular modeling, protein folding, genomics, and statistical analysis to name a few.  Quick simulation and analysis leads to breakthroughs in all areas of the life sciences. BWA maps human genomes. Gromacs simulates particle molecular dynamics. LAMMPS is a versatile large scale atomic simulation package. MPI-HMMER is an open source MPI implementation of the HMMER protein sequence analysis suite. NAMD is a parallel molecular dynamics code for large bio molecular systems. 

Intel measured as of May 2014

구성 세부 정보

BWA: (Burrow-Wheeler Aligner Release bwa-0.5.10)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel® Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel® QuickPath Interconnect (Intel® QPI), 130W thermal design power (TDP), Intel® Turbo Boost Technology on, Intel® Hyper-Threading Technology (Intel® HT Technology) on) 64 GB memory at 1600 MHz, Red Hat Enterprise Linux* (RHEL*) 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel® Turbo Boost Technology off, error-correcting code (ECC) on)

Software stack (Intel Xeon Phi coprocessor):

Intel® Manycore Platform Software Stack (Intel® MPSS) 2.1.6720-21 (Flash*: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel® MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 178.73 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 119.17 seconds

Source: Intel Internal Testing TR2093

 

MPIHmmer:

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2670 (8 core, 20M cache, 2.6 GHz, 8.0 GT/s Intel QPI, 115W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386; coprocessor OS: 2.6.38.8-g5f2543d)

Intel® Composer XE 2013.3.163

Two-socket Intel Xeon processor score: 89 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 57 seconds

Source: Intel Internal Testing TR2051

 

LAMMPS (Production Protein Simulation 474K Stoms, Version 5 April 2014)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (2x 12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 135W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.3

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386)

Intel® Compiler 14.0.1; Intel MPI Library 4.1.2.040

 

1 Node

16 Nodes

Two-socket Intel Xeon processor score:

26.84 sec

4.33 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score:

19.10 sec

2.63 seconds

Source: Intel Internal Testing TR2104

 

GROMACS  (Version 5.0-rc1 - Workload 512K H20 with RF Method)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 2.312 ns/day

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 3.605 ns/day seconds

Source: Intel Internal Testing TR2101

NAMD: (STMV 2.10 pre-release)

Platform hosting the coprocessor and platform for 2S Intel® Xeon® processor baseline:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP, Intel Turbo Boost Technology on, Intel HT Technology on)  64 GB memory @ 1600 MHz, RHEL 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Xeon Phi):

MPSS 2.1.6720-21 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel Compiler 13.1.3 20130607

2S Intel Xeon score: 0.513 seconds

2S Intel Xeon + 2 Xeon Phi score: 0.158 seconds

Source: Internal Testing (TR 2100)

 

NAMD STMV 1 node 47 PPN per node

(Version 2.10 pre-release)

STMV (virus) benchmark (1,066,628 atoms, periodic, PME)

Platform hosting the coprocessor:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP)  64 GB memory @ 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (ECC on, Intel Turbo Boost Technology off)

NVIDIA K40c GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory @ 6.0 GT/s, ECC on, 235W TDP

CUDA 5.5.0, Driver 319.82 (boost frequency was not enabled for result)

Software stack:

MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

4 Nodes

 

2S Xeon only score:

0.158 ns/day

     

2S Xeon + 1 Xeon Phi score:

0.386 ns/day

0.729 ns/day

1.2879 ns/day

(higher is better)

2S Xeon + 2 Xeon Phi score:

0.512 ns/day

     

NVIDIA K40c* score:

0.32 ns/day

0.55 ns/day

1.02 ns/day

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR* (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

 

NAMD ApoA1 1 node (47 PPN per node)

Version 2.10 pre-release

Platform hosting the coprocessor:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP) 64 GB memory @ 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (ECC on, Turbo off)

NVIDIA K40c GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory @ 6.0GT/s, ECC on, 235W TDP

CUDA 5.5.0, Driver 319.82(boost frequency was not enabled for result)

Software Stack:

MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

 

2S Xeon + 1 Xeon Phi score (symmetric):

4.430 Mrps

6.607 Mrps

(higher is better)

NVIDIA K40c score:

4.08 Mrps

6.16 Mrps

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

Additional information: 1 2 3 4 5

제품 및 성능 정보

open

1. 성능 테스트에 사용된 소프트웨어 및 워크로드는 인텔 마이크로프로세서에만 적합하도록 최적화되었을 수 있습니다. SYSmark 및 MobileMark와 같은 성능 테스트는 특정 컴퓨터 시스템, 구성 요소, 소프트웨어, 운영 및 기능을 사용하여 측정됩니다. 해당 요소에 변경이 생기면 결과가 달라질 수 있습니다. 고려 중인 구매를 제대로 평가하려면 다른 제품과 결합하여 사용할 경우 해당 제품의 성능을 포함한 기타 정보 및 성능 테스트를 참고해야 합니다. 자세한 내용은 http://www.intel.com/performance를 참조하십시오.

2. 인텔은 이 문서에 인용된 타사 벤치마크 또는 웹 사이트의 설계 또는 구현을 통제하거나 감사하지 않습니다. 인텔은 고객들이 인용된 웹 사이트 또는 유사한 성능 벤치마크가 게재된 웹 사이트를 직접 방문하여 해당 벤치마크가 정확하고 구매 가능한 시스템 성능을 반영하고 있는지 확인할 것을 권장합니다.

3. 인텔 프로세서 번호는 성능의 측정 기준이 아닙니다. 프로세서의 숫자는 서로 다른 프로세서 제품군 간이 아닌 동일한 프로세서 제품군 내에서 서로 다른 기능을 구분하기 위한 것입니다. 자세한 내용은 www.intel.com/content/www/us/en/processors/processor-numbers.html을 참조하십시오.

4. 인텔 컴파일러는 인텔® 마이크로프로세서에 고유하지 않은 최적화에 대해 타사 마이크로프로세서에서 동일한 수준의 최적화를 제공할 수도 있고 그렇지 않을 수도 있습니다. 이러한 최적화에는 SSE2 및 SSE3 명령 세트 등이 있습니다. 인텔은 인텔이 제조하지 않은 마이크로프로세서에 대한 최적화의 사용 가능성, 기능 또는 효과를 보장하지 않습니다. 마이크로프로세서에 따라 좌우되는 이 제품의 최적화는 인텔 마이크로프로세서에 사용할 목적으로 만들어졌습니다. 인텔® 마이크로아키텍처 전용이 아닌 특정 최적화는 인텔 마이크로프로세서에 사용할 수 있습니다. 이 공지가 적용되는 구체적인 명령 세트에 대한 자세한 정보는 해당 제품의 사용자 안내서 및 참조 안내서를 참조하십시오. 공지 개정 #20110804

5. 다른 하드웨어 아키텍처에는 다른 소스 코드가 필요할 수 있습니다. 결과는 모든 아키텍처에서 실행하고 동일한 작업을 수행하는 데 최적화된 코드를 사용할 수 있도록 인텔이 기울인 최선의 노력에 기반하고 있습니다. 향후 코드 최적화에 따라 다른 결과가 도출될 수 있습니다. 마이크로프로세서에 따라 좌우되는 이 제품의 최적화는 인텔® 마이크로프로세서에 사용할 목적으로 만들어졌습니다. 인텔® 마이크로아키텍처 전용이 아닌 특정 최적화는 인텔 마이크로프로세서에 사용할 수 있습니다. 이 공지가 적용되는 구체적인 명령 세트에 대한 자세한 정보는 해당 제품의 사용자 안내서 및 참조 안내서를 참조하십시오. 공지 개정 #20110804