인텔에 기반한 데이터로 AWS*에 지출하는 비용당 얻을 수 있는 성능을 더 높여 보십시오.

인텔® 제온® 확장 가능한 프로세서에 기반한 인스턴스를 선택할 때의 이점에 대해 알아보십시오.

AWS* 투자로부터 최고의 가치를 도출해내고 있습니까?

클라우드는 필요한 곳에 확장성, 안정성, 유연성을 제공하지만 모든 클라우드가 똑같은 것은 아닙니다. 어떤 클라우드는 다른 것보다 훨씬 더 많은 가치를 제공합니다. 자신의 워크로드에 최적의 선택이 무엇인지 파악하려면 구체적인 워크로드 성능을 살펴보아야 합니다. 일반적인 성능 통계는 특히 컴퓨팅 집약적 또는 데이터 집약적인 워크로드를 실행하는 경우 실제로 알고 싶은 결과에 대해 많은 것을 알려주지 않을 수 있습니다. 마찬가지로, 인스턴스당 가격을 안다고 해서 트랜잭션당 가격이나 다른 실제 비즈니스 또는 성능 지표에 대해 많이 알 수 있는 것은 아닙니다. 따라서 좀 더 자세히 살펴보아야 합니다.

예를 들어 고성능 Linpack* 벤치마크에 따르면 인텔® 제온® 확장 가능한 프로세서 기반 AWS* 인스턴스가 AMD EPYC* 프로세서 기반 인스턴스보다 고성능 컴퓨팅(HPC) 워크로드에서1 비용당 최대 4.15배 높은 성능을 제공할 수 있다는 사실을 알고 계십니까? LAMMPS* 벤치마크에 따르면 비용당 최대 2.19배 높은 성능을 제공합니다.1 AWS의 데이터베이스 워크로드의 경우 인텔® 제온® 확장 가능한 프로세서는 비용당 최대 2.84배 높은 성능을 제공하며2, 메모리 대역폭 집약적 워크로드의 경우 비용당 최대 2.25배 높은 성능을 제공할 수 있습니다.3 서버측 Java* 또는 Wordpress PHP/HHVM*와 같은 웹 기반 워크로드를 실행하는 경우 인텔에서 실행할 때 비용당 최대 1.74배 높은 성능을 낼 수 있다는 것을 알 수 있을 것입니다.4

이미 인텔® 프로세서를 사용하고 있다면 인텔® 제온® 확장 가능한 프로세서를 기반으로 하는 최신 인스턴스로 전환하여 비용을 절감할 수 있습니다. TSO Logic은 퍼블릭 및 프라이빗 클라우드 전반에서 적절한 규모와 적절한 비용의 컴퓨팅을 할 수 있도록 데이터에 기반한 권장 사항을 제공합니다. 이곳은 익명화한 AWS 고객 데이터가 저장된 100,000개의 인스턴스 저장소에서 수백만 개의 데이터 요소를 연구합니다. 따라서 결론은 이렇습니다. 더 낮은 비용으로 동등한 성능을 제공하는 더 새롭고 더 작은 Amazon EC2* 인스턴스로 전환하면 현재 인스턴스의 19%에 대한 비용을 절감할 수 있습니다. 예를 들어 이전 C4.8XLarge에서 새로운 C5.4XLarge 인스턴스로 마이그레이션하면 클라우드 비용을 최대 50% 절감할 수 있으며, 인스턴스당 3,000달러 이상을 절감할 수 있습니다.5 더욱이 코어당 소프트웨어를 라이선싱할 경우 절감 효과를 더 빠르게 높일 수 있습니다. TSO Logic은 2세대 인텔® 제온® 확장 가능한 프로세서에 기반한 최신 인스턴스에서 워크로드를 실행할 때 하나의 워크로드가 40개 더 적은 코어를 사용하여 제공될 수 있다는 것을 발견했습니다.5 코어당 1,800달러로 라이선싱한 상용 데이터베이스를 실행한다면, 코어 수를 40개 줄임으로써 연간 72,000달러를 절감할 수 있습니다.5

인텔® 제온® 확장 가능한 프로세서와 2세대 인텔® 제온® 확장 가능한 프로세서에는 워크로드를 가속화할 수 있도록 여러 최적화 기능이 내장되어 있습니다. INT8 숫자 형식은 불필요한 세부 사항을 폐기할 수 있게 하여 머신 러닝을 가속화합니다. 인텔® 딥 러닝 부스트(인텔® DL 부스트)는 새로운 프로세서 명령어를 제공함으로써 이미지 분류, 음성 인식, 언어 번역, 사물 감지 등과 같은 애플리케이션의 추론을 가속화할 수 있도록 합니다. 인텔® Advanced Vector Extensions 512(인텔® AVX-512)는 512비트 벡터 명령어를 제공하여 과학 시뮬레이션을 포함한 부동 소수점 계산을 가속화할 수 있습니다. 인텔® 터보 부스트 기술을 사용하면 코어를 기본 작동 주파수보다 빠르게 실행할 수 있어 가장 필요한 순간에 추가적인 성능을 낼 수 있습니다. 데이터 보호를 위해 인텔® 고급 암호화 표준 새 명령어(인텔® AES-NI)는 암호화와 복호화 속도를 높일 수 있는 프로세서 명령어를 제공합니다.

고지 및 면책 정보:

성능 테스트에 사용된 소프트웨어 및 워크로드는 인텔® 마이크로프로세서에만 적합하도록 최적화되었을 수 있습니다. SYSmark* 및 MobileMark*와 같은 성능 테스트는 특정 컴퓨터 시스템, 구성 요소, 소프트웨어, 운영, 기능 등을 사용하여 측정됩니다. 해당 요소에 변경이 생기면 결과가 달라질 수 있습니다. 구매를 고려 중인 제품을 제대로 평가하려면 다른 제품과 결합하여 사용할 경우 해당 제품의 성능을 포함한 기타 정보 및 성능 테스트를 참고해야 합니다. 자세한 내용은 http://www.intel.co.kr/benchmarks를 참조하십시오.

성능 결과는 구성에 표시된 날짜의 테스트를 기반으로 하며 공개된 모든 보안 업데이트를 반영하지 않았을 수도 있습니다. 자세한 내용은 공개된 구성 정보를 참조하십시오. 어떤 제품 또는 구성 요소도 절대적으로 안전할 수는 없습니다.
인텔은 타사 데이터를 제어하거나 감사하지 않습니다. 귀하는 이 콘텐츠를 검토하고 다른 소스를 참조하여 참조된 데이터가 정확한지 여부를 확인해야 합니다.

비용 절감 시나리오는 특정한 인텔® 기반 제품이 특정 상황 및 구성 하에서 미래의 비용에 미치는 영향과 절감 효과를 예시하기 위한 목적으로 제시되어 있습니다. 단, 상황은 제각기 다릅니다. 인텔은 일체의 비용 또는 비용 절감에 대한 보증을 하지 않습니다.

인텔® 기술의 기능 및 이점은 시스템 구성에 따라 달라지며 지원되는 하드웨어, 소프트웨어 또는 서비스 활성화가 필요할 수 있습니다. 성능은 시스템 구성에 따라 달라집니다. 시스템 제조업체 또는 판매처에 문의하거나 intel.co.kr 에서 자세한 내용을 확인하시기 바랍니다.

인텔, 인텔 로고 및 제온은 미국 및/또는 기타 국가에서 인텔사 또는 그 자회사의 상표입니다.

*다른 이름과 브랜드는 해당 소유주의 자산입니다. 
© Intel Corporation

제품 및 성능 정보

1

결과는 2019년 1월 12일 기준 AWS 요금(시간당 1달러, 스탠다드 1년, 선불 없음)에 따라 인텔에 의해 계산되었습니다.
AWS* EC2 M5 과 M5a 인스턴스(https://aws.amazon.com/ec2/instance-types/)에 대해 실시된 달러당 성능 테스트는, 달러당 96 vCPU 인텔® 제온® 확장 가능한 프로세서 성능과 달러당 AMD EPYC* 프로세서 성능을 비교했습니다.

워크로드: LAMMPS*
결과: 달러당 AMD EPYC 성능 = 기준이 1일 때 달러당 인텔® 제온® 확장 가능한 프로세서 성능 = 2.19배(높을수록 좋음).
HPC Materials Science – LAMMPS(높을수록 좋음):
AWS M5.24xlarge(인텔) 인스턴스, LAMMPS 버전: 2018-08-22(코드: https://lammps.sandia.gov/download.html), 워크로드: Water – 512K Particles, 인텔 ICC 18.0.3.20180410, Linux* OS용 인텔® MPI 라이브러리, 버전 2018 업데이트 3 빌드 20180411, 48 MPI Ranks, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=2, 점수 137.5 timesteps/sec, 2018년 10월 31일에 인텔에서 측정.
AWS M5a.24xlarge(AMD) 인스턴스, LAMMPS 버전: 2018-08-22(코드: https://lammps.sandia.gov/download.html), 워크로드: Water – 512K Particles, 인텔 ICC 18.0.3.20180410, Linux* OS용 인텔® MPI 라이브러리, 버전 2018 업데이트 3 빌드 20180411, 48 MPI Ranks, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=2, 점수 55.8 timesteps/sec, 2018년 11월 7일에 인텔에서 측정.
AMD를 위해 AVX2를 지원하도록 변경(AMD는AVX2만 지원하므로 변경이 필요):
sed -i 's/-xHost/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi
sed -i 's/-qopt-zmm-usage=high/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi

워크로드: High-performance Linpack*
결과: 달러당 AMD EPYC 성능 = 기준이 1일 때 달러당 인텔® 제온® 확장 가능한 프로세서 성능 = 4.15배(높을수록 좋음).
HPC Linpack(높을수록 좋음):
AWS M5.24xlarge(인텔) 인스턴스, HP Linpack 버전 2.2(https://software.intel.com/en-us/articles/intel-mkl-benchmarks-suite 디렉터리: benchmarks_2018.3.222/linux/mkl/benchmarks/mp_linpack/bin_intel/intel64), AVX512 적용 인텔 ICC 18.0.3.20180410 , Linux* OS용 인텔® MPI 라이브러리, 버전 2018 업데이트 3 빌드 20180411, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=24, 2 MPI 프로세스, 점수 3152 GB/s, 2018년 10월 31일에 인텔에서 측정.
AWS M5a.24xlarge(AMD) 인스턴스, HP Linpack 버전 2.2,(HPL 출처: http://www.netlib.org/benchmark/hpl/hpl-2.2.tar.gz; 버전 2.2; BLIS library version 0.4.0에 컴파일하고 링크 하는데 icc(ICC) 18.0.2 20180210 사용; https://github.com/flame/blis; 추가 컴파일러 플래그: -O3 -funroll-loops -W -Wall –qopenmp; make arch=zen OMP_NUM_THREADS=8; 6 MPI 프로세스.), AVX2를 적용한 인텔 ICC 18.0.3.20180410, Linux* OS용 인텔® MPI 라이브러리, 버전 2018 업데이트 3 빌드 20180411, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=8, 6 MPI 프로세스, 점수 677.7 GB/s, 2018년 11월 7일에 인텔에서 측정.

2

결과는 2019년 1월 12일 기준 AWS 요금(시간당 1달러, 스탠다드 1년, 선불 없음)에 따라 인텔에 의해 계산되었습니다.
AWS* EC2 R5 과 R5a 인스턴스(https://aws.amazon.com/ec2/instance-types/)에 대해 실시된 달러당 성능 테스트는, 달러당 96 vCPU 인텔® 제온® 확장 가능한 프로세서 성능과 달러당 AMD EPYC* 프로세서 성능을 비교했습니다.

워크로드: HammerDB* PostgreSQL*
결과: 달러당 AMD EPYC 성능 = 기준이 1일 때 달러당 인텔® 제온® 확장 가능한 프로세서 성능 = 1.85배(높을수록 좋음).
데이터베이스: HammerDB – PostgreSQL(높을수록 좋음):
AWS R5.24xlarge(인텔) 인스턴스, HammerDB 3.0 PostgreSQL 10.2, 메모리: 768GB, 하이퍼바이저: KVM; 스토리지 유형: EBS io1, 디스크 볼륨 200GB, 총 스토리지 200GB, 도커 버전: 18.06.1-ce, Red Hat* Enterprise Linux 7.6, 3.10.0-957.el7.x86_64, 6400MB shared_buffer, 256 웨어하우스, 사용자 96명. 점수 “NOPM” 439931, 2018년 12월 11일-2018년 12월 14일에 인텔에서 측정.
AWS R5a.24xlarge(AMD) 인스턴스, HammerDB 3.0 PostgreSQL 10.2, 메모리: 768GB, 하이퍼바이저: KVM; 스토리지 유형: EBS io1, 디스크 볼륨 200GB, 총 스토리지 200GB, 도커 버전: 18.06.1-ce, Red Hat* Enterprise Linux 7.6, 3.10.0-957.el7.x86_64, 6400MB shared_buffer, 256 웨어하우스, 사용자 96명. 점수 “NOPM” 212903, 2018년 12월 20일에 인텔에서 측정.

워크로드: MongoDB*
결과: 달러당 AMD EPYC 성능 = 기준이 1일 때 달러당 인텔® 제온® 확장 가능한 프로세서 성능 = 2.84배(높을수록 좋음).
데이터베이스: MongoDB(높을수록 좋음):
AWS R5.24xlarge(인텔) 인스턴스, MongoDB v4.0, 저널 사용 안 함, 파일시스템 동기화 사용 안 함, wiredTigeCache=27GB, maxPoolSize = 256; 7개 MongoDB 인스턴스, 14개 클라이언트 VM, VM당 1개 YCSB 클라이언트, YCSB 클라이언트당 96개 스레드, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, 점수 1229288 ops/sec, 2018년 12월 10일에 인텔에서 측정.
AWS R5a.24xlarge(AMD) 인스턴스, MongoDB v4.0, 저널 사용 안 함, 파일시스템 동기화 사용 안 함, wiredTigeCache=27GB, maxPoolSize = 256; 7개 MongoDB 인스턴스, 14개 클라이언트 VM, VM당 1개 YCSB 클라이언트, YCSB 클라이언트당 96개 스레드, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, 점수 388596 ops/sec, 2018년 12월 10일에 인텔에서 측정.
자세한 내용은 www.intel.kr/benchmarks를 참조하십시오.

3

AWS M5.4xlarge(인텔) 인스턴스, McCalpin Stream(OMP 버전), (출처: https://www.cs.virginia.edu/stream/FTP/Code/stream.c); AVX512 적용 인텔 ICC 18.0.3 20180410, -qopt-zmm-usage=high, -DSTREAM_ARRAY_SIZE=134217728 -DNTIMES=100 -DOFFSET=0 –qopenmp, -qopt-streaming-stores always -o $OUT stream.c, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, OMP_NUM_THREADS: 8, KMP_AFFINITY: proclist=[0-7:1], granularity=thread, explicit, 점수 81216.7 MB/s, 2018년 12월 6일 인텔에서 측정.
AWS M5a.4xlarge(AMD) 인스턴스, McCalpin Stream(OMP 버전), (출처: https://www.cs.virginia.edu/stream/FTP/Code/stream.c); AVX2 적용 인텔 ICC 18.0.3 20180410, -DSTREAM_ARRAY_SIZE=134217728, -DNTIMES=100 -DOFFSET=0 -qopenmp -qopt-streaming-stores always -o $OUT stream.c, Red Hat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, OMP_NUM_THREADS: 8, KMP_AFFINITY: proclist=[0-7:1], granularity=thread,explicit, 점수 32154.4 MB/s, 2018년 12월 6일 인텔에서 측정.
OpenFOAM 고지: 이 제안은 OpenCFD 유한회사, www.openfoam.com을 통한 OpenFOAM 소프트웨어의 제작자 및 디스트리뷰터, OPENFOAM® 및 OpenCFD® 등록 상표의 소유자에 의해 승인 또는 보증되지 않습니다.

4

결과는 2019년 1월 12일 기준 AWS 요금(시간당 1달러, 스탠다드 1년, 선불 없음)에 따라 인텔에 의해 계산되었습니다.
AWS* EC2 M5 과 M5a 인스턴스(https://aws.amazon.com/ec2/instance-types/)에 대해 실시된 달러당 성능 테스트는, 달러당 96 vCPU 인텔® 제온® 확장 가능한 프로세서 성능과 달러당 AMD EPYC* 프로세서 성능을 비교했습니다.

워크로드: 서버측 Java* 1 JVM
결과: 달러당 AMD EPYC 성능 = 기준이 1일 때 달러당 인텔® 제온® 확장 가능한 프로세서 성능 = 1.74배(높을수록 좋음).
서버측 Java(높을수록 좋음):
AWS M5.24xlarge(인텔) 인스턴스, Java Server Benchmark No NUMA binding, 2JVM, OpenJDK 10.0.1, RedHat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, 점수 101767 Transactions/sec, 2018년 11월 16일에 인텔에서 측정.
AWS M5a.24xlarge(AMD) 인스턴스, Java Server Benchmark No NUMA binding, 2JVM, OpenJDK 10.0.1, RedHat* Enterprise Linux 7.5, 커널 3.10.0-862.el7.x86_64, 점수 52068 Transactions/sec, 2018년 11월 16일에 인텔에서 측정.

워크로드: WordPress* PHP/HHVM*
결과: 달러당 AMD EPYC 성능 = 기준이 1일 때 달러당 인텔® 제온® 확장 가능한 프로세서 성능 = 1.75배(높을수록 좋음).
웹 프론트엔드 WordPress(높을수록 좋음):
AWS M5.24xlarge(인텔) 인스턴스, oss-performance/wordpress Ver 4.2.0; Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic; 워크로드 버전': u'4.2.0; 클라이언트 스레드: 200; PHP 7.2.12-1; perfkitbenchmarker_version="v1.12.0-944-g82392cc; Ubuntu 18.04, Kernel Linux 4.15.0-1025-aws, 점수 3626.11 TPS, 2018년 11월 16일에 인텔에서 측정.
AWS M5a.24xlarge(AMD) 인스턴스, oss-performance/wordpress Ver 4.2.0; Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic; 워크로드 버전': u'4.2.0; 클라이언트 스레드: 200; PHP 7.2.12-1; perfkitbenchmarker_version="v1.12.0-944-g82392cc; Ubuntu 18.04, Kernel Linux 4.15.0-1025-aws, 점수 1838.48 TPS, 2018년 11월 16일에 인텔에서 측정.
자세한 내용은 www.intel.co.kr/benchmarks를 참조하십시오.

5

출처: TSO Logic / 인텔 연구 보고서: "인텔과 Amazon Web Services의 새로운 진보, 큰 폭의 클라우드 비용 절감 달성".