오늘날의 가속화된 비즈니스 환경에서 성공적인 HPC 채택을 위한 기반은 잘 정의된 HPC 아키텍처에서 시작됩니다. 조직의 워크로드 및 컴퓨팅 목표에 따라 다양한 HPC 시스템 설계 및 지원 리소스를 사용하여 생산성 향상 및 확장 가능한 성능을 달성할 수 있습니다.
HPC 시스템의 설계
HPC 아키텍처는 필요에 따라 다양한 형태를 취합니다. 조직은 다양한 방식을 선택하여 HPC 시스템을 설계할 수 있습니다.
다중 아키텍처에서의 병렬 컴퓨팅
HPC 병렬 컴퓨팅은 대규모 워크로드를 실행할 수 있도록 HPC 클러스터를 지원하고 대규모 워크로드를 동시에 실행 가능한 개별 컴퓨팅 작업으로 분할합니다.
이러한 시스템은 수직 확장 또는 수평 확장하도록 설계될 수 있습니다. 수직 확장 설계에서는 단일 시스템 내에서 작업을 받아 개별 코어들이 해당 서버를 최대한 사용하여 작업을 수행할 수 있도록 해당 작업을 분할합니다. 대조적으로 수평 확장 설계에서 동일한 작업을 받으면 관리 가능한 부분으로 분할해 여러 서버 또는 컴퓨터에 해당 부분들을 분배하고 모든 작업은 병렬로 수행됩니다.
시뮬레이션, 모델링, 고급 분석과 같은 집약적인 워크로드가 보편화됨에 따라 HPC 시스템은 CPU 외에도 가속기를 포함하도록 설계되고 있습니다. 이러한 가속기로 인해 개발자가 지원해야 하는 이기종 범위의 가능한 구성이 더 광범위해졌습니다.
개발자는 oneAPI 교차 아키텍처 프로그래밍을 사용하여 보다 생산적이고 효과적인 개발을 위해 CPU, GPU 및 FPGA 아키텍처에서 사용할 수 있는 단일 코드베이스를 생성할 수 있습니다. oneAPI는 독점 프로그래밍 모델의 제약을 제거하고 새로운 하드웨어의 채택을 용이하게 하고 코드 유지 관리를 줄임으로써 HPC 혁신을 가속화할 수 있습니다. oneAPI 및 인텔® oneAPI 툴킷은 C++, SYCL, Fortran, OpenMP, MPI, Python을 포함하여 HPC 개발자가 필요로 하는 기존 개방형 표준 및 언어를 지원합니다. oneAPI 및 인텔® oneAPI 툴킷에 대해 자세히 알아보십시오.
클러스터 컴퓨팅
High Performance Computing 클러스터는 근거리 통신망(LAN)을 통해 여러 컴퓨터 또는 노드를 연결합니다. 이렇게 상호 연결된 노드는 최첨단 컴퓨팅 성능을 갖춘 단일 컴퓨터의 역할을 수행합니다. HPC 클러스터는 시스템의 노드 전체로 확장하여 하나의 문제를 해결하거나 하나의 복잡한 계산 작업을 수행하도록 고유하게 설계됩니다. HPC 클러스터는 정의된 네트워크 토폴로지를 가지며 HPC 클러스터를 통해 조직은 타협하지 않는 프로세싱 속도로 고급 계산을 처리할 수 있습니다.
그리드 및 분산 컴퓨팅
HPC 그리드 컴퓨팅과 HPC 분산 컴퓨팅은 동의어와 같은 컴퓨팅 아키텍처입니다. 여기에는 복잡한 문제 해결 또는 대규모 계산 작업 수행과 같은 공통 목표를 공유하며 네트워크를 통해 연결된 여러 컴퓨터가 수반됩니다. 이 접근 방식은 개별 청크로 분할되어 그리드 전체에 분산될 수 있는 작업을 처리하는 데 이상적입니다. 시스템 내의 각 노드는 다른 노드와 통신하지 않고 독립적으로 작업을 수행할 수 있습니다.
HPC Cloud Infrastructure
과거에 HPC 시스템은 온프레미스 인프라가 제공할 수 있는 용량 및 설계로 제한되었습니다. 오늘날에는 클라우드가 추가 리소스로 로컬 용량을 확장합니다.
최신 클라우드 관리 플랫폼은 온프레미스 인프라와 퍼블릭 클라우드 서비스를 혼합하는 하이브리드 클라우드 접근 방식을 가능하게 하므로 워크로드가 사용 가능한 모든 리소스에서 원활하게 흐를 수 있습니다. 이를 통해 총소유비용(TCO)을 최적화할 수 있는 기회와 함께 HPC 시스템의 배포에 있어 유연성을 높이고 확장 속도를 가속화할 수 있습니다.
일반적으로 온프레미스 HPC 시스템의 TCO는 클라우드에 24/7 예약된 동급 HPC 시스템보다 낮습니다. 그러나 피크 용량에 맞게 크기가 조정된 온프레미스 솔루션은 피크 용량에 도달하는 경우에만 완전히 활용됩니다. 대부분의 경우 온프레미스 솔루션은 충분히 활용되지 않아 리소스가 유휴 상태가 될 수 있습니다. 그러나 사용 가능한 용량 부족으로 계산되지 못한 워크로드는 기회 손실로 이어질 수 있습니다.
요컨대 시간 민감형 작업을 위해 클라우드를 사용하여 온프레미스 HPC 인프라를 보강하면 큰 기회를 놓칠 위험을 완화할 수 있습니다.
성능을 극대화하고 인텔® Software Guard Extensions(인텔® SGX), 인텔® Advanced Vector Extensions 512(인텔® AVX-512)와 같은 기술을 적용하고 온보딩을 단순화하여 클라우드에서 HPC 혁신을 촉진하기 위해 인텔은 클라우드 서비스 공급업체와 긴밀히 협력하고 있습니다. 인텔의 HPC 클라우드 기술 그리고 이 기술들이 결과를 개선하는 데 어떻게 도움이 될 수 있는지에 대해 자세히 알아보십시오.
확장성과 성능을 위한 HPC 프로세서 선택
HPC 기술에 대한 폭넓은 전문 지식을 통해 인텔은 가장 까다로운 미래 워크로드를 처리하기 위한 성능 요건을 준수합니다. 인텔® 제온® 스케일러블 프로세서는 원활하게 확장하여 중요 HPC 워크로드의 다양한 성능 요건을 지원할 수 있는 매우 다재다능한 플랫폼을 제공합니다. 출시 예정인 Xe HPG 마이크로아키텍처 기반의 인텔 데이터 센터 GPU는 인텔® 제온® 스케일러블 프로세서의 이상적인 보완재로, 성능을 훨씬 더 높이는 데 도움이 됩니다.
생태계와 협력하며 인텔은 최적화된 HPC 시스템 설계를 가능하게 할 청사진을 만드는 노력에 우선순위를 두었습니다. 성능 요건을 검증하기 위해 인텔® Cluster Checker(인텔® oneAPI HPC Toolkit의 일부)는 온프레미스와 HPC 클라우드 시스템 사이에서 이동할 수 있도록 HPC 클러스터 시스템이 무결한지 그리고 놀라운 이식성을 통해 병렬 응용 프로그램을 실행할 수 있도록 구성되었는지를 확인합니다.
인텔® CoFluent™ 기술을 사용하면 복잡한 시스템의 배포를 가속화할 수 있고 시뮬레이션된 하드웨어 및 소프트웨어 상호 작용을 모델링하여 최적의 설정을 결정하는 데 도움이 됩니다.
HPC 메모리의 혁신
메모리는 HPC 시스템 설계에서 빼놓을 수 없는 구성 요소입니다. 시스템의 단기 데이터 저장을 담당하는 메모리는 워크플로 성능을 제한하는 요인이 될 수 있습니다. 인텔® Optane™ 기술은 스토리지 및 메모리 계층의 격차를 해소하여 데이터 센터에서 이러한 병목 현상을 극복하는 데 도움이 되므로 컴퓨팅을 지속할 수 있습니다.
고대역폭 메모리는 HPC 프로그래밍에 사용되는 GPU에 포함되었을 때 성공적이었으며 곧 x86 프로세서에서도 사용 가능할 예정입니다. 대부분의 경우 고대역폭 메모리 기술은 코드 변경 없이 메모리 대역폭의 제한을 받는 코드를 가속화할 수 있습니다. DDR 메모리 비용을 줄이는 데도 도움이 될 수 있습니다.
HPC 패브릭을 통한 성능 확장
소규모 HPC 시스템을 효과적으로 확장하려면 조직에 HPC 클러스터를 지원하도록 설계된 고성능 패브릭이 필요합니다.
인텔® High Performance Networking(HPN)은 친숙하고 비용 효율적인 이더넷 기술을 사용하여 최적화된 성능을 제공합니다. 이를 통해 클러스터 관리자는 HPC 및 머신 러닝 교육 필요를 충족하는 종단 간 솔루션을 확보할 수 있습니다. OpenFabrics 인터페이스(OFI, libfabric이라고도 함) 및 인텔® Ethernet Fabric Suite를 통해 oneAPI를 포함하여 널리 사용되는 기존 HPC 및 AI 미들웨어 및 프레임워크를 인텔® HPN과 함께 사용할 수 있습니다.
HPC 성공으로 향하는 보다 쉬운 경로
인텔은 HPC 응용 프로그램, 아키텍처 그리고 HPC 시스템(온프레미스, 클라우드 또는 하이브리드)의 요구를 깊이 이해할 수 있도록 전문 지식을 제공하여 사용자가 결과를 산출하고 성과를 극대화하는 데 도움이 됩니다. 인텔® 기술을 기반으로 하는 HPC 아키텍처를 사용하면 미래의 HPC, 엑사스케일 및 제타스케일 요구를 충족할 준비가 된 것입니다.
또한, 인텔의 oneAPI 툴킷은 HPC 프로그래밍 노력을 단순화하고 더 많은 하드웨어 유형을 지원하고 비즈니스 결과를 극대화할 수 있도록 개발자를 도울 준비가 되어 있습니다.