엑사스케일을 향한 Cineca 드라이브

Leonardo Supercomputer의 아키텍처는 약진과 혁신이 가능한 가속 컴퓨팅에 최적화되어 있습니다.

개요:

  • Cineca는 유럽 전역의 광범위한 연구 프로젝트에 HPC 리소스를 제공하는 비영리 컨소시엄입니다.

  • 가속 컴퓨팅에 최적화되어 과학적 혁신과 산업 혁신을 가능하게 하는 Cineca의 Leonardo Supercomputer 하이브리드 아키텍처에는 뛰어난 워크로드 성능을 위한 가속기가 내장된 3세대 및 4세대 인텔® 제온® 스케일러블 프로세서가 포함되어 있습니다.

author-image

기준

요약

이탈리아는 유럽 전역의 연구 및 산업을 위한 HPC(High Performance Computing)에 대한 혁신 및 지원의 오랜 역사를 가지고 있습니다. HPC에 대한 이탈리아의 노력의 중심에는 교육부, 대학 및 연구부, 69개의 이탈리아 대학, 28개의 국립 공공 기관 및 13개의 국립 연구 기관으로 구성된 민간 비영리 컨소시엄인 Cineca가 있습니다. 조직은 구성원에게 HPC 리소스와 높은 지원 수준을 제공합니다. 모든 회원은 유럽 전역의 광범위한 연구 프로젝트를 통해 협력합니다. Cineca는 과학 탐구를 심화하고 상업적으로 응용하는 데 발견과 통찰력을 사용하여 학계와 과학 영역 및 산업 간의 기술적 가교 역할을 합니다.

Cineca는 고객에게 계속해서 고급 기술을 제공하기 위해 새로운 HPC 시스템을 주기적으로 배포합니다. Cineca는 최근 최신 세대의 인텔® 제온® 스케일러블 프로세서 및 NVIDIA GPU를 기반으로 구축된 가장 강력한 슈퍼컴퓨터를 배포했습니다. Leonardo라는 새로운 HPC 시스템은 11월 Top500.org 목록에서 4위를 차지했습니다. Leonardo는 Cineca가 유럽 최고의 슈퍼컴퓨팅 센터가 될 수 있는 로드맵에 따라 250페타플롭스 HPL 컴퓨팅 성능과 10엑사플롭스의 FP16 AI 성능을 제공하도록 설계되어 새로운 성과를 달성했습니다.

4세대 인텔® 제온® 스케일러블 프로세서가 포함된 고급 기술을 기반으로 구축된 Leonardo는 Cineca와 Cineca 고객에게 놀라운 기능을 제공할 것입니다.

당면 과제

이탈리아에 있는 Cineca는 유럽 전역에 HPC 서비스를 제공하여 과학 및 산업 분야의 발견과 혁신을 지원합니다. 재료 과학, 천체 물리학, 공학, 생물 정보학, 날씨 및 기후 및 기타 분야의 고급 연구를 지원합니다. 연구 데이터가 HPC 기술 및 방법론의 발전과 함께 극적으로 확장됨에 따라 워크로드에는 계속해서 요구되는 컴퓨팅 리소스가 필요합니다. AI(인공 지능), ML(머신 러닝) 및 DL(딥 러닝)을 워크플로에 추가하려면 고급 슈퍼컴퓨팅 아키텍처가 필요합니다. 따라서 Cineca의 철학은 HPC의 매우 경쟁력 있는 우위를 유지하고 공격적인 Exascale 로드맵을 따라 Cineca를 세계 슈퍼컴퓨팅의 리더로 유지하는 것입니다.

표 1. Leonardo 스토리지 파티션 요약(Cineca 제공)

Cineca는 연구를 진행하기 위해 이탈리아에서는 아직 사용할 수 없는 컴퓨팅 기능을 갖춘 새로운 시스템이 필요했습니다.

 

  • 인텔® 제온® 8160 Platinum 프로세서 및 인텔® MCU 아키텍처에 구축된 Marconi-A3를 포함한 여러 Marconi 등급.
  • 100페타플롭스 시스템인 Marconi100.
  • 인텔® 제온® 8260 Platinum 프로세서를 중심으로 설계된 Galileo100 및 ADA Cloud.

그림 1. Leonardo 시스템 개요(Cineca 제공)

유럽의 슈퍼컴퓨팅을 지원하는 EuroHPC JU(EuroHPC Joint Undertaking) 프로젝트는 대륙의 슈퍼컴퓨팅 자원 확장에 자금을 지원합니다. Cineca와 EuroHPCJU의 공격적인 슈퍼컴퓨팅 계획을 통해 Cineca의 새로운 HPC 리소스인 Leonardo를 구축하고 다양한 기존 워크로드, 시각화 및 AI를 위한 차세대 데이터 센터 및 슈퍼컴퓨팅 기술을 구축할 수 있었습니다.

솔루션

Leonardo는 EuroHPC JU에 따라 유럽 전역에 배포되는 많은 HPC 시스템 중 첫 번째 시스템입니다. EuroHPC JU, Cineca 및 기타 유럽 HPC 센터의 자금 지원으로 가까운 장래에 Exascale 슈퍼컴퓨팅을 제공하여 세계의 거대한 과제에 대한 수요를 충족할 수 있습니다.

Cineca 고객의 워크로드는 메모리 대역폭, 데이터 처리량, 부동 소수점 및 매트릭스 계산 등을 포함한 다양한 컴퓨팅 리소스 수요를 제시합니다. 이러한 워크로드에는 ab initio 재료 과학 및 분자 모델링, 날씨 및 기후 모델링, 플라즈마 물리 시뮬레이션, 대규모 생물정보학, AI 및 ML, 기타 많은 까다로운 응용 프로그램이 포함됩니다. 따라서 Leonardo는 다양한 워크로드의 병목 현상을 제거하기 위해 고성능 일반 HPC 및 AI 기능을 균형 잡힌 방식으로 제공해야 했습니다. Cineca는 Leonardo를 위해 컴퓨팅 집약적이고 데이터 집약적인 HPC 워크로드용으로 설계된 백만 개 이상의 CPU 및 GPU 코어를 갖춘 하이브리드 아키텍처를 선택했습니다.

시스템 요약

Atos는 BULLSequana XH2000 슈퍼컴퓨터 노드를 통해 Leonardo를 구축했습니다. 이 시스템에는 4개의 파티션과 136개 이상의 BULLSequana XH2000 직접 수냉식 랙 등이 포함됩니다. Leonardo의 파티션에는 프론트엔드/서비스 등급, 스토리지 등급, 컴퓨팅 가속기(부스터) 등급 및 컴퓨팅(데이터 중심) 등급이 포함됩니다. 2개의 컴퓨팅 및 부스터 계층은 초당 약 250페타플롭스 HPL 및 10엑사플롭스 AI 16비트 부동 소수점 연산을 제공합니다.

프론트엔드/서비스 파티션: 이들은 로그인, 서비스 및 시각화 노드를 제공합니다.

스토리지 파티션: 높은 데이터 처리량과 용량을 모두 지원하도록 설계된 스토리지 파티션에는 5페타바이트 고속 등급과 100페타바이트 용량 등급이 포함됩니다(표 1). 이 아키텍처를 통해 시스템은 극도의 대역폭과 IOPS로 까다로운 I/O 사용 사례를 처리하는 동시에 오늘날의 계산 문제 및 AI에서 볼 수 있는 대규모 데이터 세트를 위한 용량을 제공할 수 있습니다.

컴퓨팅(데이터 중심) 파티션: Cineca에 따르면 4세대 인텔® 제온® 스케일러블 프로세서(각각 56개 코어)에 구축된 1,536 BULLSequana X2610 3노드 컴퓨팅 블레이드를 사용하는 컴퓨팅(데이터 중심) 파티션은 9페타플롭스 HPL을 제공합니다.

컴퓨팅 가속기(부스터) 파티션: 3,456개의 BULLSequana X2135 DaVinci 컴퓨팅 블레이드 각각에는 인텔® 제온® 8358 Platinum 프로세서(32코어)와 맞춤형 NVIDIA Ampere GPU 4개가 있습니다. 이 파티션은 GPU 가속 워크로드의 계산 요구 사항을 충족하도록 설계되었습니다.

Leonardo는 Cineca의 많은 사전 엑사스케일 시스템을 보완하는 최신 추가 제품입니다.

시스템은 200Gbps InfiniBand 아키텍처 네트워크와 100Gbps 노드 간 통신으로 상호 연결됩니다.

4세대 인텔® 제온® 스케일러블 프로세서

컴퓨팅 파티션의 4세대 인텔 제온 스케일러블 프로세서는 특정 워크로드에 최적화된 내장 가속기를 통합합니다. 효율성 증가와 성능 향상으로 총 소유 비용이 최적화됩니다.1 이러한 가속기에는 신경망 계산을 가속화하기 위한 BFload16 및 int8을 지원하는 인텔® AMX(인텔® Advanced Matrix Extensions)가 포함됩니다, 암호화 및 데이터 압축을 가속화하는 인텔® QAT(인텔® QuickAssist Technology)와 AI 처리 속도를 높이는 인텔® Advanced Vector Extensions(AVX-512) 등이 있습니다.

전력은 오늘날 슈퍼컴퓨팅 센터의 핵심 지표입니다. 4세대 인텔 제온 스케일러블 프로세서는 전력 및 성능 관리를 위한 많은 기능을 갖춘 인텔의 가장 지속 가능한 데이터 센터 프로세서로, 주요 지속 가능성 목표를 달성하기 위해 CPU 리소스 사용을 개선합니다.

LISA 확장

또한 Cineca는 LISA라는 대규모 확장판에 대한 승인을 받았습니다. Cineca는 이번 확장으로 Leonardo의 이미 강력한 컴퓨팅 성능이 약 100페타플롭스 증가하고 시스템이 지원할 수 있는 사용 사례가 확대될 것으로 예상합니다. LISA는 두 개의 새로운 모듈을 추가할 예정입니다. 첫 번째는 고대역폭 메모리를 활용하는 기존 노드가 있는 모듈로, 메모리와 CPU 간의 빠른 데이터 전송이 필요한 작업의 성능을 향상시키는 것이 목표입니다. 두 번째고급 가속용 모듈은 와트당 성능 측면에서 상당한 효율성을 제공하는 것이 목표이며 차세대 GPU 서버 노드로 구동됩니다.

결과

Leonardo는 Cineca와 그 구성원에게 고급 HPC 기능을 제공하여 새로운 발견과 혁신이 가능할 것입니다.

Leonardo 슈퍼컴퓨터의 사전 제작 단계가 시작되었습니다. LEAP(Leonardo Early Access Program)는 과학적 영향력이 높은 프로젝트 지원이 목표이며 Leonardo의 많은 컴퓨팅 리소스를 활용할 수 있습니다. 과학, 산업 및 공공 부문의 연구원은 국적에 관계없이 제안서를 제출할 수 있습니다.

솔루션 요약

슈퍼컴퓨팅 기술은 계속해서 발전하고 계산 방법론은 빠르게 발전하고 있습니다. 이를 통해 새로운 고급 HPC 시스템을 전 세계에 배포할 수 있습니다. Cineca의 Leonardo와 같은 새로운 슈퍼컴퓨터는 세계 과학자가 더 큰 통찰력을 얻고 연구중인 거대한 도전에 대한 새로운 발견을 할 수 있게 해줍니다.

Cineca는 EuroHPC JU의 자금 지원으로 Leonardo를 배포했습니다. Top500.org에 따르면, Leonardo는 세계에서 4번째로 빠른 슈퍼컴퓨터입니다. Leonardo는 4세대 인텔 제온 스케일러블 프로세서를 비롯한 고급 기술로 제작되었습니다. 250pFLOPS 이상의 HPL과 10개의 ExaFLOPS 16비트 AI 성능을 갖춘 Leonardo는 유럽의 연구원들이 세계가 직면한 문제를 더욱 깊이 탐구하고 과학 및 산업을 위한 새로운 솔루션 혁신을 지원합니다.

인텔® 제온® 스케일러블 프로세서 제품군에 대한 자세한 내용은 https://www.intel.co.kr/content/www/kr/ko/products/details/processors/xeon/scalable.html을 참조하십시오.

Leonardo에 대한 자세한 내용은 leonardo-supercomputer.cineca.eu/hpc-system/를 참조하십시오.

솔루션 구성 요소

  • Atos가 BULLSequana XH2000 플랫폼에서 구축
  • 250페타플롭스 HPL(Rmax) / 10엑사플롭스 FP16 AI 성능
  • 인텔® 제온® 8358 프로세서 및 NVIDIA Ampere GPU가 장착된 3,456개의 서버
  • 4세대 인텔® 제온® 스케일러블 프로세서가 탑재된 1,536대의 서버
  • 5PB 고성능 스토리지 / 100PB 대용량 스토리지

PDF 다운로드