검수요청.png검수요청.png

"시에라"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
(특징)
1번째 줄: 1번째 줄:
 
[[파일:시에라.jpg|300픽셀|섬네일|오른쪽|'''슈퍼컴퓨터 시에라'''(Sierra)]]
 
[[파일:시에라.jpg|300픽셀|섬네일|오른쪽|'''슈퍼컴퓨터 시에라'''(Sierra)]]
  
'''시에라'''(Sierra)는 2018년 미국 로렌스 리버모어 국립연구소(Lawrence Livermore National Laboratory, LLNL)에 있는 [[슈퍼컴퓨터]]이다. 시에라는 미국 원자력 안전부가 제2의 첨단 기술 시스템으로 [[시뮬레이션]]을 통해 핵무기 과학과 공학 계산뿐만 아니라 핵무기 [[시스템]]의 성능 평가 및 안전성과 신뢰성을 보장하기 위해 개발되었다. 오크리지 국립연구소(Oak Ridge National Laboratory, ORNL)에 있는 슈퍼컴퓨터 [[서밋]](Summit)과 구조 면에서 매우 유사하며 시에라 시스템은 [[아이비엠]](IBM)과 [[엔비디아]](NVIDIA) [[프로세서]]를 함께 사용한다. 2020년 6월 기준 94.64페타플롭스의 실측 성능을 보유한 시에라는 전 세계 슈퍼컴퓨터 순위를 발표하는 톱 500(TOP 500)에서 3위를 기록했다.
+
'''시에라'''(Sierra)는 2018년 미국 로렌스 리버모어 국립연구소(Lawrence Livermore National Laboratory, LLNL)에 있는 [[슈퍼컴퓨터]]이다. 시에라는 미국 원자력 안전부가 제2의 첨단 기술 시스템으로 [[시뮬레이션]]을 통해 핵무기 과학과 공학 계산뿐만 아니라 핵무기 [[시스템]]의 성능 평가 및 안전성과 신뢰성을 보장하기 위해 개발되었다. 오크리지 국립연구소(Oak Ridge National Laboratory, ORNL)에 있는 슈퍼[[컴퓨터]] [[서밋]](Summit)과 구조 면에서 매우 유사하며 시에라 시스템은 [[아이비엠]](IBM)과 [[엔비디아]](NVIDIA) [[프로세서]]를 함께 사용한다. 2020년 6월 기준 94.64페타[[플롭스]]의 실측 성능을 보유한 시에라는 전 세계 슈퍼컴퓨터 순위를 발표하는 톱 500(TOP 500)에서 3위를 기록했다.
  
 
==개요==
 
==개요==
 
2014년 11월 미국 에너지부(Department of Energy, DoE)는 오크리지와 리버모어 국립연구소에 슈퍼컴퓨터 서밋과 시에라를 개발하기 위해 아이비엠(IBM)과 엔비디아(NVIDIA), 멜라녹스(Mellanox)와 325만 달러(약 3,800억 원)의 계약을 체결했다. 그 때문에 서밋과 시에라는 형제 컴퓨터라고 불리며 컴퓨터 구조적으로 매우 유사한 특징을 가지게 된다. 최신 첨단 기술 고성능 컴퓨팅 시스템인 시에라는  미국 에너지부 산하의 핵무기 개발 총괄 기관인 국가 핵 보안국(NNSA)의 3개의 원자력 보안 연구소인 로렌스 리버모어, 산디아, 로스앨러모스 국립 연구소에서 국가 핵 비축량의 안전, 보안 및 효과를 보장하는 국가 핵 보안국의 핵심 임무를 지원하는 높은 충실도의 시뮬레이션을 제공하기 위해 설계되었다. 2018년 6월에 로렌스 리버모어 국립연구소의 [[슈퍼컴퓨터]] 라인업에 합류하게 되었고, 시에라 시스템은 지하 실험 대신 시뮬레이션을 통해 원자력 안전청의 비축 스튜어드십 임무를 완수하기 위해 핵무기 과학자에게 필수적인 연산 자원을 제공하게 된다. 첨단 [[시뮬레이션]] 및 컴퓨팅 프로그램 과학자와 엔지니어는 시에라를 사용하여 핵무기 과학과 공학 계산뿐만 아니라 핵무기 시스템의 성능을 평가할 수 있었다. 이러한 계산은 물리학의 주요 이슈를 이해함으로써 성립되었지만, 해당 지식은 나중에 통합 설계 코드로 들어가게 되었다. 시에라에 관한 이 연구는 비확산 및 대테러와 같은 다른 국제적이고 국가적 도전과제에 큰 영향을 미칠 것으로 평가된다.
 
2014년 11월 미국 에너지부(Department of Energy, DoE)는 오크리지와 리버모어 국립연구소에 슈퍼컴퓨터 서밋과 시에라를 개발하기 위해 아이비엠(IBM)과 엔비디아(NVIDIA), 멜라녹스(Mellanox)와 325만 달러(약 3,800억 원)의 계약을 체결했다. 그 때문에 서밋과 시에라는 형제 컴퓨터라고 불리며 컴퓨터 구조적으로 매우 유사한 특징을 가지게 된다. 최신 첨단 기술 고성능 컴퓨팅 시스템인 시에라는  미국 에너지부 산하의 핵무기 개발 총괄 기관인 국가 핵 보안국(NNSA)의 3개의 원자력 보안 연구소인 로렌스 리버모어, 산디아, 로스앨러모스 국립 연구소에서 국가 핵 비축량의 안전, 보안 및 효과를 보장하는 국가 핵 보안국의 핵심 임무를 지원하는 높은 충실도의 시뮬레이션을 제공하기 위해 설계되었다. 2018년 6월에 로렌스 리버모어 국립연구소의 [[슈퍼컴퓨터]] 라인업에 합류하게 되었고, 시에라 시스템은 지하 실험 대신 시뮬레이션을 통해 원자력 안전청의 비축 스튜어드십 임무를 완수하기 위해 핵무기 과학자에게 필수적인 연산 자원을 제공하게 된다. 첨단 [[시뮬레이션]] 및 컴퓨팅 프로그램 과학자와 엔지니어는 시에라를 사용하여 핵무기 과학과 공학 계산뿐만 아니라 핵무기 시스템의 성능을 평가할 수 있었다. 이러한 계산은 물리학의 주요 이슈를 이해함으로써 성립되었지만, 해당 지식은 나중에 통합 설계 코드로 들어가게 되었다. 시에라에 관한 이 연구는 비확산 및 대테러와 같은 다른 국제적이고 국가적 도전과제에 큰 영향을 미칠 것으로 평가된다.
[[아이비엠]](IBM)이 구축한 시에라는 이전 슈퍼컴퓨터 [[세쿼이아]](Sequoia)의 약 6배 이상의 지속적인 처리 성능과 5배 이상의 지속 확장 가능한 과학 성능을 제공하며, 이론성능 125[[페타플롭스]](PFlops/s) 최고 속도를 자랑한다. 아이비엠의 파워 9(Power 9) [[프로세서]]와 [[엔비디아]](NVIDIA)의 볼타(Volta) 그래픽 처리 장치 등 두 가지 유형의 프로세서 칩을 결합한 시에라는 최대 전력 소비량이 약 11메가와트(MW)로 세쿼이아보다 전력 효율이 5배 이상 높은 수치를 나타낸다.<ref>리버모어 고성능 컴퓨팅센터 공식 홈페이지 - https://hpc.llnl.gov/hardware/platforms/sierra</ref> <ref name="inhpc">Rich Brueckner , 〈[https://insidehpc.com/2018/10/llnl-unveils-nnsas-sierra-worlds-third-fastest-supercomputer/ LLNL Unveils NNSA’s Sierra, World’s Third Fastest Supercomputer]〉, 《insideHPC》, 2018-10-28</ref>
+
[[아이비엠]](IBM)이 구축한 시에라는 이전 슈퍼컴퓨터 [[세쿼이아]](Sequoia)의 약 6배 이상의 지속적인 처리 성능과 5배 이상의 지속 확장 가능한 과학 성능을 제공하며, 이론성능 125페타[[플롭스]](PFlops/s) 최고 속도를 자랑한다. 아이비엠의 파워 9(Power 9) [[프로세서]]와 [[엔비디아]](NVIDIA)의 볼타(Volta) 그래픽 처리 장치 등 두 가지 유형의 프로세서 칩을 결합한 시에라는 최대 전력 소비량이 약 11메가와트(MW)로 세쿼이아보다 전력 효율이 5배 이상 높은 수치를 나타낸다.<ref>리버모어 고성능 컴퓨팅센터 공식 홈페이지 - https://hpc.llnl.gov/hardware/platforms/sierra</ref> <ref name="inhpc">Rich Brueckner , 〈[https://insidehpc.com/2018/10/llnl-unveils-nnsas-sierra-worlds-third-fastest-supercomputer/ LLNL Unveils NNSA’s Sierra, World’s Third Fastest Supercomputer]〉, 《insideHPC》, 2018-10-28</ref>
  
 
==특징==
 
==특징==
 
;구성
 
;구성
시에라는 애플리케이션 요구사항에 따라 고유한 시스템 구성을 제공함과 동시에 엔비디아 엔브이링크(NVIDIA NVLink) 고속 일관성 인터커넥트 기술을 사용하여 아이비엠 파워 중앙 처리장치(IBM POWER CPU)를 엔비디아 그래픽카드(NVIDIA GPU)와 긴밀하게 통합하는 효율적이고 확장 가능한 이기종 노드 아키텍처를 공유한다. 엔브이링크는 프시(PCIe) 3세대 'x16'의 5배에서 12배인 80에서 200기가바이트(GB/s) 사이의 대역폭으로 중앙 처리 장치와 그래픽카드 사이의 효율적인 에너지 및 고대역폭 경로 역할을 하므로 중앙 처리 장치와 그래픽카드의 메모리 공간을 병합하여 개발자(사용자)가 높은 데이터 처리량으로 데이터를 공유하면서 올바른 작업에 적합한 프로세서를 사용할 수 있도록 한다.
+
시에라는 [[애플리케이션]] 요구사항에 따라 고유한 시스템 구성을 제공함과 동시에 엔비디아 엔브이링크(NVIDIA NVLink) 고속 일관성 인터커넥트 기술을 사용하여 아이비엠 파워 [[중앙 처리 장치]](IBM POWER CPU)를 엔비디아 [[그래픽카드]](NVIDIA GPU)와 긴밀하게 통합하는 효율적이고 확장 가능한 이기종 [[노드]] [[아키텍처]]를 공유한다. 엔브이링크는 프시(PCIe) 3세대 'x16'의 5배에서 12배인 80에서 200기가[[바이트]](GB/s) 사이의 [[대역폭]]으로 중앙 처리 장치와 그래픽카드 사이의 효율적인 에너지 및 고대역폭 경로 역할을 하므로 중앙 처리 장치와 그래픽카드의 [[메모리]] 공간을 병합하여 개발자(사용자)가 높은 데이터 처리량으로 데이터를 공유하면서 올바른 작업에 적합한 프로세서를 사용할 수 있도록 한다.
컴퓨팅 노드에는 엔비디아 볼타(NVIDIA Volta) 아키텍처를 기반으로 하는 여러 대의 차세대 아이엠비 파워 9 중앙 처리 장치(IBM POWER9 CPU)와 엔비디아 테슬라 그래픽카드(NVIDIA Tesla GPU)가 포함되어 있기에 각 노드는 40 이상의 테라플롭스(TFlop/s)를 제공할 것으로 기대하며, 이는 하스웰 x86 중앙 처리 장치(Haswell x86 CPU) 서버의 전체 랙을 능가하기에 충분한 성능이다. 모든 데이터는 중앙 처리 장치 또는 엔브이 링크 인터커넥트에 의해 활성화된 중요한 기능인 그래픽카드에서 직접 주소를 지정할 수 있다. 안정적인 메모리양을 확장하게되면 노드당 800기가바이트의 엔브이램이 추가되는데 이 램은 버스트 버퍼 또는 확장 메모리로 구성할 수 있다.<ref name ="white"> 〈[http://info.nvidianews.com/rs/nvidia/images/An%20Inside%20Look%20at%20Summit%20and%20Sierra%20Supercomputers-3-1.pdf Summit and Sierra Supercomputers:An Inside Look at the U.S. Department of
+
컴퓨팅 노드에는 엔비디아 볼타(NVIDIA Volta) 아키텍처를 기반으로 하는 여러 대의 차세대 아이엠비 파워 9 중앙 처리 장치(IBM POWER9 CPU)와 엔비디아 테슬라 그래픽카드(NVIDIA Tesla GPU)가 포함되어 있기에 각 노드는 40 이상의 테라플롭스(TFlop/s)를 제공할 것으로 기대하며, 이는 하스웰 x86 중앙 처리 장치(Haswell x86 CPU) 서버의 전체 랙을 능가하기에 충분한 성능이다. 모든 데이터는 중앙 처리 장치 또는 엔브이 링크 인터커넥트에 의해 활성화된 중요한 기능인 그래픽카드에서 직접 주소를 지정할 수 있다. 안정적인 메모리양을 확장하게되면 노드당 800기가바이트의 엔브이램이 추가되는데 이 [[램]]은 버스트 버퍼 또는 확장 메모리로 구성할 수 있다.<ref name ="white"> 〈[http://info.nvidianews.com/rs/nvidia/images/An%20Inside%20Look%20at%20Summit%20and%20Sierra%20Supercomputers-3-1.pdf Summit and Sierra Supercomputers:An Inside Look at the U.S. Department of
 
Energy’s New Pre-Exascale Systems]〉, 《인비디아》</ref>
 
Energy’s New Pre-Exascale Systems]〉, 《인비디아》</ref>
  
 
;주요기술
 
;주요기술
슈퍼컴퓨터와 같은 고성능 컴퓨터 산업은 시스템을 구축할 때 중앙 처리 장치 아키텍처, 가속기 유형, 자체 호스팅 된 모델 및 이기종 모델, 업계 표준 또는 독점 네트워크 등 수많은 옵션에 의해 결정된다. 미국 에너지부는 다양한 제안을 분석한 후, 아이비엠 오픈 파워 아키텍처와 테슬라 가속 컴퓨팅을 기반으로 서밋 및 시에라 슈퍼컴퓨터를 구축하기로 했다. 테슬라 플랫폼을 기반의 기술은 다음과 같다. 차세대 아이비엠 오픈 파워 플랫폼과 엔비디아 테슬라 가속기 플랫폼, 이기종 컴퓨팅 모델과 엔비디아 엔브이링크 고속 그래픽카드 인터커넥트이다.
+
슈퍼컴퓨터와 같은 고성능 컴퓨터 산업은 시스템을 구축할 때 중앙 처리 장치 아키텍처, 가속기 유형, 자체 [[호스팅]] 된 모델 및 이기종 모델, 업계 표준 또는 독점 [[네트워크]] 등 수많은 옵션에 의해 결정된다. 미국 에너지부는 다양한 제안을 분석한 후, 아이비엠 오픈 파워 아키텍처와 테슬라 가속 컴퓨팅을 기반으로 서밋 및 시에라 슈퍼컴퓨터를 구축하기로 했다. [[테슬라]] [[플랫폼]]을 기반의 기술은 다음과 같다. 차세대 아이비엠 오픈 파워 플랫폼과 엔비디아 테슬라 가속기 플랫폼, 이기종 컴퓨팅 모델과 엔비디아 엔브이링크 고속 그래픽카드 인터커넥트이다.
  
 
이기종 컴퓨팅 모델은 고성능 컴퓨팅 애플리케이션이 데이터 및 작업을 시스템 노드 전체에 분산하고 알고리즘을 구성하여 수백만 또는 수십억 개의 데이터 요소에서 최대한 독립적으로 작동하게 하는 것이다. 하지만 단순한 애플리케이션도 처리량이 많은 병렬 계산 기간과 지연 시간에 민감한 직렬 작업 섹션 간에 여러 번 전환될 수 있다. 이상적인 컴퓨팅 엔진은 처리량 및 지연 시간에 민감한 컴퓨팅의 양극단 모두에서 최적의 성능을 발휘할 수 있지만, 물리학의 현실은 단일 프로세서 아키텍처와 기술 설계 지점으로는 이를 달성하기란 쉽지 않다. 결국 탁월한 성능을 위해 대기 시간에 최적화된 강력한 프로세서와 병렬 처리량에 최적화된 가속기를 결합한 이기종 컴퓨팅 모델(아키텍처)은 비전문적이고 단일적인 프로세서를 크게 능가할 수 있다. 이기종 컴퓨팅 모델의 최대 효율성은 다음과 같다.  
 
이기종 컴퓨팅 모델은 고성능 컴퓨팅 애플리케이션이 데이터 및 작업을 시스템 노드 전체에 분산하고 알고리즘을 구성하여 수백만 또는 수십억 개의 데이터 요소에서 최대한 독립적으로 작동하게 하는 것이다. 하지만 단순한 애플리케이션도 처리량이 많은 병렬 계산 기간과 지연 시간에 민감한 직렬 작업 섹션 간에 여러 번 전환될 수 있다. 이상적인 컴퓨팅 엔진은 처리량 및 지연 시간에 민감한 컴퓨팅의 양극단 모두에서 최적의 성능을 발휘할 수 있지만, 물리학의 현실은 단일 프로세서 아키텍처와 기술 설계 지점으로는 이를 달성하기란 쉽지 않다. 결국 탁월한 성능을 위해 대기 시간에 최적화된 강력한 프로세서와 병렬 처리량에 최적화된 가속기를 결합한 이기종 컴퓨팅 모델(아키텍처)은 비전문적이고 단일적인 프로세서를 크게 능가할 수 있다. 이기종 컴퓨팅 모델의 최대 효율성은 다음과 같다.  
그래픽카드에서 병렬 처리를 강조하는 아키텍처는 지연 시간을 최소화하기보다는 숨기는 처리량을 최적화한다. 수천 개의 스레드를 지원하여 높은 비율의 피크 성능을 유지할 수 있도록 데이터 종속성이 있는 경우에도 작업 풀을 즉시 사용할 수 있기 때문에 메모리 계층 구조 설계 기술은 비트당 최소 에너지로 처리량 성능을 위한 최적화를 철저하게 반영한다. 이와는 다르게 대기 시간에 최적화된 중앙 처리 장치 아키텍처는 전혀 다른 설계 결정을 내린다. 단일 명령 스레드의 실행을 가능한 최소 시간으로 압축하기 위해 설계된 기법에는 수천 개의 병렬 그래픽카드 스레드에 대해 복제하는 데 너무 많은 에너지가 소요되기 때문이다. 하지만 중앙 처리 장치에 완전히 적합한 다수의 아키텍처 기능이 필요하다. 이는 이기종 컴퓨팅 모델은 한 가지가 모두 적합한 것은 아니라는 뜻으로 워크로드의 병렬 및 직렬 세그먼트는 지연 시간에 최적화된 중앙 처리 장치 또는 처리량에 최적화된 그래픽카드라는 가장 적합한 프로세서에서 실행되므로 전체 성능이 빨라지고 효율이 향상되며 에너지 및 비용이 절감된다. 오크리지와 리버모어 국립연구소는 아이비엠과 엔비디아의 기술을 사용하여 이 강력한 이기종 컴퓨팅 모델을 기반으로 슈퍼컴퓨터 사전 확장 시스템을 구축하기로 선택했고, 아이비엠의 중앙 처리 장치와 엔비디아 그래픽카드 가속기는 세계에서 가장 빠르고 효율적인 프로세서가 되었다. 이러한 노드를 함께 결합하여 고성능 컴퓨팅 코드의 직렬 및 병렬 섹션을 모두 최소화할 수 있는 효율성이 높고 최적화된 이기종 노드가 완성이 된 것이다.<ref name ="white"></ref>
+
그래픽카드에서 병렬 처리를 강조하는 아키텍처는 지연 시간을 최소화하기보다는 숨기는 처리량을 최적화한다. 수천 개의 [[스레드]]를 지원하여 높은 비율의 피크 성능을 유지할 수 있도록 데이터 종속성이 있는 경우에도 작업 풀을 즉시 사용할 수 있기 때문에 메모리 계층 구조 설계 기술은 비트당 최소 에너지로 처리량 성능을 위한 최적화를 철저하게 반영한다. 이와는 다르게 대기 시간에 최적화된 중앙 처리 장치 아키텍처는 전혀 다른 설계 결정을 내린다. 단일 명령 스레드의 실행을 가능한 최소 시간으로 압축하기 위해 설계된 기법에는 수천 개의 병렬 그래픽카드 스레드에 대해 복제하는 데 너무 많은 에너지가 소요되기 때문이다. 하지만 중앙 처리 장치에 완전히 적합한 다수의 아키텍처 기능이 필요하다. 이는 이기종 컴퓨팅 모델은 한 가지가 모두 적합한 것은 아니라는 뜻으로 워크로드의 병렬 및 직렬 [[세그먼트]]는 지연 시간에 최적화된 중앙 처리 장치 또는 처리량에 최적화된 그래픽카드라는 가장 적합한 프로세서에서 실행되므로 전체 성능이 빨라지고 효율이 향상되며 에너지 및 비용이 절감된다. 오크리지와 리버모어 국립연구소는 아이비엠과 엔비디아의 기술을 사용하여 이 강력한 이기종 컴퓨팅 모델을 기반으로 슈퍼컴퓨터 사전 확장 시스템을 구축하기로 선택했고, 아이비엠의 중앙 처리 장치와 엔비디아 그래픽카드 가속기는 세계에서 가장 빠르고 효율적인 프로세서가 되었다. 이러한 노드를 함께 결합하여 고성능 컴퓨팅 코드의 직렬 및 병렬 섹션을 모두 최소화할 수 있는 효율성이 높고 최적화된 이기종 노드가 완성이 된 것이다.<ref name ="white"></ref>
  
엔비디아 고속 그래픽카드 인터커넥트는 기존 프시(PCIe) 3세대 'x16'보다 5배에서 12배 빠른 속도로 노드의 데이터를 이동하는 데 최대 3배 적은 에너지를 사용하는 에너지 효율적인 고대역폭 통신 채널이다. 엔비디아 그래픽카드 아키텍처에서 처음 제공되는 엔브이링크는 중앙 처리 장치와 그래픽카드 간에 또는 그래픽카드 간에 빠른 통신을 지원한다. 시에라 시스템에서 엔브이링크는 서버 노드 아키텍처의 핵심 기술로, 시에라의 중앙 처리 장치(IBM POWER CPU)와 그래픽카드(NVIDIA GPU)가 서로의 메모리에 빠르고 원활하게 액세스할 수 있어 별도로 부착된 데이터의 가시적 차이를 지우게 돼 중앙 처리 장치의 메모리 시스템과 고속 인터커넥트로 그래픽카드의 메모리 시스템을 연결한다. 또한, 프로세서 모두 자체 메모리 컨트롤러를 가지고 있기 때문에, 기본 메모리 시스템은 서로 다르게 최적화 할 수 있다. 그 밖에도 노드 요소 간 대역폭이 많이 증가하여 애플리케이션 성능이 향상하는 점과 유니피드 메모리(Unified Memory) 기술이 적용되어, 개발자에게 높은 성능과 동시에 코드를 더 매끄럽게 작성할 수 있게 하며 설계 유연성을 제공하여 병렬 및 직렬 성능 비율이 다른 시스템을 지원하게 된다. 이러한 엔브이링크의 유연성을 통해 암달(Amdahl) 현상의 영향을 최소화하고 시스템 성능을 극대화하기 위해 예상 워크로드에 최적화된 시스템을 설계하고 구축할 수 있게 된다.<ref name ="white"></ref>
+
엔비디아 고속 그래픽카드 인터커넥트는 기존 프시(PCIe) 3세대 'x16'보다 5배에서 12배 빠른 속도로 노드의 데이터를 이동하는 데 최대 3배 적은 에너지를 사용하는 에너지 효율적인 고대역폭 통신 [[채널]]이다. 엔비디아 그래픽카드 아키텍처에서 처음 제공되는 엔브이링크는 중앙 처리 장치와 그래픽카드 간에 또는 그래픽카드 간에 빠른 통신을 지원한다. 시에라 시스템에서 엔브이링크는 서버 노드 아키텍처의 핵심 기술로, 시에라의 중앙 처리 장치(IBM POWER CPU)와 그래픽카드(NVIDIA GPU)가 서로의 메모리에 빠르고 원활하게 액세스할 수 있어 별도로 부착된 데이터의 가시적 차이를 지우게 돼 중앙 처리 장치의 메모리 시스템과 고속 인터커넥트로 그래픽카드의 메모리 시스템을 연결한다. 또한, 프로세서 모두 자체 메모리 컨트롤러를 가지고 있기 때문에, 기본 메모리 시스템은 서로 다르게 최적화 할 수 있다. 그 밖에도 노드 요소 간 대역폭이 많이 증가하여 애플리케이션 성능이 향상하는 점과 유니피드 메모리(Unified Memory) 기술이 적용되어, 개발자에게 높은 성능과 동시에 코드를 더 매끄럽게 작성할 수 있게 하며 설계 유연성을 제공하여 병렬 및 직렬 성능 비율이 다른 시스템을 지원하게 된다. 이러한 엔브이링크의 유연성을 통해 암달(Amdahl) 현상의 영향을 최소화하고 시스템 성능을 극대화하기 위해 예상 워크로드에 최적화된 시스템을 설계하고 구축할 수 있게 된다.<ref name ="white"></ref>
  
 
==성능==
 
==성능==
103번째 줄: 103번째 줄:
 
|-
 
|-
 
|align=center|6
 
|align=center|6
|align=center|HPC5  
+
|align=center|[[HPC5]]
 
|align=center|35.45
 
|align=center|35.45
 
|align=center|Dell EMC, 이탈리아
 
|align=center|Dell EMC, 이탈리아
110번째 줄: 110번째 줄:
 
|-
 
|-
 
|align=center|7
 
|align=center|7
|align=center|셀린(Selene)  
+
|align=center|셀린([[Selene]])  
 
|align=center|27.58
 
|align=center|27.58
 
|align=center|Nvidia, 미국
 
|align=center|Nvidia, 미국
117번째 줄: 117번째 줄:
 
|-
 
|-
 
|align=center|8
 
|align=center|8
|align=center|프론테라(Frontera)  
+
|align=center|[[프론테라]](Frontera)  
 
|align=center|23.51
 
|align=center|23.51
 
|align=center|Dell EMC, 미국
 
|align=center|Dell EMC, 미국
124번째 줄: 124번째 줄:
 
|-
 
|-
 
|align=center|9
 
|align=center|9
|align=center|마크로니-100(Marconi-100)
+
|align=center|[[마크로니100]](Marconi-100)
 
|align=center|21,640
 
|align=center|21,640
 
|align=center|IBM, 이탈리아
 
|align=center|IBM, 이탈리아
131번째 줄: 131번째 줄:
 
|-
 
|-
 
|align=center|10
 
|align=center|10
|align=center|Piz Daint  
+
|align=center|[[피즈 다인트]](Piz Daint)
 
|align=center|21.23
 
|align=center|21.23
 
|align=center|Cray/HPE, 스위스
 
|align=center|Cray/HPE, 스위스

2020년 8월 24일 (월) 10:26 판

슈퍼컴퓨터 시에라(Sierra)

시에라(Sierra)는 2018년 미국 로렌스 리버모어 국립연구소(Lawrence Livermore National Laboratory, LLNL)에 있는 슈퍼컴퓨터이다. 시에라는 미국 원자력 안전부가 제2의 첨단 기술 시스템으로 시뮬레이션을 통해 핵무기 과학과 공학 계산뿐만 아니라 핵무기 시스템의 성능 평가 및 안전성과 신뢰성을 보장하기 위해 개발되었다. 오크리지 국립연구소(Oak Ridge National Laboratory, ORNL)에 있는 슈퍼컴퓨터 서밋(Summit)과 구조 면에서 매우 유사하며 시에라 시스템은 아이비엠(IBM)과 엔비디아(NVIDIA) 프로세서를 함께 사용한다. 2020년 6월 기준 94.64페타플롭스의 실측 성능을 보유한 시에라는 전 세계 슈퍼컴퓨터 순위를 발표하는 톱 500(TOP 500)에서 3위를 기록했다.

개요

2014년 11월 미국 에너지부(Department of Energy, DoE)는 오크리지와 리버모어 국립연구소에 슈퍼컴퓨터 서밋과 시에라를 개발하기 위해 아이비엠(IBM)과 엔비디아(NVIDIA), 멜라녹스(Mellanox)와 325만 달러(약 3,800억 원)의 계약을 체결했다. 그 때문에 서밋과 시에라는 형제 컴퓨터라고 불리며 컴퓨터 구조적으로 매우 유사한 특징을 가지게 된다. 최신 첨단 기술 고성능 컴퓨팅 시스템인 시에라는 미국 에너지부 산하의 핵무기 개발 총괄 기관인 국가 핵 보안국(NNSA)의 3개의 원자력 보안 연구소인 로렌스 리버모어, 산디아, 로스앨러모스 국립 연구소에서 국가 핵 비축량의 안전, 보안 및 효과를 보장하는 국가 핵 보안국의 핵심 임무를 지원하는 높은 충실도의 시뮬레이션을 제공하기 위해 설계되었다. 2018년 6월에 로렌스 리버모어 국립연구소의 슈퍼컴퓨터 라인업에 합류하게 되었고, 시에라 시스템은 지하 실험 대신 시뮬레이션을 통해 원자력 안전청의 비축 스튜어드십 임무를 완수하기 위해 핵무기 과학자에게 필수적인 연산 자원을 제공하게 된다. 첨단 시뮬레이션 및 컴퓨팅 프로그램 과학자와 엔지니어는 시에라를 사용하여 핵무기 과학과 공학 계산뿐만 아니라 핵무기 시스템의 성능을 평가할 수 있었다. 이러한 계산은 물리학의 주요 이슈를 이해함으로써 성립되었지만, 해당 지식은 나중에 통합 설계 코드로 들어가게 되었다. 시에라에 관한 이 연구는 비확산 및 대테러와 같은 다른 국제적이고 국가적 도전과제에 큰 영향을 미칠 것으로 평가된다. 아이비엠(IBM)이 구축한 시에라는 이전 슈퍼컴퓨터 세쿼이아(Sequoia)의 약 6배 이상의 지속적인 처리 성능과 5배 이상의 지속 확장 가능한 과학 성능을 제공하며, 이론성능 125페타플롭스(PFlops/s) 최고 속도를 자랑한다. 아이비엠의 파워 9(Power 9) 프로세서엔비디아(NVIDIA)의 볼타(Volta) 그래픽 처리 장치 등 두 가지 유형의 프로세서 칩을 결합한 시에라는 최대 전력 소비량이 약 11메가와트(MW)로 세쿼이아보다 전력 효율이 5배 이상 높은 수치를 나타낸다.[1] [2]

특징

구성

시에라는 애플리케이션 요구사항에 따라 고유한 시스템 구성을 제공함과 동시에 엔비디아 엔브이링크(NVIDIA NVLink) 고속 일관성 인터커넥트 기술을 사용하여 아이비엠 파워 중앙 처리 장치(IBM POWER CPU)를 엔비디아 그래픽카드(NVIDIA GPU)와 긴밀하게 통합하는 효율적이고 확장 가능한 이기종 노드 아키텍처를 공유한다. 엔브이링크는 프시(PCIe) 3세대 'x16'의 5배에서 12배인 80에서 200기가바이트(GB/s) 사이의 대역폭으로 중앙 처리 장치와 그래픽카드 사이의 효율적인 에너지 및 고대역폭 경로 역할을 하므로 중앙 처리 장치와 그래픽카드의 메모리 공간을 병합하여 개발자(사용자)가 높은 데이터 처리량으로 데이터를 공유하면서 올바른 작업에 적합한 프로세서를 사용할 수 있도록 한다. 컴퓨팅 노드에는 엔비디아 볼타(NVIDIA Volta) 아키텍처를 기반으로 하는 여러 대의 차세대 아이엠비 파워 9 중앙 처리 장치(IBM POWER9 CPU)와 엔비디아 테슬라 그래픽카드(NVIDIA Tesla GPU)가 포함되어 있기에 각 노드는 40 이상의 테라플롭스(TFlop/s)를 제공할 것으로 기대하며, 이는 하스웰 x86 중앙 처리 장치(Haswell x86 CPU) 서버의 전체 랙을 능가하기에 충분한 성능이다. 모든 데이터는 중앙 처리 장치 또는 엔브이 링크 인터커넥트에 의해 활성화된 중요한 기능인 그래픽카드에서 직접 주소를 지정할 수 있다. 안정적인 메모리양을 확장하게되면 노드당 800기가바이트의 엔브이램이 추가되는데 이 은 버스트 버퍼 또는 확장 메모리로 구성할 수 있다.[3]

주요기술

슈퍼컴퓨터와 같은 고성능 컴퓨터 산업은 시스템을 구축할 때 중앙 처리 장치 아키텍처, 가속기 유형, 자체 호스팅 된 모델 및 이기종 모델, 업계 표준 또는 독점 네트워크 등 수많은 옵션에 의해 결정된다. 미국 에너지부는 다양한 제안을 분석한 후, 아이비엠 오픈 파워 아키텍처와 테슬라 가속 컴퓨팅을 기반으로 서밋 및 시에라 슈퍼컴퓨터를 구축하기로 했다. 테슬라 플랫폼을 기반의 기술은 다음과 같다. 차세대 아이비엠 오픈 파워 플랫폼과 엔비디아 테슬라 가속기 플랫폼, 이기종 컴퓨팅 모델과 엔비디아 엔브이링크 고속 그래픽카드 인터커넥트이다.

이기종 컴퓨팅 모델은 고성능 컴퓨팅 애플리케이션이 데이터 및 작업을 시스템 노드 전체에 분산하고 알고리즘을 구성하여 수백만 또는 수십억 개의 데이터 요소에서 최대한 독립적으로 작동하게 하는 것이다. 하지만 단순한 애플리케이션도 처리량이 많은 병렬 계산 기간과 지연 시간에 민감한 직렬 작업 섹션 간에 여러 번 전환될 수 있다. 이상적인 컴퓨팅 엔진은 처리량 및 지연 시간에 민감한 컴퓨팅의 양극단 모두에서 최적의 성능을 발휘할 수 있지만, 물리학의 현실은 단일 프로세서 아키텍처와 기술 설계 지점으로는 이를 달성하기란 쉽지 않다. 결국 탁월한 성능을 위해 대기 시간에 최적화된 강력한 프로세서와 병렬 처리량에 최적화된 가속기를 결합한 이기종 컴퓨팅 모델(아키텍처)은 비전문적이고 단일적인 프로세서를 크게 능가할 수 있다. 이기종 컴퓨팅 모델의 최대 효율성은 다음과 같다. 그래픽카드에서 병렬 처리를 강조하는 아키텍처는 지연 시간을 최소화하기보다는 숨기는 처리량을 최적화한다. 수천 개의 스레드를 지원하여 높은 비율의 피크 성능을 유지할 수 있도록 데이터 종속성이 있는 경우에도 작업 풀을 즉시 사용할 수 있기 때문에 메모리 계층 구조 설계 기술은 비트당 최소 에너지로 처리량 성능을 위한 최적화를 철저하게 반영한다. 이와는 다르게 대기 시간에 최적화된 중앙 처리 장치 아키텍처는 전혀 다른 설계 결정을 내린다. 단일 명령 스레드의 실행을 가능한 최소 시간으로 압축하기 위해 설계된 기법에는 수천 개의 병렬 그래픽카드 스레드에 대해 복제하는 데 너무 많은 에너지가 소요되기 때문이다. 하지만 중앙 처리 장치에 완전히 적합한 다수의 아키텍처 기능이 필요하다. 이는 이기종 컴퓨팅 모델은 한 가지가 모두 적합한 것은 아니라는 뜻으로 워크로드의 병렬 및 직렬 세그먼트는 지연 시간에 최적화된 중앙 처리 장치 또는 처리량에 최적화된 그래픽카드라는 가장 적합한 프로세서에서 실행되므로 전체 성능이 빨라지고 효율이 향상되며 에너지 및 비용이 절감된다. 오크리지와 리버모어 국립연구소는 아이비엠과 엔비디아의 기술을 사용하여 이 강력한 이기종 컴퓨팅 모델을 기반으로 슈퍼컴퓨터 사전 확장 시스템을 구축하기로 선택했고, 아이비엠의 중앙 처리 장치와 엔비디아 그래픽카드 가속기는 세계에서 가장 빠르고 효율적인 프로세서가 되었다. 이러한 노드를 함께 결합하여 고성능 컴퓨팅 코드의 직렬 및 병렬 섹션을 모두 최소화할 수 있는 효율성이 높고 최적화된 이기종 노드가 완성이 된 것이다.[3]

엔비디아 고속 그래픽카드 인터커넥트는 기존 프시(PCIe) 3세대 'x16'보다 5배에서 12배 빠른 속도로 노드의 데이터를 이동하는 데 최대 3배 적은 에너지를 사용하는 에너지 효율적인 고대역폭 통신 채널이다. 엔비디아 그래픽카드 아키텍처에서 처음 제공되는 엔브이링크는 중앙 처리 장치와 그래픽카드 간에 또는 그래픽카드 간에 빠른 통신을 지원한다. 시에라 시스템에서 엔브이링크는 서버 노드 아키텍처의 핵심 기술로, 시에라의 중앙 처리 장치(IBM POWER CPU)와 그래픽카드(NVIDIA GPU)가 서로의 메모리에 빠르고 원활하게 액세스할 수 있어 별도로 부착된 데이터의 가시적 차이를 지우게 돼 중앙 처리 장치의 메모리 시스템과 고속 인터커넥트로 그래픽카드의 메모리 시스템을 연결한다. 또한, 프로세서 모두 자체 메모리 컨트롤러를 가지고 있기 때문에, 기본 메모리 시스템은 서로 다르게 최적화 할 수 있다. 그 밖에도 노드 요소 간 대역폭이 많이 증가하여 애플리케이션 성능이 향상하는 점과 유니피드 메모리(Unified Memory) 기술이 적용되어, 개발자에게 높은 성능과 동시에 코드를 더 매끄럽게 작성할 수 있게 하며 설계 유연성을 제공하여 병렬 및 직렬 성능 비율이 다른 시스템을 지원하게 된다. 이러한 엔브이링크의 유연성을 통해 암달(Amdahl) 현상의 영향을 최소화하고 시스템 성능을 극대화하기 위해 예상 워크로드에 최적화된 시스템을 설계하고 구축할 수 있게 된다.[3]

성능

슈퍼컴퓨터의 성능은 1초에 실행할 수 있는 연산 명령수, 연산속도를 나타내는 플롭스(Flops)라는 단위를 이용해 표현한다. 다만 슈퍼컴퓨터는 매우 빠른 속도를 자랑하기에 그냥 플롭스를 쓰지는 않는다. 미터의 1,000배인 킬로미터가 있고, 또 그 1,000배인 메가 미터가 있는 것처럼 플롭스도 1,000배 단위로 킬로, 메가, 기가, 테라(TF), 페타(PF) 순으로 단위가 존재한다. 2020년 기준 슈퍼컴퓨터는 주로 페타플롭스(PFlops)를 단위로 사용하며 이는 1초에 1,000조 연산이 가능한 수치다.[4]

2020 6월 시에라 성능
제조사 IBM / NVIDIA / Mellanox
코어수 1,572,480
메모리 1,382,400 GB
프로세서 IBM POWER9 22C 3.1GHz
인터커넥트 DUAL-RAIL MELLANOX EDR INFINIBAND
실측성능 94,640 TFlop/s
이론성능 125,712 TFlop/s
파워 7,438.28 kW
운영체제 Red Hat Enterprise Linux

순위

2018년 6월 시에라는 전 세계 슈퍼컴퓨터의 순위를 발표하는 톱 500(TOP 500) 순위에서 3위를 차지하면서 톱 리스트에 처음으로 이름을 올렸다. 당해 11월 업그레이드를 통해 71.61페타플롭스에서 94.64페타플롭스로 실측성능 향상을 하게 되었으며 당시 93.01페타플롭스의 성능으로 슈퍼컴퓨터 순위 2위를 차지하고 있던 중국의 컴퓨터 선웨이타이후라이트를 약 1.5페타플롭스 차이로 앞지르며 2위 자리에 오르게 되었다. 이후 2020년 6월 일본의 슈퍼컴퓨터 후가쿠가 등장과 동시에 성능 순위 1위를 차지하게 되면서 시에라의 순위는 자연스럽게 3위로 떨어지게 되었다.[5]

2020년 8월 기준 슈퍼컴퓨터 TOP10
순위 이름 최고성능 제조사, 국가 프로세서 운영체제
1 후가쿠(Fugaku) 415.5 Fujitsu, 일본 A64FX 48C 2.2GHz Red Hat Enterprise Linux
2 서밋(Summit) 148.6 IBM, 미국 IBM POWER9 22C 3.07GHz, NVIDIA VOLTA GV100 RHEL 7.4
3 시에라(Sierra) 94.6 IBM, 미국 IBM POWER9 22C 3.1GHz, NVIDIA VOLTA GV100 Red Hat Enterprise Linux
4 선웨이 타이후라이트
(Sunway TaihuLight)
93.01 NRCPC, 중국 Sunway SW26010 260C 1.45GHz Sunway RaiseOS 2.0.5
5 티앤허-2A(Tianhe-2A) 61.44 NUDT, 중국 Intel Xeon E5-2692v2 12C 2.2GHz, MATRIX-2000 Kylin Linux
6 HPC5 35.45 Dell EMC, 이탈리아 Xeon Gold 6252 24C 2.1GHz, NVIDIA Tesla V100, CentOS Linux 7
7 셀린(Selene) 27.58 Nvidia, 미국 AMD EPYC 7742 64C 2.25GHz, NVIDIA A100, Ubuntu 18.04.01
8 프론테라(Frontera) 23.51 Dell EMC, 미국 Xeon Platinum 8280 28C 2.7GHz CentOS Linux 7
9 마크로니100(Marconi-100) 21,640 IBM, 이탈리아 IBM POWER9 16C 3GHz, Nvidia Volta V100, RHEL 7.6
10 피즈 다인트(Piz Daint) 21.23 Cray/HPE, 스위스 Xeon E5-2690v3 12C 2.6GHz, NVIDIA Tesla P100, Cray Linux Environment
'최고성능' 단위는 페타플롭스(Pflops)이다.

활용

시에라는 국가 핵 보안국(NNSA)의 비축 관리 프로그램, 무기 과학 및 핵 억제와 같은 국가 안보를 위해 사용될 것이다. 이 모든 것은 핵 및 핵 방어 시뮬레이션을 수행하기 위한 코드이므로 더 이상 사막 한가운데 또는 지하에서 핵폭탄을 테스트할 필요가 없게 되었다. 물론 시에라가 사회에 도움이 되는 다른 과학 연구에도 사용될 것이며 로렌스 리버모어 국립연구소는 시에라가 항암제 연구, 정밀 의학, 지진학, 기후, 천체 물리학, 재료 과학 등과 같은 프로젝트에 활용될 것이라고 언급했다. 하지만 군사 연구에 설계 목적을 둔 시에라는 지하 핵실험, 핵무기를 성능 평가 및 수학 계산 등의 핵무기 시뮬레이션을 하는 데 전념하고 있기 때문에 이에 대한 자세하고 구체적인 연구 및 활동 자료는 기밀 자료이다.[6]

전망

형제 컴퓨터인 서밋과 시에라는 엑사스케일(Exascal) 컴퓨팅에 도달하기 위한 고성능 컴퓨팅의 이정표 역할을 맡고 있다. 엑사스케일 이전 시스템을 통해 미국 에너지부는 차세대 슈퍼컴퓨터를 선점하는 동시에 과학적인 발견과 경제 경제력에서 우위를 유지할 수 있도록 하는 리더십의 위치를 유지하고 있다. 중앙 처리 장치 기반 시스템은 전년 대비 성능 향상을 이룰 수 없는 벽에 부딪힌 지 오랫동안으로 따라서 가속기 또는 자체 호스팅 컴퓨팅 모델에 대한 문제는 논의되지 않고 있지만, 중앙 처리 장치 아키텍처, 가속기 아키텍처, 노드 간 인터커넥트, 인트라노드 인터커넥트, 이기종 대 자체 호스팅 컴퓨팅 모델과 같은 다른 문제는 남아 있는 상황이며 이러한 문제를 염두에 두고 미국 에너지부는 이기종 컴퓨팅 모델 간 연결과 프로세서 인터커넥트, 그래픽카드와 중앙 처리 장치와 같은 프로세서 기술 확장하는 것이 엑사스케일 슈퍼컴퓨터를 구현하는 데 최선이라고 말했다.[3] Sierra는 세계적 수준의 로렌스 리버모어 국립연구소의 슈퍼컴퓨터의 긴 계보를 이었으며, 향후 2023년까지 달성될 것으로 예상되는 국가 핵 보안국의 엑사스케일 컴퓨팅으로의 전환을 위한 단계를 나타낸다. 국가 핵 보안국의 고급 시뮬레이션 컴퓨팅(ASC)프로그램을 통해 자금을 지원받는 앨카피탄(ElCapitan)은 국가 핵 보안국의 첫 번째 엑사스케일 슈퍼컴퓨터가 될 것이며, 이는 시에라에 비해 약 10배 높은 성능을 발휘할 것이다.[2]

각주

  1. 리버모어 고성능 컴퓨팅센터 공식 홈페이지 - https://hpc.llnl.gov/hardware/platforms/sierra
  2. 2.0 2.1 Rich Brueckner , 〈LLNL Unveils NNSA’s Sierra, World’s Third Fastest Supercomputer〉, 《insideHPC》, 2018-10-28
  3. 3.0 3.1 3.2 3.3 〈[http://info.nvidianews.com/rs/nvidia/images/An%20Inside%20Look%20at%20Summit%20and%20Sierra%20Supercomputers-3-1.pdf Summit and Sierra Supercomputers:An Inside Look at the U.S. Department of Energy’s New Pre-Exascale Systems]〉, 《인비디아》
  4. 기초과학연구원(IBS) 공식 블로그 - https://blog.naver.com/ibs_official/221527670881
  5. 톱 500(TOP 500) 공식 홈페이지 - https://top500.org/system/179398/
  6. Timothy Prickett Morgan , 〈[https://www.nextplatform.com/2017/10/05/clever-machinations-livermores-sierra-supercomputer/ THE CLEVER MACHINATIONS OF LIVERMORE’S SIERRA SUPERCOMPUTER]〉, 《THENEXTPLATFORM》, 2017-10-05

참고자료

같이 보기


  검수요청.png검수요청.png 이 시에라 문서는 컴퓨터에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.