검수요청.png검수요청.png

"서밋"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
(구성)
8번째 줄: 8번째 줄:
 
서밋의 노드는 2개의 아이비엠 파워 9 중앙 처리 장치(IBM Power 9 CPU)와 6개의 엔비디아 V100 그래픽카드(NVIDIA V100 GPU), 중앙 처리 장치 간, 중앙 처리 장치와 그래픽 카드 간 고속 통신을 위한 엔브이링크(NVLink), 0.5테라바이트 이상의 메모리와 효율적인 입출력(I/O)을 위한 대형 버스트 버퍼로 구성되어 있다. 버스트 버퍼는 애플리케이션과 병렬 파일 시스템(PFS) 사이에 위치한 중간 고속 스토리지 계층으로, 애플리케이션에서 생성된 대량의 데이터를 병렬 파일 시스템보다 4~5배 빠른 속도로 흡수하는 동시에 데이터를 백그라운드의 병렬 파일 시스템으로 원활하게 배출한다. 결과적으로 버스트 버퍼는 입출력장치의 처리속도를 촉진 시켜 프로그램이 더 빠른 연산을 수행 할 수 있게 하며 때문에 버스터 버퍼는 높은 입출력장치 처리량, 낮은 액세스 지연시간, 높은 신뢰성과 같은 몇 가지 바람직한 속성을 가진 비휘발성 메모리 장치로 구성된다.  
 
서밋의 노드는 2개의 아이비엠 파워 9 중앙 처리 장치(IBM Power 9 CPU)와 6개의 엔비디아 V100 그래픽카드(NVIDIA V100 GPU), 중앙 처리 장치 간, 중앙 처리 장치와 그래픽 카드 간 고속 통신을 위한 엔브이링크(NVLink), 0.5테라바이트 이상의 메모리와 효율적인 입출력(I/O)을 위한 대형 버스트 버퍼로 구성되어 있다. 버스트 버퍼는 애플리케이션과 병렬 파일 시스템(PFS) 사이에 위치한 중간 고속 스토리지 계층으로, 애플리케이션에서 생성된 대량의 데이터를 병렬 파일 시스템보다 4~5배 빠른 속도로 흡수하는 동시에 데이터를 백그라운드의 병렬 파일 시스템으로 원활하게 배출한다. 결과적으로 버스트 버퍼는 입출력장치의 처리속도를 촉진 시켜 프로그램이 더 빠른 연산을 수행 할 수 있게 하며 때문에 버스터 버퍼는 높은 입출력장치 처리량, 낮은 액세스 지연시간, 높은 신뢰성과 같은 몇 가지 바람직한 속성을 가진 비휘발성 메모리 장치로 구성된다.  
  
엔브이링크는 이전 타이탄 슈퍼컴퓨터의 그래픽카드가 프시(PCle) 인터페이스에 의해 중앙 처리 장치 메모리 시스템에 액세스 할 수 있는 속도를 제한하는 점을 개선하고자 개발된 것으로 중앙 처리 장치 간, 중앙 처리 장치와 그래픽카드 간의 통신에 엔비디아 엔브이링크 상호연결을 사용한다. 엔브이링크는 모든 프로세서(CPU, GPU) 간에 2개의 링크를 제공하며, 각 링크는 각 방향에서 최대 초당 25기가바이트(GB/s) 대역폭을 제공한다. 총 100기가바이트의 최대 양방향 대역폭을 지원하는 이러한 링크는 서밋에서 가속화된 애플리케이션의 성능에 필수적이다. 또한, 엔브이링크와 함께 제공되는 더 빠른 데이터 이동과 통합 메모리라는 또 다른 기능이 결합하여 그래픽카드 가속기 프로그래밍을 단순화한다. 통합 메모리를 통해 프로그래머는 중앙 처리 장치와 그래픽카드 메모리를 하나의 메모리 블록으로 취급할 수 있어 프로그래머는 데이터가 어떤 메모리에 있는지 걱정하지 않고 데이터를 조작 할 수 있게 된다.<ref name="오크공"></ref>
+
엔브이링크는 이전 타이탄 슈퍼컴퓨터의 그래픽카드가 프시(PCle) 인터페이스에 의해 중앙 처리 장치 메모리 시스템에 액세스 할 수 있는 속도를 제한하는 점을 개선하고자 개발된 것으로 중앙 처리 장치 간, 중앙 처리 장치와 그래픽카드 간의 통신에 엔비디아 엔브이링크 상호연결을 사용한다. 엔브이링크는 모든 프로세서(CPU, GPU) 간에 2개의 링크를 제공하며, 각 링크는 각 방향에서 최대 초당 25기가바이트(GB/s) 대역폭을 제공하며 이것은 이기종 컴퓨팅 모델 연결을 허용한다. 총 100기가바이트의 최대 양방향 대역폭을 지원하는 이러한 링크는 서밋에서 가속화된 애플리케이션의 성능에 필수적이다. 또한, 엔브이링크와 함께 제공되는 더 빠른 데이터 이동과 통합 메모리라는 또 다른 기능이 결합하여 그래픽카드 가속기 프로그래밍을 단순화한다. 통합 메모리를 통해 프로그래머는 중앙 처리 장치와 그래픽카드 메모리를 하나의 메모리 블록으로 취급할 수 있어 프로그래머는 데이터가 어떤 메모리에 있는지 걱정하지 않고 데이터를 조작 할 수 있게 된다. 마지막으로 네트워크 내 컴퓨팅 가속화를 제공하는 프로세스 간 통신 트래픽과 스토리지 간 통신 트래픽 모두를 위한 이중 레일 멜러낙스 이디알 인피니밴드(Mellanox EDR InfiniBand) 인터커넥트를 사용한다. 때문에 노드 간 초당 200기가바이트의 대역폭과 통신 프레임워크가 구성되어 높은 데이터 처리량을 제공한다. 
 +
<ref name="오크공"></ref>
 +
https://en.wikipedia.org/wiki/Summit_(supercomputer)
  
 
==성능==
 
==성능==

2020년 8월 19일 (수) 15:12 판

서밋(summit)

서밋(Summit)은 아이비엠(IBM)이 제작한 최첨단 슈퍼컴퓨터로 미국 오크리지 국립 연구소(Oak Ridge National Laboratory)에서 운영하고 있다. 2018년 6월 출시 당시 서밋의 성능 이론치는 187페타플롭스(Petaflops)이며, 린팩(linpack) 밴치마크에서 실측 성능을 122페타플롭스를 기록하여 세계 최고의 컴퓨터가 되었다. 이후 2019년 11월까지 전 세계 슈퍼컴퓨터 성능 1위를 달성했으며 2020년 6월, 일본 이화학연구소와 후지쓰가 공동개발한 슈퍼컴퓨터 후가쿠의 등장으로 한 순위 밀려 2위가 되었다.

개요

미국 에너지부의 오크리지 국립 연구소는 2014년 11월에 아이비엠, 엔비디아, 멜라노스와 325만 달러(약 3,800억 원)의 계약을 체결함으로써 슈퍼컴퓨터 서밋과 시에라가 탄생했다. 시에라는 핵무기 시뮬레이션을 위해 설계되었고 서밋은 민간 과학 및 연구를 담당했으며 우주론, 의학, 기후학 등 다양한 분야에 활용 가능했다. 서밋을 수용하기 위해서는 약 2개의 농구코트가 들어갈 공간을 사용했으며 케이블 연결에는 약 136마일(218.8km)의 케이블이 사용됐다. 서밋은 과학자와 연구자에게 에너지, 인공지능, 생명공학 등 다양한 연구 분야의 복잡한 과제들을 해결할 기회를 제공하며 인공지능과 과학, 게노믹스를 이용한 각종 시뮬레이션, 물리학의 뉴트리노의 수명 등을 예측하는 데 사용되었다. 이전 슈퍼컴퓨터인 타이탄보다 약 8배 뛰어난 성능을 가졌으며 7년간 미국의 여러 핵심 작업을 지휘했던 타이탄이 은퇴한 후로는 서밋이 이를 대체했다.[1] [2]

구성

서밋의 노드는 2개의 아이비엠 파워 9 중앙 처리 장치(IBM Power 9 CPU)와 6개의 엔비디아 V100 그래픽카드(NVIDIA V100 GPU), 중앙 처리 장치 간, 중앙 처리 장치와 그래픽 카드 간 고속 통신을 위한 엔브이링크(NVLink), 0.5테라바이트 이상의 메모리와 효율적인 입출력(I/O)을 위한 대형 버스트 버퍼로 구성되어 있다. 버스트 버퍼는 애플리케이션과 병렬 파일 시스템(PFS) 사이에 위치한 중간 고속 스토리지 계층으로, 애플리케이션에서 생성된 대량의 데이터를 병렬 파일 시스템보다 4~5배 빠른 속도로 흡수하는 동시에 데이터를 백그라운드의 병렬 파일 시스템으로 원활하게 배출한다. 결과적으로 버스트 버퍼는 입출력장치의 처리속도를 촉진 시켜 프로그램이 더 빠른 연산을 수행 할 수 있게 하며 때문에 버스터 버퍼는 높은 입출력장치 처리량, 낮은 액세스 지연시간, 높은 신뢰성과 같은 몇 가지 바람직한 속성을 가진 비휘발성 메모리 장치로 구성된다.

엔브이링크는 이전 타이탄 슈퍼컴퓨터의 그래픽카드가 프시(PCle) 인터페이스에 의해 중앙 처리 장치 메모리 시스템에 액세스 할 수 있는 속도를 제한하는 점을 개선하고자 개발된 것으로 중앙 처리 장치 간, 중앙 처리 장치와 그래픽카드 간의 통신에 엔비디아 엔브이링크 상호연결을 사용한다. 엔브이링크는 모든 프로세서(CPU, GPU) 간에 2개의 링크를 제공하며, 각 링크는 각 방향에서 최대 초당 25기가바이트(GB/s) 대역폭을 제공하며 이것은 이기종 컴퓨팅 모델 연결을 허용한다. 총 100기가바이트의 최대 양방향 대역폭을 지원하는 이러한 링크는 서밋에서 가속화된 애플리케이션의 성능에 필수적이다. 또한, 엔브이링크와 함께 제공되는 더 빠른 데이터 이동과 통합 메모리라는 또 다른 기능이 결합하여 그래픽카드 가속기 프로그래밍을 단순화한다. 통합 메모리를 통해 프로그래머는 중앙 처리 장치와 그래픽카드 메모리를 하나의 메모리 블록으로 취급할 수 있어 프로그래머는 데이터가 어떤 메모리에 있는지 걱정하지 않고 데이터를 조작 할 수 있게 된다. 마지막으로 네트워크 내 컴퓨팅 가속화를 제공하는 프로세스 간 통신 트래픽과 스토리지 간 통신 트래픽 모두를 위한 이중 레일 멜러낙스 이디알 인피니밴드(Mellanox EDR InfiniBand) 인터커넥트를 사용한다. 때문에 노드 간 초당 200기가바이트의 대역폭과 통신 프레임워크가 구성되어 높은 데이터 처리량을 제공한다. [1] https://en.wikipedia.org/wiki/Summit_(supercomputer)

성능

순위

활용

각주

  1. 1.0 1.1 오크리지 리더쉽 컴퓨팅 시설 공식 홈페이지 - https://www.olcf.ornl.gov/olcf-resources/compute-systems/summit/summit-faqs/
  2. Summit (supercomputer) wikipedia - https://en.wikipedia.org/wiki/Summit_(supercomputer)

참고자료

같이보기

  검수요청.png검수요청.png 이 서밋 문서는 컴퓨터에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.