"누리온"의 두 판 사이의 차이
(다른 사용자 한 명의 중간 판 33개는 보이지 않습니다) | |||
1번째 줄: | 1번째 줄: | ||
− | '''누리온'''(NURION)이란 계산 노드, CPU-only 노드, Omni-Path 인터커넥트 네트워크, [[버스트 버퍼]](Burst Buffer) 고속 스토리지, | + | '''누리온'''(NURION) 이란 계산 노드, CPU-only 노드, 옴니패스(Omni-Path) 인터커넥트 네트워크, [[버스트 버퍼]](Burst Buffer) 고속 스토리지, 러스터(Lustre) 기반의병렬파일 시스템, RDHx(Rear Door Heat Exchanger) 기반의 수랭식 냉각장치로 구성된 [[시스템]]이다. |
+ | |||
+ | == 개요 == | ||
+ | 미국 [[크레이]](CRAY)사에서 도입한 누리온(크레이 CS500)은 1988년 1호기 도입 이래 5번째로 구축된 국가 슈퍼컴퓨터로 57만 20개의 [[코어]](Core)로 구성됐고, 고성능 PC 2만 대와 맞먹는 성능을 자랑한다. 누리온의 이론성능은 25.7[[페타플롭스]](PFlops)로 1초에 2경 5,700조 번의 부동소수점 연산이 가능하며 실측성능은 13.92페타플롭스로 2018년 6월 기준 전 세계 슈퍼컴퓨터 중 11위다. [[KISTI]]는 누리온을 통해 우주 기원 같은 초거대문제 연구뿐만 아니라 기업의 신제품 개발 및 시장 분석, 자연재해, 교통 문제 등 국가, 사회 현안 해결을 지원한다. 특히 [[빅데이터]] 처리와 [[인공지능]] 분야에서 수요가 많은 소프트웨어 등 맞춤형 환경을 제공하고 클라우드 기술을 통해 사용자가 원하는 컴퓨팅 환경을 구축할 수 있도록 지원해 컴퓨팅 분야 전문지식이나 경험이 없는 중소기업 및 개인 연구자 등도 쉽게 활용할 수 있도록 한다.<ref>권혁준 기자, 〈[https://www.sedaily.com/NewsVIew/1S73GO2J7B 국가 슈퍼컴퓨터 5호기 '누리온' 개통…고성능PC 2만대 성능]〉, 《서울경제》, 2018-11-07</ref> | ||
== 역사 == | == 역사 == | ||
− | + | [[카이스트]](KISTI)는 서울올림픽이 열린 1988년 처음으로 [[슈퍼컴퓨터]]를 도입하여 가동했다. 카이스트 만큼 큰 규모의 슈퍼컴퓨터를 운영하는 [[기상청]]은 이보다 11년 늦은 1999년 도입하고, 2000년부터 1호기를 가동했다. 카이스트는 1988년 1호기를 시작으로 거의 5년에서 8년마다 슈퍼컴퓨터를 도입했다. 5호기는 크레이사의 기종을 사용하여 도입됐다. 5호기의 이름은 누리온 이고 국민 공모를 통해 만들어진 이름이다. 대한민국 모든 국민이 슈퍼컴퓨터의 혜택을 고루 누릴 수 있도록 한다는 의미로 지어졌다.<ref>백지영 기자, 〈[http://m.ddaily.co.kr/m/m_article/?no=174614 국가 슈퍼컴퓨터 도입 30년 발전사]〉, 《디지털데일리》, 2018-11-08</ref> | |
+ | |||
+ | == 특징 == | ||
+ | 슈퍼컴퓨터 5호기 누리온의 대표적인 특징들을 보면 1 소켓당 성능이 3테라플롭스나 되는 매니 코어 중앙처리장치, 약 8,300여 개로 구성되어 국내 4차 산업혁명, 인공지능, [[사물인터넷]], 빅데이터 등을 주도할 수 있는 기반을 갖춘다. 그리고, 고성능 인터커넥트와 대용량 스토리지 및 응용프로그램에서 순간적으로 발생하는 대규모 입출력요청을 원활히 처리할 수 잇는 버스트 버퍼 등이 있다. 슈퍼컴퓨터의 월등한 계산 능력은 국가 연구개발의 경쟁력과 밀접한 관계가 있다. 날씨 예측이나 주가 예측 등 연필과 종이만으로는 풀기 어려운 복잡한 문제나 핵실험이나 신약개발 등 실험적으로만 해결하기에는 너무 위험하거나 비용이 많이 필요한 문제는 모두 슈퍼컴퓨터가 한다. 슈퍼컴퓨터 5호기 누리온 또한 복잡하고 어렵고 위험한 과학기술 문제를 해결하기 위해 기획 단계부터 슈퍼컴퓨터가 해결할 수 있는 다양한 분야의 난제를 발굴하는 노력이 병행된다. 이를 위해 주요 연구개발 분야별 전문가들을 대상으로 하는 표적 집단면접을 통해 슈퍼컴퓨터를 이용하여 해결할 난제들을 찾았다. 사회 안전을 위한 지진 해석 및 예측, 첨단 가상원자로 기술 개발, 우주 경쟁력 확보를 위한 가상우주발사체, 신약개발을 위한 가상 세포모델링 분야들이 모두 이런 난제에 해당한다. 슈퍼컴퓨터 5호기는 도출된 난제들의 시급성과 중요도에 따라 필요한 계산 수요를 충족시킬 수 있는 방향으로 설계됐다. 인공지능 기술의 근간이 되는 빅데이터 계산에 슈퍼컴퓨터는 없어서는 안될 필수 요소이며, 빅데이터와 인공지능이 결합한 신산업 발굴, 가상설계를 이용한 제조업 혁신 등 슈퍼컴퓨터가 필요한 분야는 폭발적으로 증가한다. 다양한 분야의 수요를 충족시키기 위해 5호기에는 유기적인 하드웨어와 소프트웨어 연동 기술과 함께 다양한 서비스 기술이 적용된다.<ref>국가슈퍼컴퓨팅센터 공식 홈페이지 - https://www.ksc.re.kr/ggspcpt/sg</ref> | ||
− | == | + | :{|class=wikitable width=900 |
− | + | |+<big>'''성능'''</big> | |
+ | !align=center colspan=2|프로그램 | ||
+ | !align=center|특징 | ||
+ | !align=center width=15%|노드 수 | ||
+ | !align=center|점수 | ||
+ | !align=center width=12%|순위 | ||
+ | |- | ||
+ | |align=center colspan=2|HPL | ||
+ | |align=center|대형 연립방정식 해석을 통해 실수연산 성능측정 | ||
+ | |align=center|8,174(계산노드)<br>+ 122(CPU-only) | ||
+ | |align=center|13.93 PF | ||
+ | |align=center|11등<br>(2018년 6월) | ||
+ | |- | ||
+ | |align=center colspan=2|HPCG | ||
+ | |align=center|편미분방정식을 수치 모델로하여 HPL과는 다른 평가기준 제시 | ||
+ | |align=center|8,250<br>(계산노드) | ||
+ | |align=center|0.39 PF | ||
+ | |align=center|8등<br>(2018년 11월) | ||
+ | |- | ||
+ | |align=center colspan=2|IO500 | ||
+ | |align=center|파일 입출력 관련 벤치마크 | ||
+ | |align=center|2,048<br>(계산노드) | ||
+ | |align=center|160.67 | ||
+ | |align=center|2등<br>(2018년 11월) | ||
+ | |- | ||
+ | |align=center rowspan=2|그래프500<br>(Graph500) | ||
+ | |align=center|너비 우선 탐색<br>(BFS) | ||
+ | |align=center|대규모 그래프분석 벤치마크로 넓이 우선 탐색 | ||
+ | |align=center|1,024<br>(계산노드) | ||
+ | |align=center|1456.46 GTEPS | ||
+ | |align=center|9등<br>(2019년 11월) | ||
+ | |- | ||
+ | |align=center|단일 출발지 최단 경로<br>(SSSP) | ||
+ | |align=center|대규모 그래프분석 벤치마크로 최단거리 계산 | ||
+ | |align=center|1,024<br>(계산노드) | ||
+ | |align=center|337.239 GTEPS | ||
+ | |align=center|3등<br>(2019년 11월) | ||
+ | |- | ||
+ | |}<ref name="성능">누리온 국가슈퍼컴퓨팅센터 - https://www.ksc.re.kr/mobile/ggspcpt/nurion</ref> | ||
+ | |||
+ | ===에너지 절감=== | ||
+ | 에너지 관리 및 자동화 분야의 디지털 혁신을 선도하고 있는 글로벌 기업 [[슈나이더일렉트릭]]이 대전 한국과학기술정보연구원 국가 슈퍼컴퓨터 5호기 누리온에 에너지 절감 솔루션을 구축했다. 슈퍼컴퓨터 누리온은 2018년 11월 개통됐으며 세계에서 11번째로 빠른 슈퍼컴퓨터로 [[인공지능]], 로봇, 항공기, 신소재 등 개발과 기후 예측 등 4차 산업혁명에 대응 가능한 초고성능 컴퓨팅 역량을 확보하고 초고성능 [[컴퓨팅 인프라]] 환경의 기반을 마련하고자 구축됐다. 누리온은 아파트 3,000세대와 비교될 만큼 막대한 전력을 소모한다. 따라서 안전하고 효율적 운영설비 구축이 필수적이다. 슈나이더일렉트릭은 안전하고 신뢰성 높은 고효율 전력 공급 솔루션을 제공한다는 점을 인정받아 사업에 참여하게 됐다. 특히 슈나이더일렉트릭 제품 중 [[무정전 전원 공급 장치]](UPS), [[공랭식 프리쿨링 냉동기]], 전원 분배 시스템인 [[부스웨이]] 등이 설치됐다. 누리온에는 전 세계적으로 안정성과 신뢰성이 입증된 슈나이더일렉트릭의 모듈형 무정전 전원 공급 장치인 시메트라(Symmetra) MW600KVA가 설치됐다. 무정전 전원 공급 장치는 24시간 안정적 전원 공급을 위해서 전력 사용량이 높은 데이터센터 등에 필수적으로 이는 대형 데이터센터에 적용 가능한 업계 최고의 에너지 효율성을 갖추고 있으며 장애 발생 시 즉각 대응이 가능한 모듈형 설계를 기초로 한다. 또한, 슈나이더일렉트릭의 공랭식 프리쿨링 냉동기인 BREF3212도 설치됐다. 누리온 작동 시 발생하는 열을 식히기 위해 대량의 전력을 필요로 한다. 슈나이더일렉트릭의 공랭식 프리쿨링 냉동기는 낮은 외기를 이용한 프리쿨링 냉동기로 모든 부하 조건에서 냉매 흐름을 최적화하고 냉동기의 운영 및 상태 등을 [[원격 모니터링]] 및 조작이 가능하다. 아울러 전산실, 데이터센터 등의 [[서버 랙]]용 전원분배 시스템인 슈나이더일렉트릭의 '데이터 센터를 위한 미니 버스웨이 운하(Mini Busway Canalis for Data Center)'도 설치되어 필요 위치에 전원을 공급하고 화재 시 연기나 유독가스가 없어 안전한 설비 구축에도 기여한다. 특히, 슈나이더일렉트릭 내부 전문가들은 이러한 설비 구축을 통해 연간 10% 정도의 에너지 비용 절감을 기대하고 있다. 이 밖에도 슈나이더일렉트릭의 상태 모니터링 및 예방 유지관리 서비스로 가동 중단 시간을 최소화하고 국내 슈나이더일렉트릭 설비 전문가의 24시간 신속한 서비스로 실시간 문제 해결도 가능하다. 전 세계에서 11번째로 빠른 슈퍼컴퓨터의 전력 설비 안정화 및 에너지 절감을 위한 제품군 중에서 슈나이더 일렉트릭이 치열한 경쟁에서 선택됐다. 슈나이더일렉트릭의 에너지 효율 솔루션은 전 세계적으로 이미 그 효율성과 안전성을 다양한 사례를 통해 입증받았다.<ref>박규찬 기자, 〈[https://www.industrynews.co.kr/news/articleView.html?idxno=29322 슈나이더일렉트릭, KISTI 슈퍼컴퓨터 5호기에 '에너지절감 솔루션' 구축]〉, 《인더스트리뉴스》, 2019-02-25</ref> | ||
+ | |||
+ | ===제온파이=== | ||
+ | 슈퍼컴퓨터 누리온이 사용하는 제온파이는 2016년 발표된 슈퍼컴퓨터 탑 500중 490개의 슈퍼컴퓨터가 사용한다. 예외라면 1위를 차지한 [[선웨이 타이후라이트]](Sunway TaihuLight)의 컴퓨터가 자사에서 개발한 프로세서(93.01페타플롭스)를 사용하는 것이다. 제온파이는 세대별로 진화를 거듭해 온 프로세서다. 2012년 처음 공개되었을 때만 해도 병렬 중앙처리장치(CPU) 연산에 최적화된 환경을 만들어주는 프로세서였지만, 독일 [[ISC]](International Supercomputing Conference)를 통해 발표된 4세대 제온파이는 머신러닝 고성능 컴퓨팅 시장 타깃의 프로세서란 특징을 보여준다. 일명 [[나이츠랜딩]]으로 불리는 이 제품군들은 극적인 병렬처리가 필요하고 높은 메모리 대역폭을 요구하는 분야에 최적화되어 있다. 이를 위해 코어 수를 최대 72개까지 지원하고 동작 클록도 1.5기가헤르즈에 이른다. 또한 범용화에 일조할 수 있도록 x86 프로세서에서 동작, 기존과 달리 부팅용 중앙처리장치가 필요하지 않아 자체 부팅이 가능하다. [[옴니-패스 패브릭]](Omni-Path Fabric)이란 특징을 갖춰 다이 패키지 안에 메모리를 넣어버린 온칩 메모리 형태이자, [[마이크론]]이 만든 광대역 메모리인 다중채널 [[DRAM]](Multi-Channel DRAM)을 채택하여 최대 7.2기가비피에스에 달하는 대역폭을 확보한 점도 중요한 포인트다. 메모리 용량도 최대 384기가바이트까지 확장할 수 있기 때문에 병렬 처리의 효율성을 최대한 끌어올릴 수 있다. 보통 프로세서가 빨리 일을 처리해도 이를 돕는 메모리와의 통신 도중에 병목 현상이 발생하기 쉬운데, 제온파이는 이 문제를 해결했다. 예를 들어 로봇으로 자동화한 공장에서 초당 100개씩 물건을 만들 때 이를 처리하기 위해 메모리와 정보를 주고받아야 하는데 그 사이에 있는 도로가 2차선이라면 이에 제온파이는 광대역 메모리와 메모리 용량 확장을 지원하는 것이다. 제온파이의 발표를 접하는 업계 분위기는 긍정적이다. 이는 고성능 컴퓨팅을 요구하는 산업이 늘고 있다는 증거다. 일례로 금융공학 분야에서는 수많은 정보를 종합하여 분석하고 투자자가 정확한 판단을 내리는데 슈퍼컴퓨터를 도입하려는 움직임이 있다. 미래금융 산업 예측은 물론 신용카드 사기 결제 검출 등으로 활용 범위가 다각화되고 있다. 대부분의 클라우드 데이터센터에서도 제온파이를 환영하며 고성능 컴퓨팅의 도입을 검토한다. 특히 제온파이는 기존 시스템을 유지하면서 중앙처리장치 코어의 성능을 끌어올릴 수 있어서 슈퍼컴퓨터의 연산 성능은 일반 데이터센터로 확장되어 활용될 것이다.<ref>이석원, 〈[http://software.kr/um/um03/um0305/um030504/um030504View.do?postId=21590&cpage=14 4세대 제온파이가 몰고 온 고성능 컴퓨팅 세상]〉, 《소프트웨어 중심사회》, 2016-07-29</ref> | ||
− | == | + | ===운영체제=== |
− | + | 슈퍼컴퓨터 5호기 누리온의 운영체제는 [[센트오에스]]다. 센트오에스는 The Community ENTerprise Operating System의 약자로서 [[레드햇]] 엔터프라이즈 리눅스와 완전하게 호환되는 무료 기업용 리눅스 운영체제다. 새로운 버전의 레드햇 엔터프라이즈 리눅스가 출시되면 짧은 시간 내에 그 소스 코드를 그대로 가져와 [[빌드]]해 레드햇 로고 대신 센트오에스 로고를 넣어 재배포한다. 때문에 센트오에스를 사용할 줄 알면 레드햇 엔터프라이즈 리눅스도 쉽게 접근할 수 있다. 센트오에스는 무료로 사용할 수 있다는 장점이 있다. 그래서 초기 운영체제 도입 비용을 절감할 수 있다. 하지만 센트오에스 운영체제를 사용하다 문제가 생기면 그 문제를 레드햇이 책임지는 것은 아니다. 센트오에스를 설치할 때 [[라이선스]] 동의에 대한 글을 보면 자유롭게 사용을 할 수는 있지만, 문제가 발생하면 그것에 대한 책임이 없다는 문구가 나온다. 문제 처리를 자체적으로 하거나 그것을 처리할 수 있는 업체나 사람에게 의뢰를 해야 한다. 센트오에스를 서비스용 시스템의 운영체제로 사용하는 곳이 많다. 가장 큰 장점은 비용을 절감할 수 있다는 것이다. 인터넷 포털, 게임, 웹호스팅 같은 업체에서 [[페도라]]나 센트오에스를 많이 사용하고 있다. 운영중 문제 발생 시 자체 인력으로 해결하거나 커뮤니티 또는 오픈소스 유지보수 업체로부터 지원받아 처리한다.<ref>썬구루, 〈[https://m.blog.naver.com/PostView.nhn?blogId=sunguru&logNo=221008975880&proxyReferer=https:%2F%2Fwww.google.com%2F CentOS란 무엇인가?]〉, 《네이버 블로그》, 2017-05-18</ref> | |
− | |||
− | === | + | ===사용 정책=== |
− | + | 슈퍼컴퓨터 5호기 누리온은 한 사용자 그룹 당 최대 40개 중앙처리장치 코어 수행이 가능하다. 한정된 라이선스를 슈퍼컴 사용자들이 함께 사용하므로, 사용정책 기준을 초과하여 사용할 경우 해당 작업은 관리자에 의해서 강제로 종료된다. 부득이하게 많은 라이선스가 필요할 경우 한국과학기술정보원 홈페이지를 통해서 사전에 관리자와 협의해야 한다. 그리고 로그인 노드의 과부하 방지를 위해서 pre/post 작업은 허가하지 않는다. 2019년 3월 PM 이후에는 작업 제출 스크립트에 "#PBS -A ansys" 옵션을 사용해야 한다. 소프트웨어 실행 방법은 명령어 실행 전에 환경설정을 위한 스크립트를 먼저 실행한다. 그다음 batch 모드로 job을 실행하기 위한 명령어를 입력한다. 로그인 노드에서 상호작용 방식의 실행은 중앙처리장치 시간이 10분으로 제한되어 있다. 장시간의 계산 작업은 스케줄러를 이용하여 작업을 제출해야 한다.<ref>KSC Tech, 〈[https://ksctech.tistory.com/68 누리온 ANSYS FLUENT 사용자 지침서(2020.03)]〉, 《티스토리》, 2019-03-04</ref> | |
== 구성 == | == 구성 == | ||
− | + | ===계산 노드=== | |
− | + | {|class="wikitable plainrowheaders" align="right" style="text-align:center; margin:10px 10px 10px 15px;" | |
− | + | |+<big>'''스펙'''</big> | |
− | + | !| 구분 | |
− | + | !| 계산 노드 | |
− | |+<big>''' | + | !| CPU-only 노드 |
− | | | + | |- |
− | | | + | | 모델명 |
+ | | 크레이 CS500 | ||
+ | | 크레이 CS500 | ||
+ | |- | ||
+ | | 시스템 구조 | ||
+ | | 제온파이 클러스터 | ||
+ | | 중앙처리장치 클러스터 | ||
+ | |- | ||
+ | | 중앙처리장치 종류 | ||
+ | | 인텔 제온파이 7250 1.4GHz | ||
+ | | 인텔 제온 6148 2.4GHz | ||
|- | |- | ||
− | | | + | | 총 노드 수 |
− | | | + | | 8,305 |
+ | | 132 | ||
|- | |- | ||
− | | | + | | 노드당 중앙처리장치 |
− | | | + | | 1 |
+ | | 2 | ||
|- | |- | ||
− | | | + | | 중앙처리장치당 코어 수 |
− | | | + | | 68 |
+ | | 20 | ||
|- | |- | ||
− | | | + | | 전체 노드 총 코어 수 |
− | | | + | | 564,740 |
+ | | 5,280 | ||
|- | |- | ||
− | | | + | | 코어 당 메모리 |
− | | | + | | 1.4GB |
+ | | 2.4GB | ||
|- | |- | ||
− | | | + | | 노드 당 메모리 |
− | | | + | | 96GB |
+ | | 192GB | ||
|- | |- | ||
− | |}<ref name="구성"></ref> | + | | 총 메모리 |
+ | | 797.3TB | ||
+ | | 25.3TB | ||
+ | |- | ||
+ | | 이론 최고성능 | ||
+ | | 25.3PF | ||
+ | | 0.4PF | ||
+ | |- | ||
+ | | 디스크 스토리지 | ||
+ | | 21PB | ||
+ | | 21PB | ||
+ | |- | ||
+ | | 인터커넥트 네트워크 | ||
+ | | OPA | ||
+ | | OPA | ||
+ | |- | ||
+ | |} | ||
+ | |||
+ | 누리온 시스템의 계산노드는 총 8,437개로 매니코어 기반의 인텔 제온파이7250(Xeon Phi 7250) 프로세가 장착된 8,305개의 계산노드와 인텔 제온골드6148 프로세서가 장착된 132개 계산노드로 구성되어 있다. [[매니코어]](KNL) 노드에 장착된 인텔 제온파이 7250 프로세서는 1.4기가헤르즈 기본 주파수에 68개 코어와 스레드 272개로 동작한다. L2 캐시 메모리는 34메가바이트이며, 온 패키지 메모리인 [[MCDRAM]](Multi-Channel DRAM)은 16기가바이트이다. 노드 당 메모리는 96기가바이트로 16기가바이트 DDR4-2400 메모리가 6채널로 구성되어 있다. 2U 크기의 인클로저에는 4개의 계산 노드가 장착되며, 42U 표준랙에 72개의 계산 노드로 구성되어 있다. 또한, CPU-only 노드에는 2개의 인텔 제온골드(Intel Xeon Gold) 6148 프로세서(코드명 스카이레이크)가 장착되어 있다. 기본 주파수는 2.4기가헤르즈이며 20개 코어와 스레드 40개로 동작한다. L3 캐시 메모리는 27.5메가바이트이며, 각 [[중앙처리 장치]](CPU)당 메모리는 96기가바이트(노드 당 192기가바이트)로 16기가바이트 DDR4-2666 메모리가 6채널로 구성되어 있다. 2U 크기의 인클로저(enclosure)에는 4개의 계산 노드가 장착되어 있다.<ref name="구성">〈[https://blog.ksc.re.kr/attachment/cfile7.uf@99721D435BE12DEE291BA9.pdf 슈퍼컴 5호기 누리온 사용자 지침서 (베타서비스용)]〉, 《슈퍼컴퓨팅서비스센터》, 2018-11</ref> | ||
+ | |||
+ | ===인터커넥트 네트워크=== | ||
+ | 인터커넥트 네트워크는 계산노드와 스토리지 시스템을 초고속으로 연결해준다. 노드 간 계산 네트워크 및 파일 입력 및 출력(I/O) 통신을 위한 인터커넥트 네트워크로 옴니패스 아키텍처(OPA)를 사용하고 있다. 100 Gbps 급의 인텔 옴니패스 아키텍처를 사용하여 패트 트리(Fat-Tree) 구조로 계산 노드 간 50% 블로킹(blocking), 스토리지 간 논-블로킹(non-blocking) 네트워크로 구성하였다. 계산 노드와 스토리지는 277개의 48 포트 엣지(Edge) 스위치에 연결되며 모든 엣지 스위치는 8대의 768 포트 디렉터(Director) 스위치에 연결했다.<ref name="구성"></ref> | ||
+ | |||
+ | ===스토리지=== | ||
+ | {|class="wikitable plainrowheaders" align="right" style="text-align:center; margin:10px 10px 10px 15px;" | ||
+ | |+<big>'''IME 단일노드'''</big> | ||
+ | !| 구성 | ||
+ | !| 내용 | ||
+ | |- | ||
+ | | 시스템 | ||
+ | | DDN IME240, 무한 메모리 엔진기기(IMEA) | ||
+ | |- | ||
+ | | 소프트웨어 버전 | ||
+ | | 센트오에스 7.3, IME 1.2 | ||
+ | |- | ||
+ | | 최대 입출력 성능 | ||
+ | | 초당 20 GB/s | ||
+ | |- | ||
+ | | 네트워크 인터페이스 | ||
+ | | 2 x OPA | ||
+ | |- | ||
+ | | [[에스에스디]] 타입 | ||
+ | | 1.2TB, NVMe 드라이브 | ||
+ | |- | ||
+ | | 에스에스디 수량 | ||
+ | | 16ea(1.2TB NVMe) + 1ea(450GB 에스에스디) | ||
+ | |||
+ | |- | ||
+ | | 용량 | ||
+ | | 19.2TB | ||
+ | |- | ||
+ | |} | ||
+ | 누리온의 병렬파일 시스템(Parallel File System)과 버스트버퍼(Burst Buffer)는 DDN(Data Direct Networ)사 [[IME]](Infinite Memory Engine)와 Lustre 파일 시스템 기반의 EXAScaler 솔루션을 사용하여 서비스된다. PFS는 DDN ES14KX 모델로 구성된 스크래치(/scratch), 홈(/home01), [[애플리케이션]](/app) 세 개의 파일 시스템을 제공하고 있으며, 각 파일 시스템은 SFA7700X 스토리지를 사용하는 두 대의 메타데이터 서버(MDS)를 포함한다. BB는 계산 노드와 병렬파일 시스템 사이에서 동작하는 NVMe 기반의 캐시로 약 829테라바이트의 용량을 제공한다. PFS는 765테라바이트 용량의 홈 디렉터리와 510테라바이트 용량의 사용자 애플리케이션이 제공 디렉터리(/applic), 21PB 글로벌 스크래치 디렉터리(/scratch)를 제공하고 있다. 해당 파일 시스템은 [[계산 노드]], [[로그인 노드]], [[아카이빙 서버]](Data Mover)에 마운트 되어 서비스되고 있다.<ref name="구성"></ref> | ||
+ | |||
+ | 버스트 버퍼(Burst Buffer)는 계산 노드와 스토리지(/scratch) 사이의 입력 및 출력(Input/Output) 가속화를 위한 캐시 레이어로 병렬파일 시스템의 작은 입력 및 출력과 랜덤 입력 및 출력의 취약성을 보완하고자 5호기 누리온에 최초 도입되었다. 입력 및 출력 의존성이 높은 사용자 애플리케이션 지원을 목표로 하고 있으며, 응용수행과제가 버스트 버퍼 사용에 적절한지 사전 평가 후 [[전용 큐]]를 통해 지원하고 있다. 버스트 버퍼 구성을 위해 DDN사의 IME240솔루션이 적용되었으며, IME는 계산 노드와 병렬파일 시스템 사이에서 동작하는 NVMe 기반의 캐시를 제공한다. IME는 파일 시스템 유저스페이스(FUSE)를 사용하여 IME [[API]]를 제공하고 있다. IME 클라이언트 서버는 파일 시스템 유저스페이스를 통해 IME 디바이스를 마운트 하여 사용하게 된다. 주의할 것은 IME는 스토리지 파일 시스템의 캐시 역할을 수행하기 때문에 스토리지 파일 시스템이 사전에 반드시 마운트 되어 있어야 한다. 파일 시스템 유저스페이스를 사용하여 마운트 된 IME 디렉터리는 '/scratch_ime'이며, 최초 사용자가 해당 디렉터리(/scratch_ime/$USER)에 접속하면 스크래치(/scratch/$USER) 파일 시스템의 모든 디렉터리와 파일들을 동일하게 확인할 수 있다. 이는 IME 디바이스에 존재 않은 데이터이며, 버스트버퍼를 이용하여 작업 수행 시 스크래치 파일 시스템에서 IME로 캐싱하여 수행하게 된다. IME를 사용하게 위해서는 데이터의 라이프 사이클을 파악해야 한다. IME이 데이터 처리 단계는 크게 프레스티지(prestage), 프리페치(prefetch), 싱크(sync), 릴리즈(releas) 단계가 있으며, 각각에 대해 IME API를 제공하고 있다.<ref name="구성"></ref> | ||
== 활용 == | == 활용 == | ||
===클라우드=== | ===클라우드=== | ||
− | + | 한국과학기술정보연구원(KIST)이 슈퍼컴퓨터 누리온을 [[클라우드]] 환경에서 이용할 수 있는 [[KI]](KISTI Intelligent) 클라우드 서비스를 오픈했다. 이 서비스는 전통적인 계산과학 연구자뿐만 아니라 인공지능, 빅데이터 분석 연구자들도 이용할 수 있다. KI 클라우드는 기존의 고전적 인터페이스와는 달리, 대화형 클라우드 서비스를 통해 연구자가 원하는 컴퓨팅 환경을 쉽게 구성할 수 있다. 기존에 슈퍼컴퓨터 누리온을 활용하고 싶은 사용자는 텍스트 터미널 환경에서 미리 코딩한 프로그램을 제출한 후 작업 순서를 기다려서 결과를 확인하는 한 방향 형태의 작업 처리를 해야 했다. 하지만 이번에 새로 오픈한 KI 클라우드 서비스를 통해서는 슈퍼컴퓨터 사용자는 [[웹]] 사용자 환경을 통해 접속하여 자신만의 [[가상서버]]를 만들어 사용하거나 프로그래밍 도구를 이용하여 프로그램 결과를 시각적으로 즉시 확인하면서 작업을 수행할 수 있다. 한국과학기술정보연구원은 [[중앙처리장치]](CPU) 서버 중심의 서비스뿐만 아니라 슈퍼컴퓨터 5호기의 [[그래픽처리장치]](GPU) 서버를 중심으로 하는 뉴런 시스템을 클라우드 서비스에 연결함으로써 KI 클라우드 서비스를 지속해서 확장해 나갈 예정이다. KI 클라우드 서비스 개시는 슈퍼컴퓨터를 빅데이터, 인공지능 등의 분야에서 손쉽게 활용할 수 있도록 하여 데이터 생태계 중심 기관인 한국과학기술정보연구원의 역할을 한층 더 강화할 수 있는 계기가 되었다.<ref>조상록 기자, 〈[http://www.hellot.net/new_hellot/magazine/magazine_read.html?code=202&sub=004&idx=51052 KISTI, 슈퍼컴퓨터 ‘누리온’ 이용 가능한 클라우드 서비스 오픈]〉, 《헬로티》, 2020-03-12</ref> | |
===폐암과 알츠하이머=== | ===폐암과 알츠하이머=== | ||
− | + | 한국에서 가장 빠른 컴퓨터 누리온이 우주 탄생의 비밀 찾기에서 [[알츠하이버]]병의 새 원인 발견까지 폭넓은 분야의 과학 연구현장에서 맹활양하고 있다. [[카이스트]] 의과학 대학원 [[주영석 교수]]와 [[서울대]] 의대 흉부외과 [[김영태 교수]] 공동 연구팀은 138개의 폐 선암 사례 전장 유전체 서열 데이터를 분석해 비흡연자한테서 폐암을 일으키는 유전체 돌연변이는 10대 이전 유년기부터 나타날 수 있다는 연구 결과를 국제학술지 [[셀]]에 발표했다. 카이스트 의과학 대학원 이정호 교수, 한국과학기술정보연구원 이준학 박사 공동 연구팀은 52명의 알츠하이머병 환자에게 얻은 사후 뇌 조직에서 [[전장 엑솜 유전체 서열]](whole-exome sequencing) 데이터를 분석해 알츠하이머병에 존재하는 뇌체성 유전변이를 찾아냄으로써, 노화 과정에서 발생하는 후천적 뇌 돌연변이가 알츠하이머병의 새로운 원인이 될 수 있다는 이론을 국제 학술지 [[네이처 커뮤니케이션스]]에 발표했다.<ref name="활용">노성열 기자, 〈[http://www.munhwa.com/news/view.html?no=2019120201031703009001 1초당 2.57경 연산 능력… 알츠하이머 규명 돕고 나노 개발 단축]〉, 《문화일보》, 2019-12-02</ref> | |
− | 1초당 2.57경 연산 능력… 알츠하이머 규명 돕고 나노 개발 단축]〉, 《문화일보》, 2019-12-02</ref> | ||
===원시 은하=== | ===원시 은하=== | ||
− | 고등과학원 박창범 교수 연구팀은 세계 최대 규모의 우주론적 유체역학 | + | 고등과학원 박창범 교수 연구팀은 세계 최대 규모의 우주론적 유체역학 수치 모의실험을 수행했다. 90일 동안 계산한 그랜드챌린지 과제였다. 슈퍼컴 4호기 [[타키온]]으로는 6년 이상, 일반 PC로는 30만 년 이상 걸리는 계산이었다. 이 실험은 우주생성 직후(138억 년 전)부터 110억 년까지 원시 우주의 은하, 은하단 및 대규모의 구조물 형성을 설명하려는 시도이다. 누리온 덕분에 은하를 대상으로 하는 통계학적 분석 및 연구에 활용할 데이터를 기존보다 5배 이상으로 확장할 수 있었다. 이것은 은하 생성에 우주 거대구조의 효과를 처음으로 제대로 반영한 우주론적 시뮬레이션이며 원시 은하단의 생성 등 천체 생성의 비밀을 캐낼 수 있을 것으로 기대한다.<ref name="활용"></ref> |
===차세대 반도체와 첨단소재=== | ===차세대 반도체와 첨단소재=== | ||
− | 서울대 박철환 교수 연구팀은 새로운 정보 저장용 소재로 주목받는 2차원 자성물질인 [[ | + | 서울대 박철환 교수 연구팀은 새로운 정보 저장용 소재로 주목받는 2차원 자성물질인 [[삼황화인니켈]] 소재를, 한국과학기술연구원 김상태 박사 연구팀은 [[배터리]] 소재를, [[울산과학기술원]](UNIST) 이근식 교수 연구팀은 차세대 나노 전자소자를 연구해 각각 국제 학술지 [[네이처 커뮤니케이션스]](Nature Communications)에 발표했다. 서울대 한승우 교수 연구팀은 1만7700개 물질을 대상으로 여러 단계의 시뮬레이션 분석을 통해 최종적으로 두 개의 후보물질을 P형 반도체용 최적 소재로 제시했다. 카이스트 정유성 교수 연구팀은 인공지능 기술과 슈퍼컴퓨터 활용을 융합해 소재 개발 기간을 크게 단축할 수 있는 새로운 소재 역설계 방법을 찾아내 4종의 신물질을 발견했다.<ref name="활용"></ref> |
+ | |||
+ | == 문제점 == | ||
+ | ===재고처리=== | ||
+ | 2015년 전후 [[인텔]]의 지원으로 슈퍼컴퓨팅 관련 연구를 진행하면서 [[제온파이]] 프로세서가 성능상 공식 발표데이터의 수치는 높지만, 실제 구현 성능상에 심각한 하자가 발생해서 이를 기반으로 슈퍼컴퓨터를 구축할 경우 확장성 자체가 없다는 사실을 이미 내부적으로 파악하고 있었다. 이에 따라 정부출연연구기관이 국가 예산 540억 원대를 투입하는 대형 국책사업을 추진하면서 구매 시스템에 치명적 하자가 있다는 사실을 알면서도 장비도입을 강행했다. 이것은 슈퍼컴퓨터 5호기 누리온이 실제로는 인텔의 단종된 [[중앙처리장치]]를 채택한 재고떨이용 모델로 드러나 국민 혈세 540억 원을 허공에 날리는 믿기 힘든 사건이었다. 실제 한국과학기술정보연구원은 인텔 제온파이 프로세서 외에 [[엔비디아]] 및 국내 전문 프로세서 업체가 제공 중인 고성능의 [[그래픽처리장치]](GPU) 기반 프로세서는 검토대상에서 제외했다. 이로 인해 한국과학기술정보연구원이 인텔 중앙처리장치 대신 세계 각국이 앞다퉈 채택하고 있는 고성능의 그래픽처리장치 기반으로 슈퍼컴퓨터를 개발한다고 발표할 경우 수천억 원대 정부 시스템구축 및 개발자금 지원이 중단될 것을 우려해 치명적 하자가 드러난 인텔 중앙처리장치를 고집했다는 의혹이 생겼다. 또 전문가그룹에서는 출연연구기관이 주무 부천인 [[과기정통부]]로부터 차세대 슈퍼컴퓨터 6호기 자체개발 건으로 1, 2년 내 5,000억 ~ 8000억 원대에 이르는 국책연구비를 따내기 위해 인텔이 생산 중단한 재고떨이 낮은 사양 중앙처리장치 기반 5호기 슈퍼컴퓨터를 구매했다는 의견도 생겼다. 만약 고성능 그래픽처리장치 기반 슈퍼컴퓨터로 정책을 변경하면 국내에서 이미 그래픽처리장치 기반 슈퍼컴퓨팅 엔진을 생산, 수출하고 있는 점 때문에 한국과학기술정보연구원이 슈퍼컴퓨터 6호기 개발 건을 인텔 중앙처리장치 기반으로 밀어붙이기 사실상 힘들다. 한국과학기술정보연구원이 무조건 인텔의 중앙처리장치만 고집하는 것은 오로지 예산 확보 때문이다. 성능이나 확장성 등에는 크게 관심이 없고 오로지 슈퍼컴퓨터 6호기 개발사업을 추진하면서 조 단위 예산을 확보하려는 한국과학기술정보연구원 슈퍼컴퓨팅센터의 의지가 이런 5호기 초기투자를 물거품으로 만들었다.<ref>김광일 기자, 〈[http://www.pitchone.co.kr/9712/ 슈퍼컴퓨터 5호기도입,540억원 허공에 날린 대국민사기극,KISTI 2년전에 알고도 ‘쉬쉬’강행,충격]〉, 《피치원》, 2017-12-04</ref> | ||
+ | |||
+ | ===포화=== | ||
+ | 슈퍼컴퓨터 5호기 누리온의 중앙처리장치 점유율이 운영 6개월 만에70% 선에 육박했다. 이는 통상 새로운 슈퍼컴퓨터가 도입된 뒤 2~3년이 지나야 도달하는 점유율 수치다. 이에 따라 누리온을 활용하기 위한 연구자들의 대기시간이 최대 6~7시간까지 길어지는 현상도 벌어지고 있어 연구 현장에서의 데이터 처리 수요 증가를 뒷받침할 수 있는 컴퓨팅 [[인프라]] 확충이 요구된다. 더욱이 중이온가속기, 지하실험연구단의 암흑물질 및 중성미자 검출기, 핵융합로, 전파망원경 등 거대실험장치를 이용한 연구에서는 데이터 분석을 위해 대규모 컴퓨팅이 꼭 필요하며 국내에 한 대뿐인 [[투과식 전자현미경]]도 3~4대가 더 도입될 예정이어서 관련 연구자들의 마음이 조급해진다. 이 원인은 물리학, 천문학, 화학, 생물학, 지구과학 등 모든 기초과학 분야에서 입자가속기와 같은 거대연구시설을 활용한 데이터가 쏟아지고 있는 데다 [[빅데이터]] 기반 연구방식의 확산, 국제 공동연구 활성화 등이 데이터 폭증을 만들었다. 국내에는 한국과학기술정보연구원 외에도 기상청과 기업 등에서 공식적으로 총 7대의 슈퍼컴퓨터가 운영되고 있다. 슈퍼컴퓨터는 특별한 정의가 없는 상대적인 개념으로 연산능력 기준으로 세계 500위 내 컴퓨터를 말한다. 한국의 슈퍼컴퓨팅 능력은 미국, 중국보다는 상당히 떨어져 있는 상태다. 세계적으로 슈퍼컴퓨터 보유 대수는 중국이 1위이며 연산능력합계로는 미국이 1위다. 한국은 연산능력 기준으로 세계 8위 수준이다. 한국의 경제력을 고려해도 미국, 중국, 일본보다 현저하게 떨어지는 수준이다. 한국과학기술정보연구원의 중장기 계획에 따르면 2023년 이후 수백 페타플롭스 급의 6호기를 구축하고, 2028년 이후 엑사플롭스 급 이상의 슈퍼컴퓨터를 구축, 운영한다. 누리온이 가동한 지 6개월밖에 지나지 않았는데 사용률이 70% 선까지올라온 것은 국내 기초과학계에 초고성능 컴퓨팅에 대한 대기수요가 많았다는 증거다.<ref>최상국 기자, 〈[http://www.inews24.com/view/1182300 슈퍼컴퓨터 '누리온' 6개월만에 포화?]〉, 《아이뉴스24》, 2019-05-29</ref> | ||
+ | |||
+ | ==행사== | ||
+ | ===해커톤=== | ||
+ | 해커톤(Hackathon)은 개발자들이 오랜 시간 동안[[프로그래밍]]을 통해 실용적인 결과물을 만드는 대회이다. 해커톤 참가자들은 한국과학기술정보연구원(KIST)에서 제공하는 슈퍼컴퓨터 5호기 누리온의 보조시스템인 그래픽처리장치 클러스터를 이용해 직접 사용하거나 개발 중인 프로그램의 프로그래밍 성능 최적화 및 가속화를 연구한다. 특히, 이 대회에서는 [[엔비디아]], 한국과학기술정보연구원 및 [[미국 오크리지 국립 연구소]] 슈퍼컴퓨팅 센터에서 온 국내외 전문가 15명이 각 팀에 2명씩 멘토로 배정돼 참가자들과 함께 연구 문제를 해결한다. 대회 마지막 날에는 최적화된 프로그래밍을 전문가 앞에서 발표하는 시간을 가진다. 전문가들은 참가자들의 발표를 바탕으로 프로그램의 성능과 향후 방향성에 대해 조언한다. 서울대와 숙명여대의 공학도 및 자연과학도 등으로 구성된 [[DCSLab]] 팀은 [[딥 러닝]](Deep Learning)을 통해 적은 예산으로 충분한 실험을 할 수 있는 우주 파형 계산 프로그래밍에 대해 발표했고 [[FVCOMik]] 팀은 해양예보를 위한 상황예측모델에 대해 발표했다. 로봇 연구자들로 구성된 [[ELSA]] 팀은 로봇이 카메라를 통해 촬영한 영상의 물체들을 빠르게 인식해 신속한 서비스를 제공하는 딥 러닝 관련 프로그래밍에 대해 발표했다. 전문가들과 함께 아이디어를 도출하고 실용적인 프로그램을 만들어 내는 그래픽처리장치 해커톤 2019는 호주, 독일, 미국 등 10개국에서 개최한다.<ref>김주연 기자, 〈[https://www.kipost.net/news/articleView.html?idxno=200608 엔비디아·KISTI·오크리지 국립연구소, 'GPU 해커톤 2019' 성황리에 마쳐]〉, 《카이포스트》, 2019-03-04</ref> | ||
+ | |||
+ | ===슈퍼컴퓨팅 컨퍼런스 2019=== | ||
+ | 미국과 중국이 세계 슈퍼컴퓨터의 2강 체제를 유지한 가운데 한국의 슈퍼컴퓨터 5호기 누리온이 14위를 기록했다. 슈퍼컴퓨팅 컨퍼런스 2019는 세계 최고 슈퍼컴퓨터 탑 500을 발표했다. 슈퍼컴퓨팅 컨퍼런스 2019에서 발표한 탑 500 순위에는 미국 [[오크리지 국립연구소]](ORNL) [[서밋]](Summit)이 1위를 차지했다. 서밋은 실측성능은 148페타플롭스로 1초에 148 x 1,000조 번 연산이 가능하다. 2위는 미국 [[로렌스 리버모어 국립연구소]](LLNL)의 [[시에라]](Sierra), 3위는 중국의 [[선웨이 타이후라이트]](Sunway TaihuLight)로 상반기 순위를 그대로 유지했다. 한국과학기술정보연구원의 슈퍼컴퓨터 5호기 누리온은 오크리지 국립연구소 슈퍼컴퓨터 [[타이탄]](12위)이 퇴역하면서 상반기 발표된 순위 대비 1단계 상승한 14위를 기록했다. 누리온은 연산 속도는 25.7 페타플롭스로 계산 노드는 8,437개다. 이번 발표에서 기상청이 보유한 누리와 미리는 각각 113위와 114위를 차지해 한국은 3대(국가별 순위 12위)의 슈퍼컴퓨터만 탑 500순위에 들며 큰 격차를 보였다.<ref>김지균 기자, 〈[http://www.dailybizon.com/news/articleView.html?idxno=14594 한국 슈퍼컴퓨터 ‘누리온’ 세계 14위…미·중 1∼2위]〉, 《데일리 비즌》, 2019-11-21</ref> | ||
+ | |||
+ | == 전망 == | ||
+ | 4호기에 비해 70배 향상된 능력을 보유한 누리온의 역할에 기대감이 몰리는 건 이 때문이다. 누리온은 그동안 장비 한계에 부딪혔던 영역의 연구를 가능하게 할 것이라는 전망이다. 우주의 기원을 밝히는 기초연구 등이 대표적이다. 기업의 신제품 개발과 시장 분석, 자연재해, 교통 문제 등 국가, 사회 현안 해결에도 긍정적인 영향을 미칠 것이다. [[과학기술정보통신부]] 가 발표한 5호기 운영계획안은 누리온은 국가 대형 연구 장비인 점을 고려해 최대한 무상 사용을 원칙으로 하되 사용자가 신속한 사용을 원하는 경우 유상으로 지원한다. 누리온을 활용해 우수 연구 성과를 낸 연구자에게는 지원 과제 수 확대와 같은 인센티브를 제공할 예정이다. 인간의 지식이나 노동력 대신 데이터가 부를 창출하는 데이터 경제 시대에 진입하면서 슈퍼컴퓨터가 새로운 가치를 창출하고 미래 경쟁력을 확보하는 데 핵심 역할을 할 것이다. 5호기 누리온의 활용 분야를 넓히고 경쟁력 확보에 필요한 분야나 사회 현안 과제를 적극적으로 지원할 예정이다.<ref>이근하 기자, 〈[http://gonggam.korea.kr/newsView.do?newsId=01Ii7zpwDGJMP000 1초당 2경 5700조 연산 슈퍼컴 5호기가 온다]〉, 《위클리 공감》, 2018-11-18</ref> | ||
− | |||
− | |||
{{각주}} | {{각주}} | ||
==참고자료== | ==참고자료== | ||
+ | * 국가슈퍼컴퓨팅센터 공식 홈페이지 - https://www.ksc.re.kr/ggspcpt/sg | ||
+ | * 권혁준 기자, 〈[https://www.sedaily.com/NewsVIew/1S73GO2J7B 국가 슈퍼컴퓨터 5호기 '누리온' 개통…고성능PC 2만대 성능]〉, 《서울경제》, 2018-11-07 | ||
+ | * 백지영 기자, 〈[http://m.ddaily.co.kr/m/m_article/?no=174614 국가 슈퍼컴퓨터 도입 30년 발전사]〉, 《디지털데일리》, 2018-11-08 | ||
+ | * 김지균 기자, 〈[http://www.dailybizon.com/news/articleView.html?idxno=14594 한국 슈퍼컴퓨터 ‘누리온’ 세계 14위…미·중 1∼2위]〉, 《데일리 비즌》, 2019-11-21 | ||
+ | * 박규찬 기자, 〈[https://www.industrynews.co.kr/news/articleView.html?idxno=29322 슈나이더일렉트릭, KISTI 슈퍼컴퓨터 5호기에 '에너지절감 솔루션' 구축]〉, 《인더스트리뉴스》, 2019-02-25 | ||
+ | * 이석원, 〈[http://software.kr/um/um03/um0305/um030504/um030504View.do?postId=21590&cpage=14 4세대 제온파이가 몰고 온 고성능 컴퓨팅 세상]〉, 《소프트웨어 중심사회》, 2016-07-29 | ||
+ | * 썬구루, 〈[https://m.blog.naver.com/PostView.nhn?blogId=sunguru&logNo=221008975880&proxyReferer=https:%2F%2Fwww.google.com%2F CentOS란 무엇인가?]〉, 《네이버 블로그》, 2017-05-18 | ||
+ | * KSC Tech, 〈[https://ksctech.tistory.com/68 누리온 ANSYS FLUENT 사용자 지침서(2020.03)]〉, 《티스토리》, 2019-03-04 | ||
+ | * 누리온 국가슈퍼컴퓨팅센터 - https://www.ksc.re.kr/mobile/ggspcpt/nurion | ||
+ | * 〈[https://blog.ksc.re.kr/attachment/cfile7.uf@99721D435BE12DEE291BA9.pdf 슈퍼컴 5호기 누리온 사용자 지침서 (베타서비스용)]〉, 《슈퍼컴퓨팅서비스센터》, 2018-11 | ||
+ | * 김주연 기자, 〈[https://www.kipost.net/news/articleView.html?idxno=200608 엔비디아·KISTI·오크리지 국립연구소, 'GPU 해커톤 2019' 성황리에 마쳐]〉, 《카이포스트》, 2019-03-04 | ||
+ | * 조상록 기자, 〈[http://www.hellot.net/new_hellot/magazine/magazine_read.html?code=202&sub=004&idx=51052 KISTI, 슈퍼컴퓨터 ‘누리온’ 이용 가능한 클라우드 서비스 오픈]〉, 《헬로티》, 2020-03-12 | ||
+ | * 노성열 기자, 〈[http://www.munhwa.com/news/view.html?no=2019120201031703009001 1초당 2.57경 연산 능력… 알츠하이머 규명 돕고 나노 개발 단축]〉, 《문화일보》, 2019-12-02 | ||
+ | * 김광일 기자, 〈[http://www.pitchone.co.kr/9712/ 슈퍼컴퓨터 5호기도입,540억원 허공에 날린 대국민사기극,KISTI 2년전에 알고도 ‘쉬쉬’강행,충격]〉, 《피치원》, 2017-12-04 | ||
+ | * 최상국 기자, 〈[http://www.inews24.com/view/1182300 슈퍼컴퓨터 '누리온' 6개월만에 포화?]〉, 《아이뉴스24》, 2019-05-29 | ||
+ | * 이근하 기자, 〈[http://gonggam.korea.kr/newsView.do?newsId=01Ii7zpwDGJMP000 1초당 2경 5700조 연산 슈퍼컴 5호기가 온다]〉, 《위클리 공감》, 2018-11-18 | ||
+ | ==같이 보기== | ||
+ | * [[슈퍼컴퓨터]] | ||
+ | * [[센트오에스]] | ||
− | + | {{컴퓨터|검토 필요}} |
2020년 8월 24일 (월) 13:34 기준 최신판
누리온(NURION) 이란 계산 노드, CPU-only 노드, 옴니패스(Omni-Path) 인터커넥트 네트워크, 버스트 버퍼(Burst Buffer) 고속 스토리지, 러스터(Lustre) 기반의병렬파일 시스템, RDHx(Rear Door Heat Exchanger) 기반의 수랭식 냉각장치로 구성된 시스템이다.
목차
개요[편집]
미국 크레이(CRAY)사에서 도입한 누리온(크레이 CS500)은 1988년 1호기 도입 이래 5번째로 구축된 국가 슈퍼컴퓨터로 57만 20개의 코어(Core)로 구성됐고, 고성능 PC 2만 대와 맞먹는 성능을 자랑한다. 누리온의 이론성능은 25.7페타플롭스(PFlops)로 1초에 2경 5,700조 번의 부동소수점 연산이 가능하며 실측성능은 13.92페타플롭스로 2018년 6월 기준 전 세계 슈퍼컴퓨터 중 11위다. KISTI는 누리온을 통해 우주 기원 같은 초거대문제 연구뿐만 아니라 기업의 신제품 개발 및 시장 분석, 자연재해, 교통 문제 등 국가, 사회 현안 해결을 지원한다. 특히 빅데이터 처리와 인공지능 분야에서 수요가 많은 소프트웨어 등 맞춤형 환경을 제공하고 클라우드 기술을 통해 사용자가 원하는 컴퓨팅 환경을 구축할 수 있도록 지원해 컴퓨팅 분야 전문지식이나 경험이 없는 중소기업 및 개인 연구자 등도 쉽게 활용할 수 있도록 한다.[1]
역사[편집]
카이스트(KISTI)는 서울올림픽이 열린 1988년 처음으로 슈퍼컴퓨터를 도입하여 가동했다. 카이스트 만큼 큰 규모의 슈퍼컴퓨터를 운영하는 기상청은 이보다 11년 늦은 1999년 도입하고, 2000년부터 1호기를 가동했다. 카이스트는 1988년 1호기를 시작으로 거의 5년에서 8년마다 슈퍼컴퓨터를 도입했다. 5호기는 크레이사의 기종을 사용하여 도입됐다. 5호기의 이름은 누리온 이고 국민 공모를 통해 만들어진 이름이다. 대한민국 모든 국민이 슈퍼컴퓨터의 혜택을 고루 누릴 수 있도록 한다는 의미로 지어졌다.[2]
특징[편집]
슈퍼컴퓨터 5호기 누리온의 대표적인 특징들을 보면 1 소켓당 성능이 3테라플롭스나 되는 매니 코어 중앙처리장치, 약 8,300여 개로 구성되어 국내 4차 산업혁명, 인공지능, 사물인터넷, 빅데이터 등을 주도할 수 있는 기반을 갖춘다. 그리고, 고성능 인터커넥트와 대용량 스토리지 및 응용프로그램에서 순간적으로 발생하는 대규모 입출력요청을 원활히 처리할 수 잇는 버스트 버퍼 등이 있다. 슈퍼컴퓨터의 월등한 계산 능력은 국가 연구개발의 경쟁력과 밀접한 관계가 있다. 날씨 예측이나 주가 예측 등 연필과 종이만으로는 풀기 어려운 복잡한 문제나 핵실험이나 신약개발 등 실험적으로만 해결하기에는 너무 위험하거나 비용이 많이 필요한 문제는 모두 슈퍼컴퓨터가 한다. 슈퍼컴퓨터 5호기 누리온 또한 복잡하고 어렵고 위험한 과학기술 문제를 해결하기 위해 기획 단계부터 슈퍼컴퓨터가 해결할 수 있는 다양한 분야의 난제를 발굴하는 노력이 병행된다. 이를 위해 주요 연구개발 분야별 전문가들을 대상으로 하는 표적 집단면접을 통해 슈퍼컴퓨터를 이용하여 해결할 난제들을 찾았다. 사회 안전을 위한 지진 해석 및 예측, 첨단 가상원자로 기술 개발, 우주 경쟁력 확보를 위한 가상우주발사체, 신약개발을 위한 가상 세포모델링 분야들이 모두 이런 난제에 해당한다. 슈퍼컴퓨터 5호기는 도출된 난제들의 시급성과 중요도에 따라 필요한 계산 수요를 충족시킬 수 있는 방향으로 설계됐다. 인공지능 기술의 근간이 되는 빅데이터 계산에 슈퍼컴퓨터는 없어서는 안될 필수 요소이며, 빅데이터와 인공지능이 결합한 신산업 발굴, 가상설계를 이용한 제조업 혁신 등 슈퍼컴퓨터가 필요한 분야는 폭발적으로 증가한다. 다양한 분야의 수요를 충족시키기 위해 5호기에는 유기적인 하드웨어와 소프트웨어 연동 기술과 함께 다양한 서비스 기술이 적용된다.[3]
성능 프로그램 특징 노드 수 점수 순위 HPL 대형 연립방정식 해석을 통해 실수연산 성능측정 8,174(계산노드)
+ 122(CPU-only)13.93 PF 11등
(2018년 6월)HPCG 편미분방정식을 수치 모델로하여 HPL과는 다른 평가기준 제시 8,250
(계산노드)0.39 PF 8등
(2018년 11월)IO500 파일 입출력 관련 벤치마크 2,048
(계산노드)160.67 2등
(2018년 11월)그래프500
(Graph500)너비 우선 탐색
(BFS)대규모 그래프분석 벤치마크로 넓이 우선 탐색 1,024
(계산노드)1456.46 GTEPS 9등
(2019년 11월)단일 출발지 최단 경로
(SSSP)대규모 그래프분석 벤치마크로 최단거리 계산 1,024
(계산노드)337.239 GTEPS 3등
(2019년 11월)
에너지 절감[편집]
에너지 관리 및 자동화 분야의 디지털 혁신을 선도하고 있는 글로벌 기업 슈나이더일렉트릭이 대전 한국과학기술정보연구원 국가 슈퍼컴퓨터 5호기 누리온에 에너지 절감 솔루션을 구축했다. 슈퍼컴퓨터 누리온은 2018년 11월 개통됐으며 세계에서 11번째로 빠른 슈퍼컴퓨터로 인공지능, 로봇, 항공기, 신소재 등 개발과 기후 예측 등 4차 산업혁명에 대응 가능한 초고성능 컴퓨팅 역량을 확보하고 초고성능 컴퓨팅 인프라 환경의 기반을 마련하고자 구축됐다. 누리온은 아파트 3,000세대와 비교될 만큼 막대한 전력을 소모한다. 따라서 안전하고 효율적 운영설비 구축이 필수적이다. 슈나이더일렉트릭은 안전하고 신뢰성 높은 고효율 전력 공급 솔루션을 제공한다는 점을 인정받아 사업에 참여하게 됐다. 특히 슈나이더일렉트릭 제품 중 무정전 전원 공급 장치(UPS), 공랭식 프리쿨링 냉동기, 전원 분배 시스템인 부스웨이 등이 설치됐다. 누리온에는 전 세계적으로 안정성과 신뢰성이 입증된 슈나이더일렉트릭의 모듈형 무정전 전원 공급 장치인 시메트라(Symmetra) MW600KVA가 설치됐다. 무정전 전원 공급 장치는 24시간 안정적 전원 공급을 위해서 전력 사용량이 높은 데이터센터 등에 필수적으로 이는 대형 데이터센터에 적용 가능한 업계 최고의 에너지 효율성을 갖추고 있으며 장애 발생 시 즉각 대응이 가능한 모듈형 설계를 기초로 한다. 또한, 슈나이더일렉트릭의 공랭식 프리쿨링 냉동기인 BREF3212도 설치됐다. 누리온 작동 시 발생하는 열을 식히기 위해 대량의 전력을 필요로 한다. 슈나이더일렉트릭의 공랭식 프리쿨링 냉동기는 낮은 외기를 이용한 프리쿨링 냉동기로 모든 부하 조건에서 냉매 흐름을 최적화하고 냉동기의 운영 및 상태 등을 원격 모니터링 및 조작이 가능하다. 아울러 전산실, 데이터센터 등의 서버 랙용 전원분배 시스템인 슈나이더일렉트릭의 '데이터 센터를 위한 미니 버스웨이 운하(Mini Busway Canalis for Data Center)'도 설치되어 필요 위치에 전원을 공급하고 화재 시 연기나 유독가스가 없어 안전한 설비 구축에도 기여한다. 특히, 슈나이더일렉트릭 내부 전문가들은 이러한 설비 구축을 통해 연간 10% 정도의 에너지 비용 절감을 기대하고 있다. 이 밖에도 슈나이더일렉트릭의 상태 모니터링 및 예방 유지관리 서비스로 가동 중단 시간을 최소화하고 국내 슈나이더일렉트릭 설비 전문가의 24시간 신속한 서비스로 실시간 문제 해결도 가능하다. 전 세계에서 11번째로 빠른 슈퍼컴퓨터의 전력 설비 안정화 및 에너지 절감을 위한 제품군 중에서 슈나이더 일렉트릭이 치열한 경쟁에서 선택됐다. 슈나이더일렉트릭의 에너지 효율 솔루션은 전 세계적으로 이미 그 효율성과 안전성을 다양한 사례를 통해 입증받았다.[5]
제온파이[편집]
슈퍼컴퓨터 누리온이 사용하는 제온파이는 2016년 발표된 슈퍼컴퓨터 탑 500중 490개의 슈퍼컴퓨터가 사용한다. 예외라면 1위를 차지한 선웨이 타이후라이트(Sunway TaihuLight)의 컴퓨터가 자사에서 개발한 프로세서(93.01페타플롭스)를 사용하는 것이다. 제온파이는 세대별로 진화를 거듭해 온 프로세서다. 2012년 처음 공개되었을 때만 해도 병렬 중앙처리장치(CPU) 연산에 최적화된 환경을 만들어주는 프로세서였지만, 독일 ISC(International Supercomputing Conference)를 통해 발표된 4세대 제온파이는 머신러닝 고성능 컴퓨팅 시장 타깃의 프로세서란 특징을 보여준다. 일명 나이츠랜딩으로 불리는 이 제품군들은 극적인 병렬처리가 필요하고 높은 메모리 대역폭을 요구하는 분야에 최적화되어 있다. 이를 위해 코어 수를 최대 72개까지 지원하고 동작 클록도 1.5기가헤르즈에 이른다. 또한 범용화에 일조할 수 있도록 x86 프로세서에서 동작, 기존과 달리 부팅용 중앙처리장치가 필요하지 않아 자체 부팅이 가능하다. 옴니-패스 패브릭(Omni-Path Fabric)이란 특징을 갖춰 다이 패키지 안에 메모리를 넣어버린 온칩 메모리 형태이자, 마이크론이 만든 광대역 메모리인 다중채널 DRAM(Multi-Channel DRAM)을 채택하여 최대 7.2기가비피에스에 달하는 대역폭을 확보한 점도 중요한 포인트다. 메모리 용량도 최대 384기가바이트까지 확장할 수 있기 때문에 병렬 처리의 효율성을 최대한 끌어올릴 수 있다. 보통 프로세서가 빨리 일을 처리해도 이를 돕는 메모리와의 통신 도중에 병목 현상이 발생하기 쉬운데, 제온파이는 이 문제를 해결했다. 예를 들어 로봇으로 자동화한 공장에서 초당 100개씩 물건을 만들 때 이를 처리하기 위해 메모리와 정보를 주고받아야 하는데 그 사이에 있는 도로가 2차선이라면 이에 제온파이는 광대역 메모리와 메모리 용량 확장을 지원하는 것이다. 제온파이의 발표를 접하는 업계 분위기는 긍정적이다. 이는 고성능 컴퓨팅을 요구하는 산업이 늘고 있다는 증거다. 일례로 금융공학 분야에서는 수많은 정보를 종합하여 분석하고 투자자가 정확한 판단을 내리는데 슈퍼컴퓨터를 도입하려는 움직임이 있다. 미래금융 산업 예측은 물론 신용카드 사기 결제 검출 등으로 활용 범위가 다각화되고 있다. 대부분의 클라우드 데이터센터에서도 제온파이를 환영하며 고성능 컴퓨팅의 도입을 검토한다. 특히 제온파이는 기존 시스템을 유지하면서 중앙처리장치 코어의 성능을 끌어올릴 수 있어서 슈퍼컴퓨터의 연산 성능은 일반 데이터센터로 확장되어 활용될 것이다.[6]
운영체제[편집]
슈퍼컴퓨터 5호기 누리온의 운영체제는 센트오에스다. 센트오에스는 The Community ENTerprise Operating System의 약자로서 레드햇 엔터프라이즈 리눅스와 완전하게 호환되는 무료 기업용 리눅스 운영체제다. 새로운 버전의 레드햇 엔터프라이즈 리눅스가 출시되면 짧은 시간 내에 그 소스 코드를 그대로 가져와 빌드해 레드햇 로고 대신 센트오에스 로고를 넣어 재배포한다. 때문에 센트오에스를 사용할 줄 알면 레드햇 엔터프라이즈 리눅스도 쉽게 접근할 수 있다. 센트오에스는 무료로 사용할 수 있다는 장점이 있다. 그래서 초기 운영체제 도입 비용을 절감할 수 있다. 하지만 센트오에스 운영체제를 사용하다 문제가 생기면 그 문제를 레드햇이 책임지는 것은 아니다. 센트오에스를 설치할 때 라이선스 동의에 대한 글을 보면 자유롭게 사용을 할 수는 있지만, 문제가 발생하면 그것에 대한 책임이 없다는 문구가 나온다. 문제 처리를 자체적으로 하거나 그것을 처리할 수 있는 업체나 사람에게 의뢰를 해야 한다. 센트오에스를 서비스용 시스템의 운영체제로 사용하는 곳이 많다. 가장 큰 장점은 비용을 절감할 수 있다는 것이다. 인터넷 포털, 게임, 웹호스팅 같은 업체에서 페도라나 센트오에스를 많이 사용하고 있다. 운영중 문제 발생 시 자체 인력으로 해결하거나 커뮤니티 또는 오픈소스 유지보수 업체로부터 지원받아 처리한다.[7]
사용 정책[편집]
슈퍼컴퓨터 5호기 누리온은 한 사용자 그룹 당 최대 40개 중앙처리장치 코어 수행이 가능하다. 한정된 라이선스를 슈퍼컴 사용자들이 함께 사용하므로, 사용정책 기준을 초과하여 사용할 경우 해당 작업은 관리자에 의해서 강제로 종료된다. 부득이하게 많은 라이선스가 필요할 경우 한국과학기술정보원 홈페이지를 통해서 사전에 관리자와 협의해야 한다. 그리고 로그인 노드의 과부하 방지를 위해서 pre/post 작업은 허가하지 않는다. 2019년 3월 PM 이후에는 작업 제출 스크립트에 "#PBS -A ansys" 옵션을 사용해야 한다. 소프트웨어 실행 방법은 명령어 실행 전에 환경설정을 위한 스크립트를 먼저 실행한다. 그다음 batch 모드로 job을 실행하기 위한 명령어를 입력한다. 로그인 노드에서 상호작용 방식의 실행은 중앙처리장치 시간이 10분으로 제한되어 있다. 장시간의 계산 작업은 스케줄러를 이용하여 작업을 제출해야 한다.[8]
구성[편집]
계산 노드[편집]
구분 | 계산 노드 | CPU-only 노드 |
---|---|---|
모델명 | 크레이 CS500 | 크레이 CS500 |
시스템 구조 | 제온파이 클러스터 | 중앙처리장치 클러스터 |
중앙처리장치 종류 | 인텔 제온파이 7250 1.4GHz | 인텔 제온 6148 2.4GHz |
총 노드 수 | 8,305 | 132 |
노드당 중앙처리장치 | 1 | 2 |
중앙처리장치당 코어 수 | 68 | 20 |
전체 노드 총 코어 수 | 564,740 | 5,280 |
코어 당 메모리 | 1.4GB | 2.4GB |
노드 당 메모리 | 96GB | 192GB |
총 메모리 | 797.3TB | 25.3TB |
이론 최고성능 | 25.3PF | 0.4PF |
디스크 스토리지 | 21PB | 21PB |
인터커넥트 네트워크 | OPA | OPA |
누리온 시스템의 계산노드는 총 8,437개로 매니코어 기반의 인텔 제온파이7250(Xeon Phi 7250) 프로세가 장착된 8,305개의 계산노드와 인텔 제온골드6148 프로세서가 장착된 132개 계산노드로 구성되어 있다. 매니코어(KNL) 노드에 장착된 인텔 제온파이 7250 프로세서는 1.4기가헤르즈 기본 주파수에 68개 코어와 스레드 272개로 동작한다. L2 캐시 메모리는 34메가바이트이며, 온 패키지 메모리인 MCDRAM(Multi-Channel DRAM)은 16기가바이트이다. 노드 당 메모리는 96기가바이트로 16기가바이트 DDR4-2400 메모리가 6채널로 구성되어 있다. 2U 크기의 인클로저에는 4개의 계산 노드가 장착되며, 42U 표준랙에 72개의 계산 노드로 구성되어 있다. 또한, CPU-only 노드에는 2개의 인텔 제온골드(Intel Xeon Gold) 6148 프로세서(코드명 스카이레이크)가 장착되어 있다. 기본 주파수는 2.4기가헤르즈이며 20개 코어와 스레드 40개로 동작한다. L3 캐시 메모리는 27.5메가바이트이며, 각 중앙처리 장치(CPU)당 메모리는 96기가바이트(노드 당 192기가바이트)로 16기가바이트 DDR4-2666 메모리가 6채널로 구성되어 있다. 2U 크기의 인클로저(enclosure)에는 4개의 계산 노드가 장착되어 있다.[9]
인터커넥트 네트워크[편집]
인터커넥트 네트워크는 계산노드와 스토리지 시스템을 초고속으로 연결해준다. 노드 간 계산 네트워크 및 파일 입력 및 출력(I/O) 통신을 위한 인터커넥트 네트워크로 옴니패스 아키텍처(OPA)를 사용하고 있다. 100 Gbps 급의 인텔 옴니패스 아키텍처를 사용하여 패트 트리(Fat-Tree) 구조로 계산 노드 간 50% 블로킹(blocking), 스토리지 간 논-블로킹(non-blocking) 네트워크로 구성하였다. 계산 노드와 스토리지는 277개의 48 포트 엣지(Edge) 스위치에 연결되며 모든 엣지 스위치는 8대의 768 포트 디렉터(Director) 스위치에 연결했다.[9]
스토리지[편집]
구성 | 내용 |
---|---|
시스템 | DDN IME240, 무한 메모리 엔진기기(IMEA) |
소프트웨어 버전 | 센트오에스 7.3, IME 1.2 |
최대 입출력 성능 | 초당 20 GB/s |
네트워크 인터페이스 | 2 x OPA |
에스에스디 타입 | 1.2TB, NVMe 드라이브 |
에스에스디 수량 | 16ea(1.2TB NVMe) + 1ea(450GB 에스에스디) |
용량 | 19.2TB |
누리온의 병렬파일 시스템(Parallel File System)과 버스트버퍼(Burst Buffer)는 DDN(Data Direct Networ)사 IME(Infinite Memory Engine)와 Lustre 파일 시스템 기반의 EXAScaler 솔루션을 사용하여 서비스된다. PFS는 DDN ES14KX 모델로 구성된 스크래치(/scratch), 홈(/home01), 애플리케이션(/app) 세 개의 파일 시스템을 제공하고 있으며, 각 파일 시스템은 SFA7700X 스토리지를 사용하는 두 대의 메타데이터 서버(MDS)를 포함한다. BB는 계산 노드와 병렬파일 시스템 사이에서 동작하는 NVMe 기반의 캐시로 약 829테라바이트의 용량을 제공한다. PFS는 765테라바이트 용량의 홈 디렉터리와 510테라바이트 용량의 사용자 애플리케이션이 제공 디렉터리(/applic), 21PB 글로벌 스크래치 디렉터리(/scratch)를 제공하고 있다. 해당 파일 시스템은 계산 노드, 로그인 노드, 아카이빙 서버(Data Mover)에 마운트 되어 서비스되고 있다.[9]
버스트 버퍼(Burst Buffer)는 계산 노드와 스토리지(/scratch) 사이의 입력 및 출력(Input/Output) 가속화를 위한 캐시 레이어로 병렬파일 시스템의 작은 입력 및 출력과 랜덤 입력 및 출력의 취약성을 보완하고자 5호기 누리온에 최초 도입되었다. 입력 및 출력 의존성이 높은 사용자 애플리케이션 지원을 목표로 하고 있으며, 응용수행과제가 버스트 버퍼 사용에 적절한지 사전 평가 후 전용 큐를 통해 지원하고 있다. 버스트 버퍼 구성을 위해 DDN사의 IME240솔루션이 적용되었으며, IME는 계산 노드와 병렬파일 시스템 사이에서 동작하는 NVMe 기반의 캐시를 제공한다. IME는 파일 시스템 유저스페이스(FUSE)를 사용하여 IME API를 제공하고 있다. IME 클라이언트 서버는 파일 시스템 유저스페이스를 통해 IME 디바이스를 마운트 하여 사용하게 된다. 주의할 것은 IME는 스토리지 파일 시스템의 캐시 역할을 수행하기 때문에 스토리지 파일 시스템이 사전에 반드시 마운트 되어 있어야 한다. 파일 시스템 유저스페이스를 사용하여 마운트 된 IME 디렉터리는 '/scratch_ime'이며, 최초 사용자가 해당 디렉터리(/scratch_ime/$USER)에 접속하면 스크래치(/scratch/$USER) 파일 시스템의 모든 디렉터리와 파일들을 동일하게 확인할 수 있다. 이는 IME 디바이스에 존재 않은 데이터이며, 버스트버퍼를 이용하여 작업 수행 시 스크래치 파일 시스템에서 IME로 캐싱하여 수행하게 된다. IME를 사용하게 위해서는 데이터의 라이프 사이클을 파악해야 한다. IME이 데이터 처리 단계는 크게 프레스티지(prestage), 프리페치(prefetch), 싱크(sync), 릴리즈(releas) 단계가 있으며, 각각에 대해 IME API를 제공하고 있다.[9]
활용[편집]
클라우드[편집]
한국과학기술정보연구원(KIST)이 슈퍼컴퓨터 누리온을 클라우드 환경에서 이용할 수 있는 KI(KISTI Intelligent) 클라우드 서비스를 오픈했다. 이 서비스는 전통적인 계산과학 연구자뿐만 아니라 인공지능, 빅데이터 분석 연구자들도 이용할 수 있다. KI 클라우드는 기존의 고전적 인터페이스와는 달리, 대화형 클라우드 서비스를 통해 연구자가 원하는 컴퓨팅 환경을 쉽게 구성할 수 있다. 기존에 슈퍼컴퓨터 누리온을 활용하고 싶은 사용자는 텍스트 터미널 환경에서 미리 코딩한 프로그램을 제출한 후 작업 순서를 기다려서 결과를 확인하는 한 방향 형태의 작업 처리를 해야 했다. 하지만 이번에 새로 오픈한 KI 클라우드 서비스를 통해서는 슈퍼컴퓨터 사용자는 웹 사용자 환경을 통해 접속하여 자신만의 가상서버를 만들어 사용하거나 프로그래밍 도구를 이용하여 프로그램 결과를 시각적으로 즉시 확인하면서 작업을 수행할 수 있다. 한국과학기술정보연구원은 중앙처리장치(CPU) 서버 중심의 서비스뿐만 아니라 슈퍼컴퓨터 5호기의 그래픽처리장치(GPU) 서버를 중심으로 하는 뉴런 시스템을 클라우드 서비스에 연결함으로써 KI 클라우드 서비스를 지속해서 확장해 나갈 예정이다. KI 클라우드 서비스 개시는 슈퍼컴퓨터를 빅데이터, 인공지능 등의 분야에서 손쉽게 활용할 수 있도록 하여 데이터 생태계 중심 기관인 한국과학기술정보연구원의 역할을 한층 더 강화할 수 있는 계기가 되었다.[10]
폐암과 알츠하이머[편집]
한국에서 가장 빠른 컴퓨터 누리온이 우주 탄생의 비밀 찾기에서 알츠하이버병의 새 원인 발견까지 폭넓은 분야의 과학 연구현장에서 맹활양하고 있다. 카이스트 의과학 대학원 주영석 교수와 서울대 의대 흉부외과 김영태 교수 공동 연구팀은 138개의 폐 선암 사례 전장 유전체 서열 데이터를 분석해 비흡연자한테서 폐암을 일으키는 유전체 돌연변이는 10대 이전 유년기부터 나타날 수 있다는 연구 결과를 국제학술지 셀에 발표했다. 카이스트 의과학 대학원 이정호 교수, 한국과학기술정보연구원 이준학 박사 공동 연구팀은 52명의 알츠하이머병 환자에게 얻은 사후 뇌 조직에서 전장 엑솜 유전체 서열(whole-exome sequencing) 데이터를 분석해 알츠하이머병에 존재하는 뇌체성 유전변이를 찾아냄으로써, 노화 과정에서 발생하는 후천적 뇌 돌연변이가 알츠하이머병의 새로운 원인이 될 수 있다는 이론을 국제 학술지 네이처 커뮤니케이션스에 발표했다.[11]
원시 은하[편집]
고등과학원 박창범 교수 연구팀은 세계 최대 규모의 우주론적 유체역학 수치 모의실험을 수행했다. 90일 동안 계산한 그랜드챌린지 과제였다. 슈퍼컴 4호기 타키온으로는 6년 이상, 일반 PC로는 30만 년 이상 걸리는 계산이었다. 이 실험은 우주생성 직후(138억 년 전)부터 110억 년까지 원시 우주의 은하, 은하단 및 대규모의 구조물 형성을 설명하려는 시도이다. 누리온 덕분에 은하를 대상으로 하는 통계학적 분석 및 연구에 활용할 데이터를 기존보다 5배 이상으로 확장할 수 있었다. 이것은 은하 생성에 우주 거대구조의 효과를 처음으로 제대로 반영한 우주론적 시뮬레이션이며 원시 은하단의 생성 등 천체 생성의 비밀을 캐낼 수 있을 것으로 기대한다.[11]
차세대 반도체와 첨단소재[편집]
서울대 박철환 교수 연구팀은 새로운 정보 저장용 소재로 주목받는 2차원 자성물질인 삼황화인니켈 소재를, 한국과학기술연구원 김상태 박사 연구팀은 배터리 소재를, 울산과학기술원(UNIST) 이근식 교수 연구팀은 차세대 나노 전자소자를 연구해 각각 국제 학술지 네이처 커뮤니케이션스(Nature Communications)에 발표했다. 서울대 한승우 교수 연구팀은 1만7700개 물질을 대상으로 여러 단계의 시뮬레이션 분석을 통해 최종적으로 두 개의 후보물질을 P형 반도체용 최적 소재로 제시했다. 카이스트 정유성 교수 연구팀은 인공지능 기술과 슈퍼컴퓨터 활용을 융합해 소재 개발 기간을 크게 단축할 수 있는 새로운 소재 역설계 방법을 찾아내 4종의 신물질을 발견했다.[11]
문제점[편집]
재고처리[편집]
2015년 전후 인텔의 지원으로 슈퍼컴퓨팅 관련 연구를 진행하면서 제온파이 프로세서가 성능상 공식 발표데이터의 수치는 높지만, 실제 구현 성능상에 심각한 하자가 발생해서 이를 기반으로 슈퍼컴퓨터를 구축할 경우 확장성 자체가 없다는 사실을 이미 내부적으로 파악하고 있었다. 이에 따라 정부출연연구기관이 국가 예산 540억 원대를 투입하는 대형 국책사업을 추진하면서 구매 시스템에 치명적 하자가 있다는 사실을 알면서도 장비도입을 강행했다. 이것은 슈퍼컴퓨터 5호기 누리온이 실제로는 인텔의 단종된 중앙처리장치를 채택한 재고떨이용 모델로 드러나 국민 혈세 540억 원을 허공에 날리는 믿기 힘든 사건이었다. 실제 한국과학기술정보연구원은 인텔 제온파이 프로세서 외에 엔비디아 및 국내 전문 프로세서 업체가 제공 중인 고성능의 그래픽처리장치(GPU) 기반 프로세서는 검토대상에서 제외했다. 이로 인해 한국과학기술정보연구원이 인텔 중앙처리장치 대신 세계 각국이 앞다퉈 채택하고 있는 고성능의 그래픽처리장치 기반으로 슈퍼컴퓨터를 개발한다고 발표할 경우 수천억 원대 정부 시스템구축 및 개발자금 지원이 중단될 것을 우려해 치명적 하자가 드러난 인텔 중앙처리장치를 고집했다는 의혹이 생겼다. 또 전문가그룹에서는 출연연구기관이 주무 부천인 과기정통부로부터 차세대 슈퍼컴퓨터 6호기 자체개발 건으로 1, 2년 내 5,000억 ~ 8000억 원대에 이르는 국책연구비를 따내기 위해 인텔이 생산 중단한 재고떨이 낮은 사양 중앙처리장치 기반 5호기 슈퍼컴퓨터를 구매했다는 의견도 생겼다. 만약 고성능 그래픽처리장치 기반 슈퍼컴퓨터로 정책을 변경하면 국내에서 이미 그래픽처리장치 기반 슈퍼컴퓨팅 엔진을 생산, 수출하고 있는 점 때문에 한국과학기술정보연구원이 슈퍼컴퓨터 6호기 개발 건을 인텔 중앙처리장치 기반으로 밀어붙이기 사실상 힘들다. 한국과학기술정보연구원이 무조건 인텔의 중앙처리장치만 고집하는 것은 오로지 예산 확보 때문이다. 성능이나 확장성 등에는 크게 관심이 없고 오로지 슈퍼컴퓨터 6호기 개발사업을 추진하면서 조 단위 예산을 확보하려는 한국과학기술정보연구원 슈퍼컴퓨팅센터의 의지가 이런 5호기 초기투자를 물거품으로 만들었다.[12]
포화[편집]
슈퍼컴퓨터 5호기 누리온의 중앙처리장치 점유율이 운영 6개월 만에70% 선에 육박했다. 이는 통상 새로운 슈퍼컴퓨터가 도입된 뒤 2~3년이 지나야 도달하는 점유율 수치다. 이에 따라 누리온을 활용하기 위한 연구자들의 대기시간이 최대 6~7시간까지 길어지는 현상도 벌어지고 있어 연구 현장에서의 데이터 처리 수요 증가를 뒷받침할 수 있는 컴퓨팅 인프라 확충이 요구된다. 더욱이 중이온가속기, 지하실험연구단의 암흑물질 및 중성미자 검출기, 핵융합로, 전파망원경 등 거대실험장치를 이용한 연구에서는 데이터 분석을 위해 대규모 컴퓨팅이 꼭 필요하며 국내에 한 대뿐인 투과식 전자현미경도 3~4대가 더 도입될 예정이어서 관련 연구자들의 마음이 조급해진다. 이 원인은 물리학, 천문학, 화학, 생물학, 지구과학 등 모든 기초과학 분야에서 입자가속기와 같은 거대연구시설을 활용한 데이터가 쏟아지고 있는 데다 빅데이터 기반 연구방식의 확산, 국제 공동연구 활성화 등이 데이터 폭증을 만들었다. 국내에는 한국과학기술정보연구원 외에도 기상청과 기업 등에서 공식적으로 총 7대의 슈퍼컴퓨터가 운영되고 있다. 슈퍼컴퓨터는 특별한 정의가 없는 상대적인 개념으로 연산능력 기준으로 세계 500위 내 컴퓨터를 말한다. 한국의 슈퍼컴퓨팅 능력은 미국, 중국보다는 상당히 떨어져 있는 상태다. 세계적으로 슈퍼컴퓨터 보유 대수는 중국이 1위이며 연산능력합계로는 미국이 1위다. 한국은 연산능력 기준으로 세계 8위 수준이다. 한국의 경제력을 고려해도 미국, 중국, 일본보다 현저하게 떨어지는 수준이다. 한국과학기술정보연구원의 중장기 계획에 따르면 2023년 이후 수백 페타플롭스 급의 6호기를 구축하고, 2028년 이후 엑사플롭스 급 이상의 슈퍼컴퓨터를 구축, 운영한다. 누리온이 가동한 지 6개월밖에 지나지 않았는데 사용률이 70% 선까지올라온 것은 국내 기초과학계에 초고성능 컴퓨팅에 대한 대기수요가 많았다는 증거다.[13]
행사[편집]
해커톤[편집]
해커톤(Hackathon)은 개발자들이 오랜 시간 동안프로그래밍을 통해 실용적인 결과물을 만드는 대회이다. 해커톤 참가자들은 한국과학기술정보연구원(KIST)에서 제공하는 슈퍼컴퓨터 5호기 누리온의 보조시스템인 그래픽처리장치 클러스터를 이용해 직접 사용하거나 개발 중인 프로그램의 프로그래밍 성능 최적화 및 가속화를 연구한다. 특히, 이 대회에서는 엔비디아, 한국과학기술정보연구원 및 미국 오크리지 국립 연구소 슈퍼컴퓨팅 센터에서 온 국내외 전문가 15명이 각 팀에 2명씩 멘토로 배정돼 참가자들과 함께 연구 문제를 해결한다. 대회 마지막 날에는 최적화된 프로그래밍을 전문가 앞에서 발표하는 시간을 가진다. 전문가들은 참가자들의 발표를 바탕으로 프로그램의 성능과 향후 방향성에 대해 조언한다. 서울대와 숙명여대의 공학도 및 자연과학도 등으로 구성된 DCSLab 팀은 딥 러닝(Deep Learning)을 통해 적은 예산으로 충분한 실험을 할 수 있는 우주 파형 계산 프로그래밍에 대해 발표했고 FVCOMik 팀은 해양예보를 위한 상황예측모델에 대해 발표했다. 로봇 연구자들로 구성된 ELSA 팀은 로봇이 카메라를 통해 촬영한 영상의 물체들을 빠르게 인식해 신속한 서비스를 제공하는 딥 러닝 관련 프로그래밍에 대해 발표했다. 전문가들과 함께 아이디어를 도출하고 실용적인 프로그램을 만들어 내는 그래픽처리장치 해커톤 2019는 호주, 독일, 미국 등 10개국에서 개최한다.[14]
슈퍼컴퓨팅 컨퍼런스 2019[편집]
미국과 중국이 세계 슈퍼컴퓨터의 2강 체제를 유지한 가운데 한국의 슈퍼컴퓨터 5호기 누리온이 14위를 기록했다. 슈퍼컴퓨팅 컨퍼런스 2019는 세계 최고 슈퍼컴퓨터 탑 500을 발표했다. 슈퍼컴퓨팅 컨퍼런스 2019에서 발표한 탑 500 순위에는 미국 오크리지 국립연구소(ORNL) 서밋(Summit)이 1위를 차지했다. 서밋은 실측성능은 148페타플롭스로 1초에 148 x 1,000조 번 연산이 가능하다. 2위는 미국 로렌스 리버모어 국립연구소(LLNL)의 시에라(Sierra), 3위는 중국의 선웨이 타이후라이트(Sunway TaihuLight)로 상반기 순위를 그대로 유지했다. 한국과학기술정보연구원의 슈퍼컴퓨터 5호기 누리온은 오크리지 국립연구소 슈퍼컴퓨터 타이탄(12위)이 퇴역하면서 상반기 발표된 순위 대비 1단계 상승한 14위를 기록했다. 누리온은 연산 속도는 25.7 페타플롭스로 계산 노드는 8,437개다. 이번 발표에서 기상청이 보유한 누리와 미리는 각각 113위와 114위를 차지해 한국은 3대(국가별 순위 12위)의 슈퍼컴퓨터만 탑 500순위에 들며 큰 격차를 보였다.[15]
전망[편집]
4호기에 비해 70배 향상된 능력을 보유한 누리온의 역할에 기대감이 몰리는 건 이 때문이다. 누리온은 그동안 장비 한계에 부딪혔던 영역의 연구를 가능하게 할 것이라는 전망이다. 우주의 기원을 밝히는 기초연구 등이 대표적이다. 기업의 신제품 개발과 시장 분석, 자연재해, 교통 문제 등 국가, 사회 현안 해결에도 긍정적인 영향을 미칠 것이다. 과학기술정보통신부 가 발표한 5호기 운영계획안은 누리온은 국가 대형 연구 장비인 점을 고려해 최대한 무상 사용을 원칙으로 하되 사용자가 신속한 사용을 원하는 경우 유상으로 지원한다. 누리온을 활용해 우수 연구 성과를 낸 연구자에게는 지원 과제 수 확대와 같은 인센티브를 제공할 예정이다. 인간의 지식이나 노동력 대신 데이터가 부를 창출하는 데이터 경제 시대에 진입하면서 슈퍼컴퓨터가 새로운 가치를 창출하고 미래 경쟁력을 확보하는 데 핵심 역할을 할 것이다. 5호기 누리온의 활용 분야를 넓히고 경쟁력 확보에 필요한 분야나 사회 현안 과제를 적극적으로 지원할 예정이다.[16]
각주[편집]
- ↑ 권혁준 기자, 〈국가 슈퍼컴퓨터 5호기 '누리온' 개통…고성능PC 2만대 성능〉, 《서울경제》, 2018-11-07
- ↑ 백지영 기자, 〈국가 슈퍼컴퓨터 도입 30년 발전사〉, 《디지털데일리》, 2018-11-08
- ↑ 국가슈퍼컴퓨팅센터 공식 홈페이지 - https://www.ksc.re.kr/ggspcpt/sg
- ↑ 누리온 국가슈퍼컴퓨팅센터 - https://www.ksc.re.kr/mobile/ggspcpt/nurion
- ↑ 박규찬 기자, 〈슈나이더일렉트릭, KISTI 슈퍼컴퓨터 5호기에 '에너지절감 솔루션' 구축〉, 《인더스트리뉴스》, 2019-02-25
- ↑ 이석원, 〈4세대 제온파이가 몰고 온 고성능 컴퓨팅 세상〉, 《소프트웨어 중심사회》, 2016-07-29
- ↑ 썬구루, 〈CentOS란 무엇인가?〉, 《네이버 블로그》, 2017-05-18
- ↑ KSC Tech, 〈누리온 ANSYS FLUENT 사용자 지침서(2020.03)〉, 《티스토리》, 2019-03-04
- ↑ 9.0 9.1 9.2 9.3 〈슈퍼컴 5호기 누리온 사용자 지침서 (베타서비스용)〉, 《슈퍼컴퓨팅서비스센터》, 2018-11
- ↑ 조상록 기자, 〈KISTI, 슈퍼컴퓨터 ‘누리온’ 이용 가능한 클라우드 서비스 오픈〉, 《헬로티》, 2020-03-12
- ↑ 11.0 11.1 11.2 노성열 기자, 〈1초당 2.57경 연산 능력… 알츠하이머 규명 돕고 나노 개발 단축〉, 《문화일보》, 2019-12-02
- ↑ 김광일 기자, 〈슈퍼컴퓨터 5호기도입,540억원 허공에 날린 대국민사기극,KISTI 2년전에 알고도 ‘쉬쉬’강행,충격〉, 《피치원》, 2017-12-04
- ↑ 최상국 기자, 〈슈퍼컴퓨터 '누리온' 6개월만에 포화?〉, 《아이뉴스24》, 2019-05-29
- ↑ 김주연 기자, 〈엔비디아·KISTI·오크리지 국립연구소, 'GPU 해커톤 2019' 성황리에 마쳐〉, 《카이포스트》, 2019-03-04
- ↑ 김지균 기자, 〈한국 슈퍼컴퓨터 ‘누리온’ 세계 14위…미·중 1∼2위〉, 《데일리 비즌》, 2019-11-21
- ↑ 이근하 기자, 〈1초당 2경 5700조 연산 슈퍼컴 5호기가 온다〉, 《위클리 공감》, 2018-11-18
참고자료[편집]
- 국가슈퍼컴퓨팅센터 공식 홈페이지 - https://www.ksc.re.kr/ggspcpt/sg
- 권혁준 기자, 〈국가 슈퍼컴퓨터 5호기 '누리온' 개통…고성능PC 2만대 성능〉, 《서울경제》, 2018-11-07
- 백지영 기자, 〈국가 슈퍼컴퓨터 도입 30년 발전사〉, 《디지털데일리》, 2018-11-08
- 김지균 기자, 〈한국 슈퍼컴퓨터 ‘누리온’ 세계 14위…미·중 1∼2위〉, 《데일리 비즌》, 2019-11-21
- 박규찬 기자, 〈슈나이더일렉트릭, KISTI 슈퍼컴퓨터 5호기에 '에너지절감 솔루션' 구축〉, 《인더스트리뉴스》, 2019-02-25
- 이석원, 〈4세대 제온파이가 몰고 온 고성능 컴퓨팅 세상〉, 《소프트웨어 중심사회》, 2016-07-29
- 썬구루, 〈CentOS란 무엇인가?〉, 《네이버 블로그》, 2017-05-18
- KSC Tech, 〈누리온 ANSYS FLUENT 사용자 지침서(2020.03)〉, 《티스토리》, 2019-03-04
- 누리온 국가슈퍼컴퓨팅센터 - https://www.ksc.re.kr/mobile/ggspcpt/nurion
- 〈슈퍼컴 5호기 누리온 사용자 지침서 (베타서비스용)〉, 《슈퍼컴퓨팅서비스센터》, 2018-11
- 김주연 기자, 〈엔비디아·KISTI·오크리지 국립연구소, 'GPU 해커톤 2019' 성황리에 마쳐〉, 《카이포스트》, 2019-03-04
- 조상록 기자, 〈KISTI, 슈퍼컴퓨터 ‘누리온’ 이용 가능한 클라우드 서비스 오픈〉, 《헬로티》, 2020-03-12
- 노성열 기자, 〈1초당 2.57경 연산 능력… 알츠하이머 규명 돕고 나노 개발 단축〉, 《문화일보》, 2019-12-02
- 김광일 기자, 〈슈퍼컴퓨터 5호기도입,540억원 허공에 날린 대국민사기극,KISTI 2년전에 알고도 ‘쉬쉬’강행,충격〉, 《피치원》, 2017-12-04
- 최상국 기자, 〈슈퍼컴퓨터 '누리온' 6개월만에 포화?〉, 《아이뉴스24》, 2019-05-29
- 이근하 기자, 〈1초당 2경 5700조 연산 슈퍼컴 5호기가 온다〉, 《위클리 공감》, 2018-11-18
같이 보기[편집]