검수요청.png검수요청.png

"샤딩"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
잔글 (같이 보기)
잔글 ("샤딩" 문서의 보호를 해제했습니다)
 
(사용자 7명의 중간 판 85개는 보이지 않습니다)
1번째 줄: 1번째 줄:
'''샤딩'''(sharding)이란 하나의 거대한 [[데이터베이스]]나 [[네트워크]] 시스템을 여러 개의 작은 조각으로 나누어 분산 저장하여 관리하는 것을 말한다.
+
[[파일:샤아딩.PNG|썸네일|400픽셀|'''샤딩'''(sharding)]]
  
== 배경 ==
+
'''샤딩'''(sharding)<!--사드, 사딩, 샤디 -->이란 하나의 거대한 [[데이터베이스]]나 [[네트워크]] 시스템을 여러 개의 작은 조각으로 나누어 분산 저장하여 관리하는 것을 말한다. 이는 단일의 데이터를 다수의 데이터베이스로 쪼개어 나누는 걸 말하는데, 단일의 데이터베이스에서 저장하기 너무 클 때 사용하여 데이터를 구간별로 쪼개어 나눔으로써 [[노드]]에 무겁게 가지고 있던 데이터를 빠르게 검증할 수 있어 빠른 [[트랜잭션]] 속도를 향상시킬 수 있다. 샤딩을 통해 나누어진 블록들의 구간(epoch)을 [[샤드]](shard)라고 부른다.<ref name="딩">sobly tv, 〈[http://a.to/19MoDVp 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03</ref>
샤딩은 블록체인 시스템의 [[확장성]](scalability) 문제를 해결하기 위한 방법 중 하나이다. 확장성은 시간이 지남에 따라 생겨나는 변화를 받아들이는 능력이다.<ref>고란 기자, 〈[https://news.joins.com/article/23048186 성공한 플랫폼은 보이지 않는다]〉, 《중앙일보》, 2018-10-17</ref> 시간이 지남에 따라 블록체인 기반 서비스는 대체로 사용자 수가 증가하기 때문에, 확장성 문제란 결국 더 많은 사용자들이 만들어내는 트랜잭션을 블록체인 시스템으로 처리할 수 있는 능력의 문제이다. 대개 블록체인의 확장성 지표로 TPS를 사용한다. [[TPS]]Transaction per Second의 약자로서 1초당 처리할 수 있는 트랜잭션의 개수를 나타내는 단위이다. 기존 [[비트코인]]과 [[이더리움]]의 경우 확장성 문제가 심각하여, TPS를 획기적으로 증가시키기 위한 다양한 방법이 고안되고 있는데, 그 중 대표적인 것이 샤딩이다.
+
 
 +
==개요==
 +
샤딩은 "조각내다"라는 뜻으로 데이터베이스 저장기법 중 하나이며, 전체 네트워크를 분할한 뒤 트랜잭션을 영역별로 저장하고 이를 병렬적으로 처리하여 [[블록체인]]에 확장성을 부여하는 온체인 솔루션으로 데이터를 샤드라는 단위로 나눠서 저장 및 처리한다. 샤딩 개념의 근원은 데이터베이스 샤딩에 있고, 데이터베이스 샤딩이란 대용량의 데이터를 처리하기 위해 테이블을 수평 분할하여 데이터를 분산 저장하고 처리하는 것이다.<ref name="오">오세진, 〈[http://a.to/19wGuV4 블록체인 확장성 솔루션 시리즈 4–1 :: Sharding 샤딩]〉, 《미디엄》, 2018-06-08</ref> 만약 10만큼의 데이터와 10명의 노드가 참여했다고 가정한다면 기존의 블록체인은 10명의 노드 개개인은 10만큼을 모두 가지고 있으면서 공유하지만, 샤딩은 10을 조각내서 10명의 노드 개개인은 1만큼씩만 보관함으로써 보관 데이터가 가벼워져 거래처리 속도가 크게 향상된다.<ref>ICO of KOREA, 〈[https://m.blog.naver.com/seonggi159/221296380563 샤딩(sharding) 이란? / 이더리움 샤딩, 질리카 샤딩]〉,《네이버 블로그》, 2018-06-11 </ref>
 +
 
 +
== 등장배경 ==
 +
샤딩은 블록체인 시스템의 [[확장성]](scalability) 문제를 해결하기 위한 방법의 하나이다. 확장성은 시간이 지남에 따라 생겨나는 변화를 받아들이는 능력이다.<ref>고란 기자, 〈[https://news.joins.com/article/23048186 성공한 플랫폼은 보이지 않는다]〉, 《중앙일보》, 2018-10-17</ref> 시간이 지남에 따라 블록체인 기반 서비스는 대체로 사용자 수가 증가하기 때문에, 확장성 문제란 결국 더 많은 사용자가 만들어내는 트랜잭션을 블록체인 시스템으로 처리할 수 있는 능력의 문제이다. 대개 블록체인의 확장성 지표로 [[TPS]] 를 사용한다. TPS는 Transaction per Second의 약자로서 1초당 처리할 수 있는 트랜잭션의 개수를 나타내는 단위이다. 기존[[비트코인]]과 [[이더리움]] 의 경우 확장성 문제가 심각하여, TPS를 획기적으로 증가시키기 위한 다양한 방법이 고안되고 있는데, 그 중 대표적인 것이 샤딩이다. 샤딩은 [[플라즈마]], [[라이덴]] 네트워크 등과 마찬가지로 확장성 문제를 해결하기 위해 제안된 솔루션이고, 플라즈마, 라이덴 네트워크는 오프체인 솔루션이지만 샤딩은 On-chain 솔루션이며, On-chain 솔루션이란 메인체인 자체의 [[프로토콜]] 을 변경시켜서 메인체인의 성능을 향상하는 방법을 말한다. On-chain 솔루션을 적용하기 위해서는 메인 네트워크의 [[하드 포크]] 가 필수적으로 Off-chain 솔루션이 메인체인 바깥에 다른 시스템을 추가하여 해결하기 때문에 하드 포크가 필요 없는 것과 대비 되는데 확장성 문제 솔루션 중 하나로, 이더리움이 POS (Proof of Stake) 합의 알고리즘으로 전환할 것을 기반으로 설계되었다.<ref name="오"></ref>
 +
 
 +
==특징==
 +
샤딩은 관계형 데이터베이스에서 대량의 데이터를 처리하기 위해서 데이터를 [[파티셔닝]] 하는 기술로 파티셔닝은 [[DBMS]] 에서 지원하기도 하는데, 일부 DBMS에서는 지원하지 않으며, DBMS 레벨에서 데이터를 나누는 것이 아니고 데이터베이스 자체를 분할하는 방식으로 애플리케이션 레벨에서 구현해야 한다. 데이터베이스가 여러 파편으로 분할되고 서로 다른 서버에 저장되는 전통적인 데이터베이스 샤딩 개념에서 영감을 받은 확장성 기술이 샤딩으로 공개형 블록체인의 맥락에서, 네트워크에 올려진 트랜잭션은 네트워크상의 서로 다른 노드들로 이루어진 여러 샤드(shards)로 분할되어 각각의 노드는 들어오는 트랜잭션들의 일부만을 처리할 수 있게 되고, 네트워크상에서 병렬식으로 다른 노드들에서도 똑같이 실행되기에 네트워크를 여러 샤드로 쪼개면 동시에 더 많은 트랜잭션을 처리하고 증명할 수 있어 네트워크가 커질수록 점점 더 많은 트랜잭션 처리가 가능하게 되는 속성을 병렬식 확장(horizontal scaling)이라고 도 불린다.<ref name="블">phuzion7, 〈[http://a.to/19w9FPK 블록체인 샤딩의 3가지 형태: BlockChain Sharding]〉,《데일리 코인뉴스》, 2018-12-31 </ref> 샤딩은 단일의 데이터베이스에서 저장하기 너무 클 때 사용되고 이렇게 데이터를 구간별로 쪼개어 나눔으로써 노드에 무겁게 가지고 있던 데이터를 빠르게 검증할 수 있어 빠른 트랜잭션 속도를 가질 수 있으며, 샤드란 샤딩을 통해 나누어진 블록들의 구간을 '샤드'라고 부른다.
 +
 
 +
* '''수평 분할(Horizontal Partitioning)'''
 +
: [[스키마]](schema)가 같은 데이터를 두 개 이상의 테이블에 나누어 저장하는 디자인을 말하고, 가령 같은 주민 데이터를 처리하기 위해 스키마가 같은 '서현동 주민 테이블'과 '정자동 주민 테이블'을 사용을 뜻하며, 인덱스의 크기를 줄이고, 작업 동시성을 늘리기 위한 것이지만 보통 수평 분할을 한다고 했을 때는 하나의 데이터베이스 안에서 이루어지는 경우를 지칭한다.<ref>전원희, 〈[https://d2.naver.com/helloworld/14822 NHN의 안과 밖: Sharding Platform]〉,《네이버D2》, 2012-02-17 </ref>
 +
 
 +
* '''샤딩의 장점'''
 +
# 필요한 데이터만 빠르게 조회할 수 있기 때문에 쿼리 자체가 가볍다.
 +
# 오래돼서 조회가 안 되는 데이터를 클라우드에 올리거나 별도의 디스크에 저장해서 운영상의 스토리지 이득을 볼 수 있다.
 +
 
 +
* '''샤딩의 문제점'''
 +
: 블록체인 시스템의 확장성 문제를 해결하기 위해 등장한 기술이지만 샤딩을 적용할 경우 한 샤드 내에서의 전송이 아닌 여러 샤드 간의 전송은 절차가 훨씬 복잡하고 느려진다. 여러 샤드로 쪼갤수록 인터샤드 트랜잭션은 확률적으로 많아지는데 각 샤드는 자기 샤드의 데이터만 있고, 다른 샤드의 데이터는 가지고 있지 않으므로 샤드간 데이터를 어떻게 참조할 것인지, 어떻게 검증할 것인지 문제가 생겨서 알고리즘이 복잡해진다. 만약 이 단계에서 거래결과가 뒤집어지면 (비확정적합의) 상황은 더욱 복잡해지기 때문에 확정합의가 거의 필수이다.
 +
 
 +
: 또한 샤딩이 들어가게 되면 전체의 안정성은 보장이 된다고 하더라도 시간이 지나면 샤드간 불균형이 일어나 일부 샤드의 안정성이 취약해지는 문제가 발생할 수 있다. 샤드마다 트랜잭션의 빈도, 노드의 수, 밸리데이터의 비율 등에서 차이가 나기 때문에 한 번 샤드가 정해진 다음에도 샤드의 구성원을 재배치하여 샤드간 균형을 맞추는 알고리즘이 필요하다. 뿐만 아니라 예상했던 것보다 전체 트래픽이 높아질 경우, 처음 설정해둔 샤드의 수를 늘릴 필요가 있다. 한 번 쓰여진 데이터를 해쉬나 서명으로 묶어 위변조나 조작을 하지 못하도록 만들어진 분산원장구조에서는 샤드를 중간에 추가하는 등의 동적 샤딩 기술을 구현하기가 매우 어렵다.
 +
 
 +
: 확장성의 문제를 해결방책으로 나온 샤딩에 중앙화의 문제와 보안성의 문제를 가지게 되는데 보안의 문제에는 1% attack의 문제가 생길 수 있고, 100개의 샤드의 시스템에서는 오직 1%의 hash rate로 샤드를 지배할 수 있어 샤드 간의 커뮤니케이션이 너무 빈번하게 일어난다면, 커뮤니케이션으로 인한 시간 지연의 문제가 생기게 된다.<ref name="딩"></ref> 데이터 재분배(Rebalancing data)로는 Sharding된 [[DB]] 의 물리적인 용량 한계나 성능 한계에 따르면 샤드의 수를 늘리는 scale-up 작업이 필요하며 서비스 정지 없이 scale-up 할 수 있도록 설계 방향을 잡아야 하며, Global Transaction을 사용하면 샤드 DB 간의 트랜잭션도 가능하여 [[XA]] 임에도 성능 저하의 문제가 있다.<ref>hanburn, 〈[https://genesis8.tistory.com/211 샤딩(sharding)이란?]〉,《티스토리》, 2012-01-17 </ref>
 +
 
 +
* '''확장성과 샤딩에 대해'''
 +
: 블록체인에서의 문제점은 크게 탈중앙화, 보안성, 확장성의 문제로 이 세 가지 문제 중 어떠한 두 가지는 만족시킬 수 있지만, 남은 한 가지는 만족시킬 수 없는 [[트릴레마]] 의 문제를 가지게 되고, 이 중에서 그동안 가장 블록체인 기술에서 문제 되었던 부분은 확장성의 문제는 상용화를 위해서는 기존의 서비스와 같이 불편함이 없어야 하기에 TPS가 빨라야 하지만, 정보를 처리하는데 사용자들이 오랜 시간 기다리지 않고 사용할 수 있으며, [[TPS]] 의 비교를 통해 얼마나 짧은 시간 안에 많은 정보를 처리할 수 있느냐를 직관적으로 확인할 수 있기 때문에 사람들은 수많은 블록체인 프로젝트를 비교할 때 대표적으로 TPS를 비교하여 샤딩은 확장성의 문제를 해결해주는 한 가지의 방법으로써 노드들을 좀 더 빠르게 검증할 수 있어 빠른 트랜잭션을 통하여 좀 더 높은 TPS를 가질 수 있다.<ref>sobly tv, 〈[https://medium.com/@sobly/샤딩이란-쉽게-이해해보자-7732bcbe0bb8 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03 </ref>
 +
 
 +
* '''데이터베이스를 나누는 방법'''
 +
#'''Vertical Partitioning''' : 테이블별로 서버를 나누는 방식으로 구현이 간단하고, 전체 시스템에 큰 변화가 필요 없다는 장점이 있고 단점으로는 각 서버의 데이터가 점점 거대해지면 추가 샤딩이 필요하다.
 +
#''' Range Based Partitionging''' : 하나의 feature가 점점 거대해지는 경우 서버를 분리하는 방식이며, 유저 별로 서버를 분리하거나, 일정 데이터라면 년도 별로 분리, 거래정보라면 우편번호를 이용하고 주의 사항으론 데이터를 나누는 방법이 예측 가능 해야 한다.
 +
#''' Key or Hash Based Partitioning''' : 엔티티를 해쉬함수에 넣어서 나오는 값을 이용해서 서버를 정하는 방식으로 해쉬결과 데이터가 균등하게 분포되도록 해쉬 함수를 정하는 게 중요하며, 서버의 수를 늘리기 위해 해쉬함수를 변경하는 작업이 정말 비싼 작업이라는 단점이 있다.
 +
#'''Directory Based Partitioning''' : 파티셔닝 메커니즘을 제공하는 추상화된 서비스를 만드는 것으로 샤드 키를 look-up 할 수 있으면 되므로, 구현은 DB와 CACM을 적절히 조합해서 만든다.
 +
 
 +
* '''샤딩 체인 동작 방식'''
 +
# proposer가 되고 싶은 네트워크 참여자는 [[SMC]] 를 통해 [[balance]] 를 예치한다.
 +
# collator가 되고 싶은 네트워크 참여자는 SMC를 통해 [[deposit]] 을 예치한다.
 +
# Collator들은 주기적으로 SMC status를 확인해서, 자신이 collator에 선정되었는지 여부를 확인한다.
 +
# Collator들은 SMC에 의해 각 샤드 체인에 pseudo-random 하게 배정되고, [[look ahead period]] 동안에 해당 샤드의 이전 기록들을 다운받으면 선택된 proposal을 제안한 proposer로부터 proposal bid를 받는다.
 +
# Proposer는 트랜잭션을 담은 proposal을 collator에게 제출하는데, proposal은 아직 검증되지 않은 collation을 의미하며, 선택된 proposal을 제출한 proposer는 트랜잭션 발송자로부터 트랜잭션 fee를 받는다.
 +
# Collator들은 해당 proposal에 속한 트랜잭션들이 valid 한지를 검증하는 투표를 한다.
 +
# 표에서 2/3 이상의 collator들이 proposal에 포함된 트랜잭션이 valid 하다고 찬성할 경우, 해당 proposal은 유효한 collation이 된다.
 +
 
 +
* '''주요 용어'''
 +
# '''Collation''' : 샤드 체인에서 메인 체인의 블록과 같은 역할을 하며, 크게 collation header와 트랜잭션 목록으로 구성된다.
 +
# '''Collation header''' : collation을 구성하는 정보를 담고 있으며, proposer의 sign을 거쳐 메인 체인에 제출하고, 트랜잭션 목록은 collation에 담긴 트랜잭션들의 목록이다.
 +
# '''Proposer''' : 제안자라는 뜻으로 트랜잭션들을 모아 proposal을 만들고 collator에게 제출하며, Proposal은 검증되지 않은 collation이다.
 +
# '''Collator''' : Proposer가 제출한 proposal을 검증한다. period마다 한 샤드에는 여러 collator들이 배정되는데 이들은 해당 period에 진입하기 일정 기간 이전에 무작위로 선정된다.
 +
# '''Executor''' : Collation header를 메인체인의 SMC (Sharding Manager Contract)에 전달하고, 샤드 체인의 실제 state가 변경된다. (Executor는 샤딩 phase 3에 등장)
 +
# '''Period''' : 메인 체인에서 샤드 체인의 collation header를 제출받는 주기이며, 단위는 메인 체인에서의 블록의 개수로 PERIOD_LENGTH = 5라면 5개의 블록이 생성되는 것이 1 period이다.
 +
# '''Look ahead period''' : Collator는 샤드 체인에서 collation을 검증하기 이전에 SMC에 의해 pseudo-random 하게 배정되는데, 'look ahead period'는 collator가 몇 period에 앞서서 어떤 샤드 체인에 배정되는지를 나타내고, LOOKAHEAD_PERIODS = 4이면 4 period 이전에 collator는 샤드 체인에 배정되므로 Collator는 사전에 자신이 배정된 샤드 체인의 state 정보를 다운받는 시간을 확보할 수 있다.
 +
# '''Sharking Manager Contract (SMC)''' : SMC는 샤드 체인에서 가장 중요한 역할을 하는 스마트 컨트랙트 로 SMC는 메인 체인과 샤드 체인을 연결하며, collator, proposer, collation tree를 관리하며, 샤드 체인이 메인체인에 참여하기 위해서는 SMC의 역할이 필수적이다.
 +
 
 +
[[파일:동그라미.PNG|썸네일|500픽셀|'''이더리움에 샤딩 적용''']]
 +
* '''이더리움 샤딩'''
 +
: [[비탈릭 부테린]] 은 이더리움 창시자이며, 이더리움 샤딩은 메인 체인이 처리해야 할 블록들을 조각내어 샤드(Shard)라고 불리는 [[오프 체인]](off-chain)에 할당하는데 오프 체인들은 주어진 조각에 대해서만 유효성을 검증하게 되고, 샤드들이 각자 할당된 조각들의 검증을 모두 끝내면 다시 묶어 이러한 개념을 통해 블록을 검증하는 데 걸리는 시간을 단축하며, 이더리움의 블록 생성 속도는 13초 이상 걸리고 있지만, 샤딩이 도입된다면 약 2초에서 8초 사이에 생성될 것이다.<ref>KMK, 〈[https://blog.naver.com/mingbyul/221320499250 샤딩(Sharding)이란? 이더리움의 확장성 문제, 질리카의 기술]〉,《네이버》, 2018-07-17 </ref> 샤드별로 Merkel Patricia tree를 만들고 그 샤드의 root들로 만들어진 Merkel Patricia tree의 root만을 블록체인에 올리는 것으로 모든 miner가 모든 트랜잭션을 실행할 필요 없이 샤드별로 miner를 분산 시켜 실행할 수 있기 때문에 전체 실행 속도가 올라간다. 이더리움 2.0으로 통하는 차세대 이더리움 블록체인을 기술적으로 상징하는 특징은 [[캐스퍼]] 로 대표되는 새로운 합의 메커니즘과 샤딩을 이더리움 창시자 비탈리크 부테린이 직접 나서 차세대 이더리움을 이끌 원투펀치로 캐스퍼와 샤딩을 적극 프로모션하고 있다.<ref>황치규 기자, 〈[http://www.thebchain.co.kr/news/articleView.html?idxno=1459 캐스퍼와 샤딩 무장한 '이더리움 2.0' 시대 열린다]〉,《더비체인》, 2018-08-27 </ref>
 +
 
 +
* '''이더리움 샤딩의 문제점'''
 +
# '''난수 생성''' : 난수를 사용하여 검증자를 샤드에 배정하는데, 공격자가 난수를 예측하거나 조작할 수 있어, 샤딩 보안에 문제가 생긴다.
 +
# '''빠른 샤드 전환''' : 샤드에 대한 공격 성공 가능성을 줄이려면 검증자를 빠르게 전환해야 하는데 이전부터 look ahead time을 두어 검증자가 자신이 맡을 샤드[[블록]]를 미리 동기화시키고, 미리 동기화하기 위해서는 동기화할 자료를 줄여서 빠르게 검증자를 준비할 수 있는 stateless client를 제안한다. stateless client는 블록 헤더만을 저장하지만 [[블록헤더]] 만을 저장하기 때문에 거래에 대한 검증은 불가능하여 거래 검증을 하려면 거래를 만들 때, 검증에 필요한 witness를 첨부해야 한다.
 +
# '''자료 가용성 (Data Availability)''' : 모두가 stateless client라면 블록의 내용을 손실할 수 있기 때문에 누군가는 state를 저장하고 있도록 적절한 보상과 검증 (Proof of Custody)가 필요하다. Fisherman 딜레마는 Erasure Coding으로 해결했다.
 +
# '''검증 자간 효율적인 통신''' : 샤드 배정이 자주 바뀌는 상황에서 샤드 검증자들끼리의 효율적인 P2P 통신은 필수적이며, libs 2p의 flood sub과 gossip sub 가 사용된다.
 +
# '''샤드 간 비동기 통신''' : 거래 당사자나 스마트 계약이 여러 샤드에 나누어져 있다면 샤드 간의 통신(cross-shard communication)이 필요하지만 여러 단계를 거치게 되어 시간이 오래 걸리므로 결국 메인 체인에 무리를 주게 되고 이렇게 샤드 간 통신이 너무 자주 일어난다면 샤딩의 장점은 사라진다. 이에 이더리움은 cross link를 가지고 메인체인의 무리를 덜고, yanking으로 필요한 스마트 계약을 현재 샤드로 가져와 샤드 간의 통신을 줄이고자 현재 지연상태 전이 (delayed state transition)을 통한 샤드 간의 비동기 통신도 구상 중이라고 한다.
 +
 
 +
* '''질리카 샤딩'''
 +
: 질리카의 샤딩 기술은 [[네트워크 샤딩]](network sharding), [[트랜잭션 샤딩]](transaction sharding), [[연산 샤딩]](computational sharding)과 같은 다양한 형태로 구성되어 있고 그중 네트워크 샤딩은 질리카 채굴 네트워크를 샤드라는 작은 노드 그룹으로 나눌 수 있는 메커니즘이다. 이 네트워크 샤딩은 질리카를 확장할 수 있는 도구로서, 이 샤딩을 활용하게 되면 초당 수천 건의 트랜잭션 처리가 가능해진다. 질리카는 샤딩 기술을 통해 노드가 많아질수록 처리 속도가 더욱더 빨라진다. 질리카는 채굴 네트워크를 작은 그룹으로 나눠 병렬로 트랜잭션을 처리하기 때문에 네트워크 크기가 증가할수록 처리할 수 있는 트랜잭션 수가 선형적으로 증가하여 블록체인의 확장성 문제를 해결할 수 있으며, 테스트 넷에서 총 3,600 노드가 참가하여 1초당 2,488개의 트랜잭션을 처리했다. 질리카는 2018년 싱가포르에서 열린 밋업에서 진행된 테스트에서 1개 샤드로 481TPS, 2개 샤드로 995TPS, 4개 샤드로 1,967TPS, 그리고 6개 샤드로 2,828TPS를 달성하면서 네트워크 수 증가에 따른 트랜잭션 수의 선형적 증가 한다.
 +
 
 +
* '''로커스체인 샤딩'''
 +
: [[로커스체인]](Locus Chain)의 다이내믹 샤딩 기술(또는 동적 샤딩 기술)은 노드가 부담해야 하는 네트워크 부하를 샤드 수만큼 나누고 네트워크 전체의 트랜잭션 처리량을 샤드 수만큼 늘리면서 알고리즘으로 샤드를 재배치하여 서로간의 균형을 유지하는 기술이다. 각 샤드는 독립적으로 BFT합의알고리즘을 수행하고, 한 어카운트는 한번에 하나의 샤드에서만 처리되는 방식이기 때문에 노드의 네트워크 사용량은 줄어들고 트랜잭션 처리량은 노드 숫자가 늘어날수록 이에 비례하여 늘어난다. 또한 로커스체인은 원장 구조가 어카운트 별(AWTC: Account-wise Transaction Chain)로 되어 있어 샤드간 불균형이 일어났을 경우 계정 단위로 샤드를 재배치하여 샤드의 수와 사이즈, 밸리데이터 비율 등을 조절하는 것이 용이하다. 여기에 추가적으로 원장을 쪼개는 스테이트 샤딩을 더해 스토리지 사용량 역시 샤드 수만큼 나눌 계획이라고 한다. 로커스체인은 DAG상에서 BFT합의알고리즘을 구현<ref>여용준, <[http://www.enewstoday.co.kr/news/articleView.html?idxno=1273849 로커스체인, 세계 최초 'DAG-BFT 확정합의 알고리즘' 블록체인 기술 구현 성공]>, 《이뉴스투데이》, 2019-02-21</ref>해냈기 때문에 일반 샤딩이 가졌던 문제점을 해결했다고 주장한다.
  
 
== 종류 ==
 
== 종류 ==
* '''데이터베이스 샤딩'''(database sharding) : 하나의 거대한 [[데이터베이스]] [[테이블]]을 수평 분할(horizontal partitioning)하여 여러 개의 작은 단위로 나눈 후, 물리적으로 다른 위치에 분산하여 저장·관리하는 기술이다. 이 때 수평 분할된 1개의 작은 테이블을 샤드(shard)라고 한다.
+
* '''[[데이터베이스 샤딩]]'''(database sharding) : 하나의 거대한 [[데이터베이스]] [[테이블]]을 수평 분할(horizontal partitioning)하여 여러 개의 작은 단위로 나눈 후, 물리적으로 다른 위치에 분산하여 저장·관리하는 기술이다. 이때 수평 분할된 1개의 작은 [[테이블]]을 [[샤드]](shard)라고 한다.
* '''네트워크 샤딩'''(network sharding) : 블록체인 기반 암호화폐를 채굴하기 위한 네트워크를 샤드(shard)라는 작은 노드 그룹으로 나누어 관리하는 기술이다.
+
* '''[[네트워크 샤딩]]'''(network sharding) : 블록체인 기반 암호화폐를 채굴하기 위한 네트워크를 샤드라는 작은 [[노드]] 그룹으로 나누어 관리하는 기술이다. 네트워크 샤딩은 임의로 네트워크가 무작위로 노드를 샘플링하여 블록 단위로 샤드를 형성하지만, 네트워크가 샤드의 구성원에 대한 동의를 구하지 않아 구성원들이 원하는 방향으로 가지 않는 경우, 구성원들의 불만을 해결하지 못한다는 단점을 가지고 있다.<ref name="딩"></ref>
 +
* '''[[트랜잭션 샤딩]]''' : 트랜잭션[[해시]]의 마지막 몇 비트를 기반으로 샤드를 결정하고 트랜잭션의 유효성을 확인하지만, 사용자가 악의적인 경우, 동일한 두 입력이지만 출력이 다른 트랜잭션을 생성할 수 있고, 이중 지출을 방지하기 위해 유효기간이 진행되는 동안에 샤딩이 된 조각의 노드들은 서로 간에 통신이 필요하다.<ref name="딩"></ref>
 +
* '''[[스테이트 샤딩]]''' : 계정 기반 모델(account-based model)로, 상태가 지정된 블록체인에서 이 특정 샤드는 상태의 일부만을 유지하지만, 교차분할 트랜잭션을 수행하지 못하도록 제한되고, 시스템의 상태가 모든 샤드에 복제되어 있지 않기 때문에 네트워크는 더 오프라인 샤드에 대한 트랜잭션의 요 효성을 검사하지 못하게 되는데 오프라인 샤드를 유지하기 위해 백업 노드를 갖게 된다면 중앙집중식이 되어 보안성에 위협되어 네트워크가 한 번씩 재편성될 때 한 번에 네트워크를 전환하게 되면 일부 동기화가 완료될 때까지 전체 시스템을 사용할 수 없게 된다.<ref name="딩"></ref>
  
 
== 활용 ==
 
== 활용 ==
싱가포르의 [[신슈 동]]이 개발한 암호화폐인 [[질리카]](Zilliqa)는 샤딩 기술을 활용함으로써 트랜잭션 처리 속도를 획기적으로 향상시켰다. 질리카의 샤딩 기술은 네트워크 샤딩(network sharding), 트랜잭션 샤딩(transaction sharding), 연산 샤딩(computational sharding)과 같은 다양한 형태로 구성되어 있다. 그 중 가장 중요한 건 네트워크 샤딩인데, 네트워크 샤딩은 질리카 채굴 네트워크를 샤드(shard)라는 작은 노드 그룹으로 나눌 수 있는 메커니즘이다. 이 네트워크 샤딩은 질리카를 확장시킬 수 있는 도구로서, 이 샤딩을 활용하게 되면 초당 수천 건의 트랜잭션 처리가 가능해진다.
+
* 싱가포르의 [[신슈 동]] 이 개발한 암호화폐인 [[질리카]](Zilliqa)는 샤딩 기술을 활용함으로써 트랜잭션 처리 속도를 획기적으로 향상했다. 질리카의 샤딩 기술은 네트워크 샤딩(network sharding), 트랜잭션 샤딩(transaction sharding), 연산 샤딩(computational sharding)과 같은 다양한 형태로 구성되어 있다. 그중 가장 중요한 건 네트워크 샤딩인데, 네트워크 샤딩은 질리카 채굴 네트워크를 샤드(shard)라는 작은 노드 그룹으로 나눌 수 있는 메커니즘이다. 이 네트워크 샤딩은 질리카를 확장할 수 있는 도구로서, 이 샤딩을 활용하게 되면 초당 수천 건의 트랜잭션 처리가 가능해진다.
 +
* 샤딩은 블록체인 확장성에 대한 하나의 해결책으로 네트워크가 블록의 유효성을 검증하는 방식을 바꿈으로써 처리량의 증대를 가져오는데 모든 온체인(on-chain) 확장성 솔루션 가운데 샤딩을 특별하게 만드는 핵심적인 특징은 병렬식 확장성(horizontal scaling)이다. 예를 들어, 채굴 네트워크가 확장할수록 처리량이 증가하면, 샤딩의 이 독특한 특성은 블록체인의 빠른 채택을 촉진하는 이상적인 촉매 재가 될 수 있다.<ref name="블"></ref>
 +
 
 +
==사례==
 +
[[파일:이더리움 샤딩.PNG|썸네일|400픽셀|'''이더리움 샤딩'''(비탈릭 부테린 트위터)]]
 +
* 비탈리크 부테린은 이더리움의 확장성을 보안 활동하기 위해 샤딩을 도입하겠다고 밝혔다. 샤딩이 도입되면 각 샤드가 계정별로 트랜잭션을 나눠 처리하고 승인하고 블록체인 네트워크 참여자의 모든 주소를 일정한 개수로 잘라 각 덩어리를 하나의 연방으로 구성하는 방식이며, 이더리움의 경우에는 전체 계좌에서 0x00부터 시작되는 계정들은 1번 샤드에서 관리하고 0x01부터 시작하는 계정은 2번 샤드에서 관리하는 식으로 샤드 1에 속하는 요청자가 트랜잭션을 발생시키면 해당 트랜잭션은 샤드 1의 오퍼레이션 노드로 전파되고 블록 제한자, 실행자, 검증자의 검증을 거치고 이상이 없다면 샤드 1에 들어 있는 EVM이 컨트랙트의 코드를 실행시키고 스테이트 변경함수를 통해 기존 스테이트는 새로운 값으로 변경된다.<ref>강민승 기자, 〈[http://a.to/19hgp7H 블록체인 성능 향상에 필수 '샤딩'…"쪼개라, 빨라질 것이니"]〉,《매일경제》, 2018-12-21 </ref>
 +
* [[아이비즈소프트웨어]] 는 2006년부터 기업용 소프트웨어를 개발 및 공급하며 금융, 유통업계 등에서 대형 프로젝트를 성공적으로 수행해온 아이비즈소프트웨어가 지난 4일 기업용 블록체인 솔루션 '베리드 엔터프라이즈 에디션'을 출시했다. 샤딩 기술을 적용한 베리드 엔터프라이즈 에디션을 도입할 수 있는 대표적 사례로써 통합인증(Single Sign On, '[[SSO]]') 서비스는 블록체인 기반 SSO는 한 번의 로그인으로 다양한 앱에 동시 접속을 가능하게 하여 ID, 패스워드에 대한 보안 강화와 고객 및 직원들에게 더욱 나은 사용자 환경을 제공해 왔고 베리드 엔터프라이즈 에디션으로 SSO 서비스에서 요구하는 10,000TPS 이상의 처리속도를 제공하는 블록체인 기반 SSO 서비스를 제공, 손쉬운 비즈니스 도입을 위해 하이퍼레저의 환경구성과 기업 시스템과의 연동을 위한 SSO API 서버 구축, 성능 측정 결과 리포트 등의 기능을 제공한다.<ref>장윤영 기자, 〈[http://www.etnews.com/20190626000061 샤딩 적용한 더 빠르고 향상된 기업용 블록체인 '베리드 엔터프라이즈 에디션']〉,《전자신문》, 2019-06-26 </ref>
  
 
{{각주}}
 
{{각주}}
  
 
== 참고자료 ==
 
== 참고자료 ==
* "[https://en.wikipedia.org/wiki/Shard_(database_architecture) Shard (database architecture)]", ''Wikipedia''
 
 
* sobly tv, 〈[https://medium.com/@sobly/샤딩이란-쉽게-이해해보자-7732bcbe0bb8 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03
 
* sobly tv, 〈[https://medium.com/@sobly/샤딩이란-쉽게-이해해보자-7732bcbe0bb8 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03
 
* 고란 기자, 〈[https://news.joins.com/article/23048186 성공한 플랫폼은 보이지 않는다]〉, 《중앙일보》, 2018-10-17
 
* 고란 기자, 〈[https://news.joins.com/article/23048186 성공한 플랫폼은 보이지 않는다]〉, 《중앙일보》, 2018-10-17
 +
* 〈[https://en.wikipedia.org/wiki/Shard_(database_architecture) Shard (database architecture)]〉, 《위키백과》
 +
* 핵심만 콕콕! 암호화폐 분석, 〈[https://cryptochain.tistory.com/38 이더리움의 샤딩(Sharding) 기술은 무엇인가? 이더리움의 진화]〉, 《블록센스》, 2018-06-30
 +
* 오세진, 〈[http://a.to/19wGuV4 블록체인 확장성 솔루션 시리즈 4–1 :: Sharding 샤딩]〉, 《medium》, 2018-06-08
 +
* sobly tv, 〈[http://a.to/19MoDVp 샤딩이란? 쉽게 이해해보자]〉,《medium》, 2018-09-03
 +
* hanburn, 〈[https://genesis8.tistory.com/211 샤딩(sharding)이란?]〉,《티스토리》, 2012-01-17
 +
* 김새벽의 코인, 〈[https://blog.naver.com/asteria89/221293863186 이더리움의 샤딩이란 무엇일까?]〉,《네이버》, 2018-06-07
  
 
== 같이 보기 ==
 
== 같이 보기 ==
 
* [[질리카]]
 
* [[질리카]]
 +
* [[로커스체인]]
  
{{토막글|블록체인}}
+
{{블록체인 기술|검토 필요}}
 
 
[[분류:블록체인]]
 

2020년 9월 15일 (화) 00:38 기준 최신판

샤딩(sharding)

샤딩(sharding)이란 하나의 거대한 데이터베이스네트워크 시스템을 여러 개의 작은 조각으로 나누어 분산 저장하여 관리하는 것을 말한다. 이는 단일의 데이터를 다수의 데이터베이스로 쪼개어 나누는 걸 말하는데, 단일의 데이터베이스에서 저장하기 너무 클 때 사용하여 데이터를 구간별로 쪼개어 나눔으로써 노드에 무겁게 가지고 있던 데이터를 빠르게 검증할 수 있어 빠른 트랜잭션 속도를 향상시킬 수 있다. 샤딩을 통해 나누어진 블록들의 구간(epoch)을 샤드(shard)라고 부른다.[1]

개요[편집]

샤딩은 "조각내다"라는 뜻으로 데이터베이스 저장기법 중 하나이며, 전체 네트워크를 분할한 뒤 트랜잭션을 영역별로 저장하고 이를 병렬적으로 처리하여 블록체인에 확장성을 부여하는 온체인 솔루션으로 데이터를 샤드라는 단위로 나눠서 저장 및 처리한다. 샤딩 개념의 근원은 데이터베이스 샤딩에 있고, 데이터베이스 샤딩이란 대용량의 데이터를 처리하기 위해 테이블을 수평 분할하여 데이터를 분산 저장하고 처리하는 것이다.[2] 만약 10만큼의 데이터와 10명의 노드가 참여했다고 가정한다면 기존의 블록체인은 10명의 노드 개개인은 10만큼을 모두 가지고 있으면서 공유하지만, 샤딩은 10을 조각내서 10명의 노드 개개인은 1만큼씩만 보관함으로써 보관 데이터가 가벼워져 거래처리 속도가 크게 향상된다.[3]

등장배경[편집]

샤딩은 블록체인 시스템의 확장성(scalability) 문제를 해결하기 위한 방법의 하나이다. 확장성은 시간이 지남에 따라 생겨나는 변화를 받아들이는 능력이다.[4] 시간이 지남에 따라 블록체인 기반 서비스는 대체로 사용자 수가 증가하기 때문에, 확장성 문제란 결국 더 많은 사용자가 만들어내는 트랜잭션을 블록체인 시스템으로 처리할 수 있는 능력의 문제이다. 대개 블록체인의 확장성 지표로 TPS 를 사용한다. TPS는 Transaction per Second의 약자로서 1초당 처리할 수 있는 트랜잭션의 개수를 나타내는 단위이다. 기존비트코인이더리움 의 경우 확장성 문제가 심각하여, TPS를 획기적으로 증가시키기 위한 다양한 방법이 고안되고 있는데, 그 중 대표적인 것이 샤딩이다. 샤딩은 플라즈마, 라이덴 네트워크 등과 마찬가지로 확장성 문제를 해결하기 위해 제안된 솔루션이고, 플라즈마, 라이덴 네트워크는 오프체인 솔루션이지만 샤딩은 On-chain 솔루션이며, On-chain 솔루션이란 메인체인 자체의 프로토콜 을 변경시켜서 메인체인의 성능을 향상하는 방법을 말한다. On-chain 솔루션을 적용하기 위해서는 메인 네트워크의 하드 포크 가 필수적으로 Off-chain 솔루션이 메인체인 바깥에 다른 시스템을 추가하여 해결하기 때문에 하드 포크가 필요 없는 것과 대비 되는데 확장성 문제 솔루션 중 하나로, 이더리움이 POS (Proof of Stake) 합의 알고리즘으로 전환할 것을 기반으로 설계되었다.[2]

특징[편집]

샤딩은 관계형 데이터베이스에서 대량의 데이터를 처리하기 위해서 데이터를 파티셔닝 하는 기술로 파티셔닝은 DBMS 에서 지원하기도 하는데, 일부 DBMS에서는 지원하지 않으며, DBMS 레벨에서 데이터를 나누는 것이 아니고 데이터베이스 자체를 분할하는 방식으로 애플리케이션 레벨에서 구현해야 한다. 데이터베이스가 여러 파편으로 분할되고 서로 다른 서버에 저장되는 전통적인 데이터베이스 샤딩 개념에서 영감을 받은 확장성 기술이 샤딩으로 공개형 블록체인의 맥락에서, 네트워크에 올려진 트랜잭션은 네트워크상의 서로 다른 노드들로 이루어진 여러 샤드(shards)로 분할되어 각각의 노드는 들어오는 트랜잭션들의 일부만을 처리할 수 있게 되고, 네트워크상에서 병렬식으로 다른 노드들에서도 똑같이 실행되기에 네트워크를 여러 샤드로 쪼개면 동시에 더 많은 트랜잭션을 처리하고 증명할 수 있어 네트워크가 커질수록 점점 더 많은 트랜잭션 처리가 가능하게 되는 속성을 병렬식 확장(horizontal scaling)이라고 도 불린다.[5] 샤딩은 단일의 데이터베이스에서 저장하기 너무 클 때 사용되고 이렇게 데이터를 구간별로 쪼개어 나눔으로써 노드에 무겁게 가지고 있던 데이터를 빠르게 검증할 수 있어 빠른 트랜잭션 속도를 가질 수 있으며, 샤드란 샤딩을 통해 나누어진 블록들의 구간을 '샤드'라고 부른다.

  • 수평 분할(Horizontal Partitioning)
스키마(schema)가 같은 데이터를 두 개 이상의 테이블에 나누어 저장하는 디자인을 말하고, 가령 같은 주민 데이터를 처리하기 위해 스키마가 같은 '서현동 주민 테이블'과 '정자동 주민 테이블'을 사용을 뜻하며, 인덱스의 크기를 줄이고, 작업 동시성을 늘리기 위한 것이지만 보통 수평 분할을 한다고 했을 때는 하나의 데이터베이스 안에서 이루어지는 경우를 지칭한다.[6]
  • 샤딩의 장점
  1. 필요한 데이터만 빠르게 조회할 수 있기 때문에 쿼리 자체가 가볍다.
  2. 오래돼서 조회가 안 되는 데이터를 클라우드에 올리거나 별도의 디스크에 저장해서 운영상의 스토리지 이득을 볼 수 있다.
  • 샤딩의 문제점
블록체인 시스템의 확장성 문제를 해결하기 위해 등장한 기술이지만 샤딩을 적용할 경우 한 샤드 내에서의 전송이 아닌 여러 샤드 간의 전송은 절차가 훨씬 복잡하고 느려진다. 여러 샤드로 쪼갤수록 인터샤드 트랜잭션은 확률적으로 많아지는데 각 샤드는 자기 샤드의 데이터만 있고, 다른 샤드의 데이터는 가지고 있지 않으므로 샤드간 데이터를 어떻게 참조할 것인지, 어떻게 검증할 것인지 문제가 생겨서 알고리즘이 복잡해진다. 만약 이 단계에서 거래결과가 뒤집어지면 (비확정적합의) 상황은 더욱 복잡해지기 때문에 확정합의가 거의 필수이다.
또한 샤딩이 들어가게 되면 전체의 안정성은 보장이 된다고 하더라도 시간이 지나면 샤드간 불균형이 일어나 일부 샤드의 안정성이 취약해지는 문제가 발생할 수 있다. 샤드마다 트랜잭션의 빈도, 노드의 수, 밸리데이터의 비율 등에서 차이가 나기 때문에 한 번 샤드가 정해진 다음에도 샤드의 구성원을 재배치하여 샤드간 균형을 맞추는 알고리즘이 필요하다. 뿐만 아니라 예상했던 것보다 전체 트래픽이 높아질 경우, 처음 설정해둔 샤드의 수를 늘릴 필요가 있다. 한 번 쓰여진 데이터를 해쉬나 서명으로 묶어 위변조나 조작을 하지 못하도록 만들어진 분산원장구조에서는 샤드를 중간에 추가하는 등의 동적 샤딩 기술을 구현하기가 매우 어렵다.
확장성의 문제를 해결방책으로 나온 샤딩에 중앙화의 문제와 보안성의 문제를 가지게 되는데 보안의 문제에는 1% attack의 문제가 생길 수 있고, 100개의 샤드의 시스템에서는 오직 1%의 hash rate로 샤드를 지배할 수 있어 샤드 간의 커뮤니케이션이 너무 빈번하게 일어난다면, 커뮤니케이션으로 인한 시간 지연의 문제가 생기게 된다.[1] 데이터 재분배(Rebalancing data)로는 Sharding된 DB 의 물리적인 용량 한계나 성능 한계에 따르면 샤드의 수를 늘리는 scale-up 작업이 필요하며 서비스 정지 없이 scale-up 할 수 있도록 설계 방향을 잡아야 하며, Global Transaction을 사용하면 샤드 DB 간의 트랜잭션도 가능하여 XA 임에도 성능 저하의 문제가 있다.[7]
  • 확장성과 샤딩에 대해
블록체인에서의 문제점은 크게 탈중앙화, 보안성, 확장성의 문제로 이 세 가지 문제 중 어떠한 두 가지는 만족시킬 수 있지만, 남은 한 가지는 만족시킬 수 없는 트릴레마 의 문제를 가지게 되고, 이 중에서 그동안 가장 블록체인 기술에서 문제 되었던 부분은 확장성의 문제는 상용화를 위해서는 기존의 서비스와 같이 불편함이 없어야 하기에 TPS가 빨라야 하지만, 정보를 처리하는데 사용자들이 오랜 시간 기다리지 않고 사용할 수 있으며, TPS 의 비교를 통해 얼마나 짧은 시간 안에 많은 정보를 처리할 수 있느냐를 직관적으로 확인할 수 있기 때문에 사람들은 수많은 블록체인 프로젝트를 비교할 때 대표적으로 TPS를 비교하여 샤딩은 확장성의 문제를 해결해주는 한 가지의 방법으로써 노드들을 좀 더 빠르게 검증할 수 있어 빠른 트랜잭션을 통하여 좀 더 높은 TPS를 가질 수 있다.[8]
  • 데이터베이스를 나누는 방법
  1. Vertical Partitioning : 테이블별로 서버를 나누는 방식으로 구현이 간단하고, 전체 시스템에 큰 변화가 필요 없다는 장점이 있고 단점으로는 각 서버의 데이터가 점점 거대해지면 추가 샤딩이 필요하다.
  2. Range Based Partitionging : 하나의 feature가 점점 거대해지는 경우 서버를 분리하는 방식이며, 유저 별로 서버를 분리하거나, 일정 데이터라면 년도 별로 분리, 거래정보라면 우편번호를 이용하고 주의 사항으론 데이터를 나누는 방법이 예측 가능 해야 한다.
  3. Key or Hash Based Partitioning : 엔티티를 해쉬함수에 넣어서 나오는 값을 이용해서 서버를 정하는 방식으로 해쉬결과 데이터가 균등하게 분포되도록 해쉬 함수를 정하는 게 중요하며, 서버의 수를 늘리기 위해 해쉬함수를 변경하는 작업이 정말 비싼 작업이라는 단점이 있다.
  4. Directory Based Partitioning : 파티셔닝 메커니즘을 제공하는 추상화된 서비스를 만드는 것으로 샤드 키를 look-up 할 수 있으면 되므로, 구현은 DB와 CACM을 적절히 조합해서 만든다.
  • 샤딩 체인 동작 방식
  1. proposer가 되고 싶은 네트워크 참여자는 SMC 를 통해 balance 를 예치한다.
  2. collator가 되고 싶은 네트워크 참여자는 SMC를 통해 deposit 을 예치한다.
  3. Collator들은 주기적으로 SMC status를 확인해서, 자신이 collator에 선정되었는지 여부를 확인한다.
  4. Collator들은 SMC에 의해 각 샤드 체인에 pseudo-random 하게 배정되고, look ahead period 동안에 해당 샤드의 이전 기록들을 다운받으면 선택된 proposal을 제안한 proposer로부터 proposal bid를 받는다.
  5. Proposer는 트랜잭션을 담은 proposal을 collator에게 제출하는데, proposal은 아직 검증되지 않은 collation을 의미하며, 선택된 proposal을 제출한 proposer는 트랜잭션 발송자로부터 트랜잭션 fee를 받는다.
  6. Collator들은 해당 proposal에 속한 트랜잭션들이 valid 한지를 검증하는 투표를 한다.
  7. 표에서 2/3 이상의 collator들이 proposal에 포함된 트랜잭션이 valid 하다고 찬성할 경우, 해당 proposal은 유효한 collation이 된다.
  • 주요 용어
  1. Collation : 샤드 체인에서 메인 체인의 블록과 같은 역할을 하며, 크게 collation header와 트랜잭션 목록으로 구성된다.
  2. Collation header : collation을 구성하는 정보를 담고 있으며, proposer의 sign을 거쳐 메인 체인에 제출하고, 트랜잭션 목록은 collation에 담긴 트랜잭션들의 목록이다.
  3. Proposer : 제안자라는 뜻으로 트랜잭션들을 모아 proposal을 만들고 collator에게 제출하며, Proposal은 검증되지 않은 collation이다.
  4. Collator : Proposer가 제출한 proposal을 검증한다. period마다 한 샤드에는 여러 collator들이 배정되는데 이들은 해당 period에 진입하기 일정 기간 이전에 무작위로 선정된다.
  5. Executor : Collation header를 메인체인의 SMC (Sharding Manager Contract)에 전달하고, 샤드 체인의 실제 state가 변경된다. (Executor는 샤딩 phase 3에 등장)
  6. Period : 메인 체인에서 샤드 체인의 collation header를 제출받는 주기이며, 단위는 메인 체인에서의 블록의 개수로 PERIOD_LENGTH = 5라면 5개의 블록이 생성되는 것이 1 period이다.
  7. Look ahead period : Collator는 샤드 체인에서 collation을 검증하기 이전에 SMC에 의해 pseudo-random 하게 배정되는데, 'look ahead period'는 collator가 몇 period에 앞서서 어떤 샤드 체인에 배정되는지를 나타내고, LOOKAHEAD_PERIODS = 4이면 4 period 이전에 collator는 샤드 체인에 배정되므로 Collator는 사전에 자신이 배정된 샤드 체인의 state 정보를 다운받는 시간을 확보할 수 있다.
  8. Sharking Manager Contract (SMC) : SMC는 샤드 체인에서 가장 중요한 역할을 하는 스마트 컨트랙트 로 SMC는 메인 체인과 샤드 체인을 연결하며, collator, proposer, collation tree를 관리하며, 샤드 체인이 메인체인에 참여하기 위해서는 SMC의 역할이 필수적이다.
이더리움에 샤딩 적용
  • 이더리움 샤딩
비탈릭 부테린 은 이더리움 창시자이며, 이더리움 샤딩은 메인 체인이 처리해야 할 블록들을 조각내어 샤드(Shard)라고 불리는 오프 체인(off-chain)에 할당하는데 오프 체인들은 주어진 조각에 대해서만 유효성을 검증하게 되고, 샤드들이 각자 할당된 조각들의 검증을 모두 끝내면 다시 묶어 이러한 개념을 통해 블록을 검증하는 데 걸리는 시간을 단축하며, 이더리움의 블록 생성 속도는 13초 이상 걸리고 있지만, 샤딩이 도입된다면 약 2초에서 8초 사이에 생성될 것이다.[9] 샤드별로 Merkel Patricia tree를 만들고 그 샤드의 root들로 만들어진 Merkel Patricia tree의 root만을 블록체인에 올리는 것으로 모든 miner가 모든 트랜잭션을 실행할 필요 없이 샤드별로 miner를 분산 시켜 실행할 수 있기 때문에 전체 실행 속도가 올라간다. 이더리움 2.0으로 통하는 차세대 이더리움 블록체인을 기술적으로 상징하는 특징은 캐스퍼 로 대표되는 새로운 합의 메커니즘과 샤딩을 이더리움 창시자 비탈리크 부테린이 직접 나서 차세대 이더리움을 이끌 원투펀치로 캐스퍼와 샤딩을 적극 프로모션하고 있다.[10]
  • 이더리움 샤딩의 문제점
  1. 난수 생성 : 난수를 사용하여 검증자를 샤드에 배정하는데, 공격자가 난수를 예측하거나 조작할 수 있어, 샤딩 보안에 문제가 생긴다.
  2. 빠른 샤드 전환 : 샤드에 대한 공격 성공 가능성을 줄이려면 검증자를 빠르게 전환해야 하는데 이전부터 look ahead time을 두어 검증자가 자신이 맡을 샤드블록를 미리 동기화시키고, 미리 동기화하기 위해서는 동기화할 자료를 줄여서 빠르게 검증자를 준비할 수 있는 stateless client를 제안한다. stateless client는 블록 헤더만을 저장하지만 블록헤더 만을 저장하기 때문에 거래에 대한 검증은 불가능하여 거래 검증을 하려면 거래를 만들 때, 검증에 필요한 witness를 첨부해야 한다.
  3. 자료 가용성 (Data Availability) : 모두가 stateless client라면 블록의 내용을 손실할 수 있기 때문에 누군가는 state를 저장하고 있도록 적절한 보상과 검증 (Proof of Custody)가 필요하다. Fisherman 딜레마는 Erasure Coding으로 해결했다.
  4. 검증 자간 효율적인 통신 : 샤드 배정이 자주 바뀌는 상황에서 샤드 검증자들끼리의 효율적인 P2P 통신은 필수적이며, libs 2p의 flood sub과 gossip sub 가 사용된다.
  5. 샤드 간 비동기 통신 : 거래 당사자나 스마트 계약이 여러 샤드에 나누어져 있다면 샤드 간의 통신(cross-shard communication)이 필요하지만 여러 단계를 거치게 되어 시간이 오래 걸리므로 결국 메인 체인에 무리를 주게 되고 이렇게 샤드 간 통신이 너무 자주 일어난다면 샤딩의 장점은 사라진다. 이에 이더리움은 cross link를 가지고 메인체인의 무리를 덜고, yanking으로 필요한 스마트 계약을 현재 샤드로 가져와 샤드 간의 통신을 줄이고자 현재 지연상태 전이 (delayed state transition)을 통한 샤드 간의 비동기 통신도 구상 중이라고 한다.
  • 질리카 샤딩
질리카의 샤딩 기술은 네트워크 샤딩(network sharding), 트랜잭션 샤딩(transaction sharding), 연산 샤딩(computational sharding)과 같은 다양한 형태로 구성되어 있고 그중 네트워크 샤딩은 질리카 채굴 네트워크를 샤드라는 작은 노드 그룹으로 나눌 수 있는 메커니즘이다. 이 네트워크 샤딩은 질리카를 확장할 수 있는 도구로서, 이 샤딩을 활용하게 되면 초당 수천 건의 트랜잭션 처리가 가능해진다. 질리카는 샤딩 기술을 통해 노드가 많아질수록 처리 속도가 더욱더 빨라진다. 질리카는 채굴 네트워크를 작은 그룹으로 나눠 병렬로 트랜잭션을 처리하기 때문에 네트워크 크기가 증가할수록 처리할 수 있는 트랜잭션 수가 선형적으로 증가하여 블록체인의 확장성 문제를 해결할 수 있으며, 테스트 넷에서 총 3,600 노드가 참가하여 1초당 2,488개의 트랜잭션을 처리했다. 질리카는 2018년 싱가포르에서 열린 밋업에서 진행된 테스트에서 1개 샤드로 481TPS, 2개 샤드로 995TPS, 4개 샤드로 1,967TPS, 그리고 6개 샤드로 2,828TPS를 달성하면서 네트워크 수 증가에 따른 트랜잭션 수의 선형적 증가 한다.
  • 로커스체인 샤딩
로커스체인(Locus Chain)의 다이내믹 샤딩 기술(또는 동적 샤딩 기술)은 노드가 부담해야 하는 네트워크 부하를 샤드 수만큼 나누고 네트워크 전체의 트랜잭션 처리량을 샤드 수만큼 늘리면서 알고리즘으로 샤드를 재배치하여 서로간의 균형을 유지하는 기술이다. 각 샤드는 독립적으로 BFT합의알고리즘을 수행하고, 한 어카운트는 한번에 하나의 샤드에서만 처리되는 방식이기 때문에 노드의 네트워크 사용량은 줄어들고 트랜잭션 처리량은 노드 숫자가 늘어날수록 이에 비례하여 늘어난다. 또한 로커스체인은 원장 구조가 어카운트 별(AWTC: Account-wise Transaction Chain)로 되어 있어 샤드간 불균형이 일어났을 경우 계정 단위로 샤드를 재배치하여 샤드의 수와 사이즈, 밸리데이터 비율 등을 조절하는 것이 용이하다. 여기에 추가적으로 원장을 쪼개는 스테이트 샤딩을 더해 스토리지 사용량 역시 샤드 수만큼 나눌 계획이라고 한다. 로커스체인은 DAG상에서 BFT합의알고리즘을 구현[11]해냈기 때문에 일반 샤딩이 가졌던 문제점을 해결했다고 주장한다.

종류[편집]

  • 데이터베이스 샤딩(database sharding) : 하나의 거대한 데이터베이스 테이블을 수평 분할(horizontal partitioning)하여 여러 개의 작은 단위로 나눈 후, 물리적으로 다른 위치에 분산하여 저장·관리하는 기술이다. 이때 수평 분할된 1개의 작은 테이블샤드(shard)라고 한다.
  • 네트워크 샤딩(network sharding) : 블록체인 기반 암호화폐를 채굴하기 위한 네트워크를 샤드라는 작은 노드 그룹으로 나누어 관리하는 기술이다. 네트워크 샤딩은 임의로 네트워크가 무작위로 노드를 샘플링하여 블록 단위로 샤드를 형성하지만, 네트워크가 샤드의 구성원에 대한 동의를 구하지 않아 구성원들이 원하는 방향으로 가지 않는 경우, 구성원들의 불만을 해결하지 못한다는 단점을 가지고 있다.[1]
  • 트랜잭션 샤딩 : 트랜잭션해시의 마지막 몇 비트를 기반으로 샤드를 결정하고 트랜잭션의 유효성을 확인하지만, 사용자가 악의적인 경우, 동일한 두 입력이지만 출력이 다른 트랜잭션을 생성할 수 있고, 이중 지출을 방지하기 위해 유효기간이 진행되는 동안에 샤딩이 된 조각의 노드들은 서로 간에 통신이 필요하다.[1]
  • 스테이트 샤딩 : 계정 기반 모델(account-based model)로, 상태가 지정된 블록체인에서 이 특정 샤드는 상태의 일부만을 유지하지만, 교차분할 트랜잭션을 수행하지 못하도록 제한되고, 시스템의 상태가 모든 샤드에 복제되어 있지 않기 때문에 네트워크는 더 오프라인 샤드에 대한 트랜잭션의 요 효성을 검사하지 못하게 되는데 오프라인 샤드를 유지하기 위해 백업 노드를 갖게 된다면 중앙집중식이 되어 보안성에 위협되어 네트워크가 한 번씩 재편성될 때 한 번에 네트워크를 전환하게 되면 일부 동기화가 완료될 때까지 전체 시스템을 사용할 수 없게 된다.[1]

활용[편집]

  • 싱가포르의 신슈 동 이 개발한 암호화폐인 질리카(Zilliqa)는 샤딩 기술을 활용함으로써 트랜잭션 처리 속도를 획기적으로 향상했다. 질리카의 샤딩 기술은 네트워크 샤딩(network sharding), 트랜잭션 샤딩(transaction sharding), 연산 샤딩(computational sharding)과 같은 다양한 형태로 구성되어 있다. 그중 가장 중요한 건 네트워크 샤딩인데, 네트워크 샤딩은 질리카 채굴 네트워크를 샤드(shard)라는 작은 노드 그룹으로 나눌 수 있는 메커니즘이다. 이 네트워크 샤딩은 질리카를 확장할 수 있는 도구로서, 이 샤딩을 활용하게 되면 초당 수천 건의 트랜잭션 처리가 가능해진다.
  • 샤딩은 블록체인 확장성에 대한 하나의 해결책으로 네트워크가 블록의 유효성을 검증하는 방식을 바꿈으로써 처리량의 증대를 가져오는데 모든 온체인(on-chain) 확장성 솔루션 가운데 샤딩을 특별하게 만드는 핵심적인 특징은 병렬식 확장성(horizontal scaling)이다. 예를 들어, 채굴 네트워크가 확장할수록 처리량이 증가하면, 샤딩의 이 독특한 특성은 블록체인의 빠른 채택을 촉진하는 이상적인 촉매 재가 될 수 있다.[5]

사례[편집]

이더리움 샤딩(비탈릭 부테린 트위터)
  • 비탈리크 부테린은 이더리움의 확장성을 보안 활동하기 위해 샤딩을 도입하겠다고 밝혔다. 샤딩이 도입되면 각 샤드가 계정별로 트랜잭션을 나눠 처리하고 승인하고 블록체인 네트워크 참여자의 모든 주소를 일정한 개수로 잘라 각 덩어리를 하나의 연방으로 구성하는 방식이며, 이더리움의 경우에는 전체 계좌에서 0x00부터 시작되는 계정들은 1번 샤드에서 관리하고 0x01부터 시작하는 계정은 2번 샤드에서 관리하는 식으로 샤드 1에 속하는 요청자가 트랜잭션을 발생시키면 해당 트랜잭션은 샤드 1의 오퍼레이션 노드로 전파되고 블록 제한자, 실행자, 검증자의 검증을 거치고 이상이 없다면 샤드 1에 들어 있는 EVM이 컨트랙트의 코드를 실행시키고 스테이트 변경함수를 통해 기존 스테이트는 새로운 값으로 변경된다.[12]
  • 아이비즈소프트웨어 는 2006년부터 기업용 소프트웨어를 개발 및 공급하며 금융, 유통업계 등에서 대형 프로젝트를 성공적으로 수행해온 아이비즈소프트웨어가 지난 4일 기업용 블록체인 솔루션 '베리드 엔터프라이즈 에디션'을 출시했다. 샤딩 기술을 적용한 베리드 엔터프라이즈 에디션을 도입할 수 있는 대표적 사례로써 통합인증(Single Sign On, 'SSO') 서비스는 블록체인 기반 SSO는 한 번의 로그인으로 다양한 앱에 동시 접속을 가능하게 하여 ID, 패스워드에 대한 보안 강화와 고객 및 직원들에게 더욱 나은 사용자 환경을 제공해 왔고 베리드 엔터프라이즈 에디션으로 SSO 서비스에서 요구하는 10,000TPS 이상의 처리속도를 제공하는 블록체인 기반 SSO 서비스를 제공, 손쉬운 비즈니스 도입을 위해 하이퍼레저의 환경구성과 기업 시스템과의 연동을 위한 SSO API 서버 구축, 성능 측정 결과 리포트 등의 기능을 제공한다.[13]

각주[편집]

  1. 1.0 1.1 1.2 1.3 1.4 sobly tv, 〈샤딩이란? 쉽게 이해해보자〉, 《미디엄》, 2018-09-03
  2. 2.0 2.1 오세진, 〈블록체인 확장성 솔루션 시리즈 4–1 :: Sharding 샤딩〉, 《미디엄》, 2018-06-08
  3. ICO of KOREA, 〈샤딩(sharding) 이란? / 이더리움 샤딩, 질리카 샤딩〉,《네이버 블로그》, 2018-06-11
  4. 고란 기자, 〈성공한 플랫폼은 보이지 않는다〉, 《중앙일보》, 2018-10-17
  5. 5.0 5.1 phuzion7, 〈블록체인 샤딩의 3가지 형태: BlockChain Sharding〉,《데일리 코인뉴스》, 2018-12-31
  6. 전원희, 〈NHN의 안과 밖: Sharding Platform〉,《네이버D2》, 2012-02-17
  7. hanburn, 〈샤딩(sharding)이란?〉,《티스토리》, 2012-01-17
  8. sobly tv, 〈샤딩이란? 쉽게 이해해보자〉, 《미디엄》, 2018-09-03
  9. KMK, 〈샤딩(Sharding)이란? 이더리움의 확장성 문제, 질리카의 기술〉,《네이버》, 2018-07-17
  10. 황치규 기자, 〈캐스퍼와 샤딩 무장한 '이더리움 2.0' 시대 열린다〉,《더비체인》, 2018-08-27
  11. 여용준, <로커스체인, 세계 최초 'DAG-BFT 확정합의 알고리즘' 블록체인 기술 구현 성공>, 《이뉴스투데이》, 2019-02-21
  12. 강민승 기자, 〈블록체인 성능 향상에 필수 '샤딩'…"쪼개라, 빨라질 것이니"〉,《매일경제》, 2018-12-21
  13. 장윤영 기자, 〈샤딩 적용한 더 빠르고 향상된 기업용 블록체인 '베리드 엔터프라이즈 에디션'〉,《전자신문》, 2019-06-26

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 샤딩 문서는 블록체인 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.