검수요청.png검수요청.png

"스테이트 샤딩"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
(활용)
잔글 (같이보기)
 
(사용자 2명의 중간 판 18개는 보이지 않습니다)
1번째 줄: 1번째 줄:
'''스테이트 샤딩'''<!--스테이트샤딩, 스태이트 샤딩, 스태이트샤딩-->(state sharding)은 상태가 지정된 상황에서, 특정 노드가 특정 상태값만 저장하고 있는 [[샤딩]] 기술을 말한다. '''상태 샤딩'''<!--상태샤딩-->이라고도 한다.
+
'''스테이트 샤딩'''<!--스테이트샤딩, 스태이트 샤딩, 스태이트샤딩-->(state sharding)은 상태가 지정된 상황에서, 특정 [[노드]]가 특정 상태값만 저장하고 있는 [[샤딩]] 기술을 말한다. '''상태 샤딩'''<!--상태샤딩-->이라고도 한다.
  
 
== 개요 ==
 
== 개요 ==
스테이트 샤딩은 계정 기반 모델(account-based model)이다. 스테이트 샤딩은 상태가 지정된 블록체인에서 이 특정 샤드는 상태의 일부만을 유지하지만, 교차분할 트랜잭션을 수행하지 못하도록 제한되고 있다. 스테이트 샤딩은 시스템의 상태가 모든 [[샤드]]에 복제되어 있지 않기 때문에 네트워크는 더 오프라인 샤드에 대한 트랜잭션의 유효성을 검사하지 못하게 된다. 만약 오프라인 샤드를 유지하기 위해 백업 노드를 갖게 된다면 중앙집중식이 되어 보안성에 위협이 될 수 있다. 네트워크가 한 번씩 재편성될 때 한 번에 네트워크를 전환하게 되면 일부 동기화가 완료될 때까지 전체 시스템을 사용할 수 없게 된다.<ref>sobly tv, 〈[https://medium.com/@sobly/샤딩이란-쉽게-이해해보자-7732bcbe0bb8 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03 </ref>
+
스테이트 샤딩은 [[계정 기반 모델]](account-based model)로, 상태가 지정된 [[블록체인]]에서 이 특정 샤드는 상태의 일부만을 유지하지만, 교차분할 [[트랜잭션]]을 수행하지 못하도록 제한되어 있다. 스테이트 샤딩은 시스템의 상태가 모든 [[샤드]]에 복제되어 있지 않기 때문에 네트워크는 더 이상 오프라인 샤드에 대한 트랜잭션의 유효성을 검사하지 못하게 된다. 만약 오프라인 샤드를 유지하기 위해 백업 노드를 갖게 된다면 중앙화되어 보안에 위협이 될 수 있다. [[네트워크]]가 한 번씩 재편성될 때 한 번에 네트워크를 전환하게 되면 일부 동기화가 완료될 때까지 전체 시스템을 사용할 수 없게 된다.<ref>sobly tv, 〈[https://medium.com/@sobly/샤딩이란-쉽게-이해해보자-7732bcbe0bb8 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03 </ref>
 +
 
 +
예를 들어, [[이더리움]]의 총 [[블록]] 개수는 5,823,023개이다.(2018년 6월 20일 오후 기준) 만약 블록 한 개당 크기가 1KB라면 이더리움 블록체인의 총 크기는 5.8GB가 되며, 블록 한 개당 크기가 1GB라면 이더리움 블록체인의 총 크기는 5.8TB이다. [[블록타임]]은 계속 줄어드는 추세이며 블록이 계속 쌓인다면 블록체인은 굉장히 무거워지게 될 것이다. 1만 명이 해당 블록을 나눠갖는다고 가정해보면, 한 사람당 582개의 블록을 가지고 있으면 된다. 혹은 1인당 블록을 1,000개를 가지게 된다고 하면, 5,823명이 블록을 나눠서 가지고 있으면 된다. 이것이 바로 스테이트 샤딩의 기본 원리이다. 원하는 [[데이터]]가 있다면 해당 샤드에 접근하여 보다 빠르게 열람할 수 있게 되어, 블록체인에 대한 부담을 덜어주고 보다 빠른 데이터 검색이 가능해진다.<ref name="스물">스물네마리, 〈[https://www.blockchainhub.kr/bbs/board.php?bo_table=mari_blockchain&wr_id=189 적응형 스테이트 샤딩을 주 무기로 한 Elrond ]〉, 《블록체인허브》, 2018-06-21 </ref>
  
 
== 특징 ==
 
== 특징 ==
계정 기반 모델을 이어가면 스마트 컨트랙스는 도입하지 않고, 스테이트 샤드 블록체인의 경우에 특정 샤드는 상태의 일부만을 유지한다 예를 들어서, 두 개의 샤드와 두 개의 사용자 계정만을 가진다면, 각각 엘리스(Alice)와 밥(Bob)이라 하고, 각 샤드는 한 명의 사용자 잔고를 보유한다. 엘리스가 밥에게 지불하는 트랜잭션을 생성하면, 트랜잭션은 첫 번째 샤드가 처리하게 된다. 트랜잭션이 검증되면 밥의 새로운 계좌에 대한 정보가 두 번째 샤드와 공유되야하고, 두 계정이 서로 다른 샤드에 의해 처리되면, 빈번한 샤드 간 커뮤니케이션과 상태 교환을 수반한다. 샤드간 소통이 스테이트 샤드로 얻는 퍼포먼스를 해치지 않도록 해야한다.<ref>phuzion7, 〈[https://www.dailycoinews.com/dailycoinews/article/read.do?articleNo=1642&lang=kr 블록체인 샤딩의 3가지 형태: BlockChain Sharding]〉, 《데일리 코인뉴스》, 2018-12-31 </ref>
+
계정 기반 모델을 이어가면 스테이트 샤드 블록체인의 경우에 특정 샤드는 상태의 일부만을 유지한다. 예를 들어, 만약 두 개의 샤드와 두 개의 사용자 계정만을 가진다면, 이들을 각각 엘리스(Alice)와 밥(Bob)이라 하고, 각 샤드는 한 명의 사용자 잔고를 보유한다. 엘리스가 밥에게 지불하는 트랜잭션을 생성하면, 트랜잭션은 첫 번째 샤드가 처리하게 된다. 일단 트랜잭션이 검증되면 밥의 새로운 계좌에 대한 정보가 그의 두 번째 샤드와 공유돼야 하고, 두 계정이 서로 다른 샤드에 의해 처리되면, 빈번한 샤드 간 커뮤니케이션과 상태 교환을 수반해야 한다. 샤드간 소통이 스테이트 샤드로 얻는 퍼포먼스를 해치지 않도록 하는 것은 스테이트 샤딩의 연구 과제이다.
 
 
# 계정 기반 모델(Account-Based Model)로 상태가 지정된 블록체인에서 이 특정 샤드는 상태의 일부만을 유지한다.
 
# 교차분할 트랜잭션을 수행하지 못하도록 제한이 되어 있다.
 
# 시스템의 상태가 모든 샤드에 복제되어 있지 않기 때문에 네트워크는 더 이상 오프라인 샤드에 대한 트랙재션의 유효성을 검사하지 못한다.
 
# 오프라인 샤드를 유지하기 위해 백업 노드를 갖게된다면 중앙집중식이 되어 보안성에 위협이 있다.
 
# 네트워크가 한 번씩 재편성될 때 한번에 네트워크를 전환하게 되면 일부 동기화가 완료될때 까지 전체 시스템을 사용할 수 없게 될 수도 있다.
 
 
 
* '''적응 스테이트 샤딩'''(Adaptive State Sharding)
 
: 중앙 집중식 상대방에 비해 처리량 비교로 블록 체인 샤딩을위한 최적의 접근 방식은 세 가지 샤딩 유형 (네트워크 / 통신, 트랜잭션 / 프로세싱, 상태 / 스토리지) 모두의 이점이 있다. 확장 성 및 처리량 증가에 대한 엘론드의 접근 방식으로 적응 스테이트 샤딩은 세 가지 샤딩 유형을 모두 샤드 내부의 통신을 개선하고, 병렬 처리를 통해 성능을 높이고, 스토리지를 줄이며 거의 선형으로 확장하는 솔루션으로의 결합을 말한다. 사용 가능한 리소스 유효성 검사기 노드 및 네트워크 사용량에 따라 샤드 수가 동적으로 변경되도록하면 처리량뿐만 아니라 효율성에도 큰 영향을 미치는데, 적응 상태 샤딩 메커니즘은 샤드 수가 계산되면 이진 트리 구조를 기반으로한다. 이 숫자는 계정 주소를 샤드에 결정적으로 매핑하는 데 사용되고, 샤드의 트랜잭션 발송은 발신자와 수신자 계정 주소를 지정된 샤드에 매핑하여 결정적으로 수행된다. 솔루션의 대부분의 선형적인 확장 성은 중앙 집중식 솔루션의 처리량을 능가한다.
 
  
 
* '''커뮤니케이션 오버헤드'''(communication overhead)
 
* '''커뮤니케이션 오버헤드'''(communication overhead)
: 샤드간 커뮤니케이션 오버헤드를 줄이는 방법은 사용자들로 하여금 샤드간 트랜잭션을 제한해야 한다. 예를들면, 엘리스가 밥과 직접 거래하는 것이 허용되지 않고 거래를 해야 한다면, 엘리스는 샤드에 계정을 보유해야 한다. 샤드간 소통을 완전히 제거하지만, 플랫폼의 사용성을 제한될 수 있다.
+
: 샤드 간의 커뮤니케이션이 너무 빈번하게 일어나면 커뮤니케이션으로 인한 지연시간의 문제가 발생할 수 있다. 샤드 간 커뮤니케이션 오버헤드, 즉 자원 소모를 줄이는 한 가지 방법은 사용자들의 샤드간 트랜잭션을 제한하는 것이다. 이는 앨리스가 밥과 직접 거래하는 것이 허용되지 않는다는 것을 의미하는데, 그럼에도 불구하고 앨리스가 밥과 거래를 해야 한다면 그녀는 그 샤드에 계정을 보유해야 한다. 앨리스가 샤드에 계정을 보유하므로써 샤드간 소통을 완전히 제거하지만 이는 곧 [[플랫폼]]의 사용성을 제한할 수 있다.
  
 
* '''데이터 유효성'''(data availability)
 
* '''데이터 유효성'''(data availability)
: 특정 샤드가 공격을 받고 제어 불능에 빠진다면, 시스템의 상태는 모든 샤드에 걸쳐 복제를 하지 않아 네트워크는 제어 불능 샤드에 속한 트랜잭션들을 더 이상 검증할 수 없어 블록체인은 대규모 사용 불능이 되는데, 데이터 불능으로부터 네트워크를 조정하고 복구할 수 있는 기록 또는 백업 노드를 유지해야 한다. 노드들이 시스템의 전체 상태를 저장해야 하기 때문에 중앙집권화의 위험을 불러올 수 있다.
+
: 스테이트 샤드가 가진 두 번쩨 문제는 데이터 유효성이다. 어떤 이유로 특정 샤드가 공격을 받았고 제어 불능 상태에 빠진다고 생각해보자. 이때 시스템의 상태는 모든 샤드에 걸쳐 복제를 하지 않기 때문에, 네트워크는 제어 불능 샤드에 속한 트랜잭션을 검증할 수 없고, 결과적으로 블록체인은 사용 불능이 된다. 이때 시스템의 상태가 모든 샤드에 복제되어 있지 않기 때문에 네트워크는 더 이상 오프라인 샤드에 대한 트랜잭션의 유효성을 검사하지 못하게 된다. 오프라인 샤드를 유지하기 위해 백업 노드를 갖게 된다면 중앙화가 되어 보안에 위협이 생겨 [[51% 공격]]의 문제가 발생할 가능성이 생긴다. 이 문제를 해결하기 위해서는 데이터 불능으로부터 네트워크를 조정하고 복구할 수 있는 기록 또는 [[백업]] [[노드]]를 유지하는 것이다. 그러나 이러한 노드들이 시스템 전체 상태를 저장해야 하기 때문에 중앙화의 위험을 불러올 수 있다.
 +
 
 +
* '''네트워크 재편'''
 +
: 모든 샤딩 메커니즘에서 고려해야 할 점은 샤드들이 공격이나 실패점에서 회복 중에 있을 때 멈추지 말하야 한다는 것이다. 즉 네트워크는 새로운 노드들을 계속해서 수용하고, 그들을 임의적으로 서로 다른 샤드에 할당하는, 네트워크 재편을 해야 한다. 그러나 스테이트 샤딩의 경우 재편을 하기가 매우 까다롭다. 각각의 샤드가 상태의 일부만을 유지하기 때문에 네트워크를 모두 함께 재구성하는 것은 동기화가 완성될 때까지 전체 시스템의 불능을 불러올 수 있다. 이런 정지상태를 피하기 위해 네트워크는 노드가 제거되기 전에 충분히 오래된 노드들을 가질 수 있도록 점진적으로 재구성되어야 한다.<ref>phuzion7, 〈[https://www.dailycoinews.com/dailycoinews/article/read.do?articleNo=1642&lang=kr 블록체인 샤딩의 3가지 형태: BlockChain Sharding]〉, 《데일리 코인뉴스》, 2018-12-31 </ref>
  
 
== 활용 ==
 
== 활용 ==
 +
===쿼크체인===
 
[[파일:쿼크체인 글자.png|썸네일|300픽셀|'''쿼크체인'''(QuarkChain)]]
 
[[파일:쿼크체인 글자.png|썸네일|300픽셀|'''쿼크체인'''(QuarkChain)]]
===쿼크체인(QuarkChain)===
 
스테이트 샤딩 기술 기반의 블록체인 플랫폼 중 하나인 [[쿼크체인]]이 [[체인링크]]와의 기술협업을 통해 실생활에서의 [[블록체인]] 적용하였으며, 체인 링크는 미들웨어 플랫폼으로 [[오라클]] 문제, 즉 블록체인 외부 데이터와 스마트 컨트랙트와의 연결할 때 생기는 문제를 해결해 주는 역할을 하는데, 체인링크는 이 과정을 분산화 시켜 더욱 더 보안성 있고 편리하게 외부 데이터를 블록체인 내부로 입력할 수 있게 도와준다. 체인링크는 [[구글]], 오라클, 국제은행간통신협정(SWIFT)등과 같은 주요 기업들과 함께 협력하여 이미 글로벌 시장에서는 유명한 기업으로 쿼크체인은 [[스마트컨트랙트]] 기능을 넘어 온체인 [[트랜잭션]]을 통해 사용자의 일상에서 더 많은 분야에 진입할 수 있게 되며 쿼크체인 네트워크의 개발자들은 디앱(Dapp)을 블록체인 외부의 데이터에 성공적으로 연결함으로써 더 많은 산업 어플리케이션에 효과적으로 활용될 수있고 체인링크는 스마트 컨트랜트가 오프체인 데이터, 웹 API, 전통 은행 결제등에 안전하게 접속하게 해주는 블록체인 오라클 네트워크로, 가트너(Gartner)와 같은 유명 독립 리서치 기관들로 부터 지속해서 최고의 블록체인 기술로 선정 되어 왔으며, 주요 고객으로는 구글, 오라클, 국제은행간통신협정등이 있다. 쿼크체인은 페이스북과 구글에서 샤딩 기술을 적용한 개발자 출신 [[치조우]] 대표가 미국에 설립한 스테이트 샤딩 기반의 블록체인 플랫폼이다. 메인넷을 출시하였으며 이미 비자 네트워크에 가까운 5만5천 이상의 TPS를 달성하여 블록체인 기술의 가능성을 입증해오고 있는 대표적인 블록체인 플랫폼 이다.<ref>QuarkChain, 〈[http://a.to/19QkwgD 스테이트샤딩 블록체인 플랫폼 쿼크체인, 체인링크와 기술협업]〉, 《네이버》, 2019-07-26 </ref>{{자세히|쿼크체인}}
 
  
[[파일:이더리움 글자.png |썸네일|300픽셀|'''이더리움'''(Ethereum)]]
+
[[쿼크체인]]<!--쿼크 체인-->(QuarkChain)은 빠른 트랜잭션 처리 속도와 안정성을 보장하는 플랫폼을 위한 [[암호화폐]]이다. 쿼크체인은 수평 확장성 기술을 활용하여 블록체인의 확장성 문제를 해결하려는 것을 목표로 하고 있다. 쿼크체은 확장성 문제를 해결하기 위한 분산형 샤딩 솔루션을 제공하는데, 쿼크체인의 샤딩 기술은 두 가지 장점을 가진다. 첫 번째는 재사용 가능한 두 계층 블록체인을 통해 보안을 보장한다는 것이다. 쿼크체인 네트워크는 [[51% 공격]]을 피하기 위해 두 개의 블록체인으로 구성된다. 첫 번째 레이어는 샤드를 적용하고, 두 번째 레이어는 루트 블록체인을 사용하여 보안 및 확장성을 보장한다. 쿼크체인 샤딩 기술의 또 다른 특징은 스테이트 샤딩을 지원한다는 것이다. 스테이트 샤딩은 각 샤드의 데이터가 하위 상태로 분할되고, 각 노드가 작동하기 위해 다른 노드에 배치됨을 의미한다. 전체 네트워크의 데이터는 각 노드에 저장되고, 각 노드에서 스토리지 메모리 요구사항이 줄어든다. {{자세히|쿼크체인}}
=== 이더리움(Ethereum)===
+
 
[[이더리움]] 샤딩은 각 샤드가 계정별로 트랜잭션을 나눠 처리하고 승인한다. 블록체인 네트워크 참여자의 모든 주소를 일정한 갯수로 잘라 각 덩어리를 하나의 연방으로 구성하는 방식으로 이더리움의 경우에는 전체 계좌에서 0x00부터 시작되는 계정들은 1번 샤드에서 관리하고 0x01부터 시작하는 계정은 2번 샤드에서 관리하며, 샤드 1에 속하는 요청자가 트랜잭션을 발생시키면 해당 트랜잭션은 샤드 1의 오퍼레이션 노드로 전파되고 블록 제한자, 실행자, 검증자의 검증을 거치고 이상이 없으면, 샤드 1에 들어있는 EVM이 컨트랙트의 코드를 실행시키고 스테이트 변경함수를 통해 기존 스테이트는 새로운 값으로 변경된다. 작업증명(PoW)방식을 쓰는 이더리움은 스테이트를 단일 방식으로 처리하고 있고, 이더리움의 마지막 로드맵인 세레니티에서는 지분증명(PoS)의 합의 알고리즘이 적용됨과 동시에 1024개의 샤드가 연쇄 파이프처럼 건설된다. 스테이트로 통하는 통로가 한 개에서 1024개로 추가 개방돼 스테이트를 구역마다 나눠 관리하게 된다. 질리카의 네트워크 샤딩으로 각 샤드가 모든 샤드의 상태를 알 있지만 이더리움의 스테이트 샤딩은 각 샤드가 스스로의 상태만을 알 수 있고, 데이터 저장도 한 샤드만 하면 되서 속도는 더 빠르다.<ref>강민승 기자, [https://www.mk.co.kr/news/economy/view/2018/12/788276/ 블록체인 성능 향상에 필수 `샤딩`…"쪼개라, 빨라질 것이니"]〉, 《매일경제》, 2018-12-18 </ref> {{자세히|이더리움}}
+
* '''샤딩 설계 개요'''
 +
:* 분할한 상태 : 쿼크체인은 [[스마트 계약]]을 분할한다. 만약 재샤드(reshard)가 일어난다면 스마트 계약을 다른 샤드에 옮긴다. 스마트 계약은 코드와 저장소를 포함하고 있기 때문에 사용자 계정보다 데이터의 크기가 더 커질 수 있다. 사용자의 계정을 분할하지는 않기 때문에 사용자 계정의 상태는 샤드 간 트랜잭션을 통해 다른 샤드로 쉽게 옮길 수 있다. 따라서 사용자는 자신의 [[프라이빗 키]]를 통해 전체 샤드에 있는 모든 리소스로 쉽게 접속할 수 있다.
 +
 
 +
:* 원자성(Atomicity) : 스마트 계약은 fullShardID라고 하는 [[코드베이스]]에 기반한 샤드 키(shard key)를 각각 가지고 있으며, 모든 스마트 계약에 있는 같은 샤드키를 통해 처리되는 일괄처리(batch operation)는 원자성을 띤다. 더불어 다른 샤드 키를 통한 또 다른 스마트 계약으로의 접속시도는 차단된다.
 +
 
 +
:* 균등한 부하/크기 : 스마트 계약의 샤드 키가 균등하게 분포되어 있다는 가정을 통해 서로 다른 샤드의 스마트 계약 또한 균등하게 분할되어 있다고 예측할 수 있다.
 +
 
 +
:* 재샤드(reshard) : 저렴한 마이그레이션 비용으로 더 많은 샤드를 추가하기 위해 스마트 계약에 있는 샤드 키에 따라 재샤드 시의 샤드를 두 개의 샤드로 분열시킨다. 이는 다른 사전 재샤드한 샤드의 데이터의 마이그레이션을 고려할 필요가 없기 때문에 보다 단순하게 재샤드할 수 있다. 스마트 계약에 따른 행위는 재샤드 이전과 이후에도 같다. 즉, 같은 값에 의한 스마트 계약의 실행 결과와, 또는 같은 시스템의 상태 변화에 의한 스마트 계약의 쓰기 결과는 재샤드 전이나 재샤드 후의 결과 값은 같아야 한다.<ref name="쿼크체인">쿼크체인 QuarkChain, 〈[https://blog.naver.com/quarkchain/221351630904 쿼크체인 설명서 Part 3 : 쿼크체인의 상태 분할 샤딩]〉, 《네이버 블로그》, 2018-09-03</ref>
 +
 
 +
* '''시스템 상태와 쿼크체인의 상태 분할'''
 +
: CRUD(Create, Read, Update, Delete) 일괄 처리(batch operation)에 대한 원자성을 지원하기 위해 쿼크체인은 사용자의 계정과 스마트 계약의 각 주소에 32비트 샤드 키(shard key)를 더하는 방법을 통해 재정의 했다.
 +
 
 +
  주소 : RIPEMD160(공개 키) + 샤드키
 +
 
 +
: 여기에서 더하기(+)는 곱집합(cartesian product) 연산이며, 이 연산을 통한 쿼크체인은 총 192비트 데이터의 주소체계를 가지게 된다. 이 중 첫 160비트 주소는 쿼크체인에서 수신자(recipient)의 주소로 참조할 수 있다. 쿼크체인 네트워크에서 샤드의 숫자, 즉 샤드의 크기는 2의 거듭제곱의 형태 (2)ⁿ이다. 그리고 재샤드 작업은 네트워크 내 샤드 갯수의 두 배이다. 주어진 샤드의 크기를 통해 샤드의 인덱스는 다음과 같이 주어진다.
 +
 
 +
  Shard Id = Shard key % Shard size
 +
 
 +
: 샤드 내의 상태는 수신자의 주소값을 지닌 키(key)와 아래와 같은 값(value)들 간의 연결(mapping)이다.
 +
 
 +
  * 잔고
 +
  * 난수(Nonce)
 +
  * 코드
 +
  * 저장소
 +
  * 샤드키(ShardKey)
 +
 
 +
: 여기에서 샤드키는 키(key) - 값(value) 간의 짝이 생성될 때 설정이 되어 이후에는 변경이 불가능하다. 주소내의 추가적인 샤드키를 통해 사용자 혹은 수신자는 단일 프라이빗 키 관리를 통해 모든 샤드의 모든 주소들을 관리할 있게 된다.<ref name="쿼크체인"></ref>
 +
 
 +
* '''트랜잭션'''
 +
:* 잔고 전송 트랜잭션 : 잔고 전송 트랜잭션은 발신 주소와 수신처 주소에 따라 발생한다. 샤드내 트랜잭션(In-Shard Transaction)은 만약 발신/수신 주소가 샤드키는 다를 지라도 같은 샤드 아이디를 가지고 있다면 잔고가 샤드내 트랜잭션으로 전송되는 것이다. 이러한 트랜잭션은 같은 샤드 내의 수신처의 잔고만 업데이트하게 될 것이다. 만약 송수신 주소가 서로 다른 샤드 아이디를 가지고 있다면 이러한 전송을 샤드간 트랜잭션(Cross-Shard Transaction)이라고 하며, 트랜잭션의 원자성을 위한 추가적인 조정이 필요하게 된다. 다행인 것은 두 개의 샤드가 같은 암호화폐인 [[QKC]]를 통해 운영되고 있기 때문에 샤드간 트랜잭션은 이전의 [[체인]]간 트랜잭션에 비해 훨씬 간단한 구조를 가진다.
 +
 
 +
:* 스마트 계약 트랜잭션(Smart Contract Transaction) : 스마트 계약 트랜잭션은 동일 샤드내에서 발행이 되어야 한다. 쉽게 말해, 발신자 계정과 수신처의 스마트 계약 샤드 아이디는 반드시 같아야 한다. 스마트 계약은 동일한 샤드 키를 통해 다른 스마트 계약을 호출할 수 있다. [[EVM]] 속의 주소와 같이 코드 내의 다른 스마트 계약의 수신자를 기입하여 EVM과의 하위 호환성을 유지한다. 만약 스마트 계약이 다른 샤드에 각각 존재한다면, 아래의 어셈블리 코드와 동등한 형태의 스마트 계약 호출도 실패하게 될 것이다. 같은 샤드키의 스마트 계약은 항상 같은 샤드 내에서 분열이 되기 때문에 스마트 계약에 대한 읽기/쓰기와 같은 행동은 시스템 상태가 어떻게 분열되던지 간에 항상 같다고 보증할 수 있다.<ref name="쿼크체인"></ref>
 +
 
 +
* PUSH 0*0 : 스택을 밀어 낸다.
 +
* DUP1    : 스택 첫 번째 내용을 스택의 최상단으로 복사한다.
 +
* REVERT  : 오류가 날 경우 오류 전으로 되돌린다.
 +
 
 +
* '''재샤드(Reshard)'''
 +
: 재샤드는 하나의 샤드를 두 개의 분리된 샤드로 분열하는 동작이다. 따라서 샤드의 크기는 두 배로 커지게 된다. 샤드의 크기가 두 배로 된 후, 사용자 계정/스마트 계약의 수신처는 새로운 샤드 아이디의 또 다른 중요한 비트 부분을 통해 식별할 수 있다. 사용자 계정/스마트 계약의 샤드키가 균일하게 분포되어 있다는 가정하에, 절반의 사용자 계정/스마트 계약은 새로운 샤드로 분열이 도리 것이다. 또한 분열된 샤드의 코드를 REVERT 코드로 변경하거나 혹은 Null로 채운 저장소로 설정을 통해 분열된 샤드 내에 또 다른 분열된 샤드의 스마트 계약이 포함되어 있을 수 있다. 이러한 모조(Dummy) 스마트 계약은 새로운 샤드의 스마트 계약이 같은 샤드에 있으나, 다른 샤드키를 보유한 스마트 계약의 경우에는 여전히 호출에 실패할 수 있다는 것을 보여둔다.
 +
 
 +
: 만약 현재의 노드가 두 개의 분열된 샤드를 동시에 처리할 수 있는 수용력(capacity)이 부족할 경우, 새로운 샤드의 상태를 마이그레이션하여 처리하기 위하여 새로운 노드가 네트워크에 합류하게 된다. 이에 따라 시스템은 샤드 및 노드의 갯수가 증가함에 따라 수용력 또한 증가하게 된다. 이러한 동작은 [[클러스터]](cluster)를 통해서 달성할 수 있다.<ref name="쿼크체인"></ref>
 +
 
 +
* '''샤드 키(shard key) 선정'''
 +
: 쿼크체인에서 부하의 균형을 유지하기 위해서는 모든 스마트 계약을 모든 샤드에 고르게 퍼트리는 것이 핵심이다. 스마트 계약이 생성되고 난 후 에 샤드키는 불변의 속성을 지니기 때문에 스마트 계약이 생성되는 도중에 샤드키를 선정하는 것이 무엇보다 중요하다.
 +
 
 +
# 첫째, 만약 스마트 계약이 다른 스마트 계약에 의존하여 생성이 된다면, 샤드 키는 의존하고 있는 다른 스마트 계약의 샤드 키와 반드시 같아야 한다.
 +
# 둘재, 만약 스마트 계약이 다른 어떠한 스마트 계약에도 의존하지 않는다면, 사용자 혹은 지갑은 자유롭게 어떠한 샤드 키나 또는 아래의 몇 가지 규칙을 따르는 시스템을 선택할 수 있다.
  
===엘론드(Elrond)===
+
* 임의로 생성된(Randomly Generated) 샤드키
[[엘론드]]는 [[질리카]](Zilliqa)와 비교하여 [[트랜잭션 샤딩]]뿐만 아니라 스테이트 샤딩도 사용하여 샤딩의 한계를 넓혔다. 엘론드는 [[작업증명]](PoW) 메커니즘을 완전히 제거하고 합의를 위해 [[확률적 지분증명]](SPoS)을 사용한다. 두 아키텍처 모두 자체 [[스마트 계약]] 엔진을 구축하고 있지만 엘론드는 블록체인 간의 상호운용성을 달성하기 위해 [[이더리움]](EVM)을 목표로 한다. 질리카가 구현해낸 샤딩은 [[네트워크 샤딩]](Network Sharding)으로 네트워크만 샤딩을 진행하고, 네트워크에 들어온 노드들을 여러 샤드에 할당하고 연산 능력을 높여 TPS를 높이는 것이다. 트랜잭션 처리는 샤딩을 통해 분할적/병렬적으로 하여 저장은 스테이트 샤딩과 다르지만 기존의 방식과는 다르지 않다. 이더리움이 구현하고자 하는 샤딩과는 다른 샤딩으로 이더리움의 샤딩은 스테이트 샤딩이며, 차이점으로는 누가더 샤딩을 진행 하는것에 있다.<ref>경욱'S DOODLE, 〈[https://tconomy.io/1707 질리카 백서 분석하기 (1)]〉, 《티코노미》, 2018-09-29 </ref>
+
* 발신자 주소의 모든 32비트
 +
* 지갑의 아이피 주소
  
* '''스테이트 샤딩 아키텍처 검증'''
+
: 처음의 두 가지 선정방법은 균등하게 분배된 샤드키의 결과로 초래된다. 그러나 만약 수백 개 혹은 수천 개의 샤드가 있다고 가정한다면, 네트워크에 존재하는 어떠한 스마트 계약에도 접근하고 싶어하는 사용자의 경우는 샤딩의 효율을 감소시키거나 사용자의 경험을 악화시킬 빈번한 샤드간 트랜잭션, 혹은 다중 잔고들을 유지하고 싶을 것이다. 아이피 주소를 사용하게 될 경우 지리적인 정보를 통해 스마트 계약을 그룹화함으로써 문제가 경감될 가능성이 있다. 만약 사용자의 스마트 계약과의 상호작용이 지역 상품, 혹은 서비스와 같이 지리적으로 연관되어 있다면 사용자는 사용자가 거주하고 있거나 여행하는 지역과 관련된 샤드에 잔고를 유지할 수 있으며, 불필요한 샤드 트랜잭션을 잠재적으로 크게 줄임으로써 사용자 계정관리를 보다 간편하게 할 수 있다.<ref name="쿼크체인"></ref>
: 엘론드 프로토 이프 PoC-v0.5는 기본적으로 직접 메시징, 정보 방송 및 채널 통신을위한 통신 p2p 모듈이 포함 된 기술 백본으로 슈노르(Schnorr)방식, 발라레(Bellare)및 네븐(Neven)의 블록에 대한 다중 서명 방법과의 거래에 대한 서명 및 확인을 처리하는 암호화 모듈, 서로 다른 데이터 유형(블록, 트랜잭션, 계정 등)이 서로 연결되어 시스템에 저장되는 방법을 정의하고 설명하는 데이터 모듈, 일관성과 보안을 보장하기 위해 네트워크를 통해 상태를 복제하면서 트랜잭션을 처리하고 블록을 조립하는 데 사용되는 실행 엔진; 체계적인 부트 스트랩 프로세스와 적절한 타임 아웃을 보장하는 동기화 및 시간 통과 관점에 사용되는 연대기 모듈, 라운드 로빈 환경에서 기본 컨센서스를 사용하는 컨센서스 모듈로, 모든 샤드에서 독립적 인 컨센서스 그룹을 실행하여 블록을 제안하고 검증 할 수 있으며, 통신 주제를 사용하고 샤드 및 크로스 샤드 트랜잭션을 모두 사용할 수있는 샤딩 모듈이 있다.<ref>엘론드 공식 홈페이지 - https://elrond.com/technology </ref>
 
  
* '''엘론드 제로원 테스트넷'''
+
=== 이더리움===
: 2019년 5월에 출시 하였고, 정응 스테이트 샤딩, 안전한 스테이크 컨센서스 증명, 트랜잭션을위한 슈노르서명, 랜덤 시드 생성을위한 BLS서명 및 블록 서명을위한 수정 된 BLS 멀티 시그먼트로 구성된다. 관점을 설정하는 메트릭은 대기 시간, 대역폭 제한, 매우 제한된 컴퓨팅 성능 4기가바이트의 메모리를 가진 평균 듀얼 코어 CPU, 다른 지리적 위치를 가진 별도의 시스템에서 각 유효성 검사기 노드 실행과 같다.
+
[[파일:이더리움 글자.png |썸네일|300픽셀|'''이더리움'''(Ethereum)]]
{{인용문|
 
테스트 넷 사양 : <br>
 
샤딩 설정 : 5 개의 샤드 + 메타 체인 <br>
 
노드 : 500 x AWS T2.medium (검증기 노드) 및 AWS 12 x t2.large (관찰자 노드) <br>
 
샤드 당 노드 : 83 <br>
 
컨센서스 : 6 초마다 BLS 라운드 (각 샤드) <br>
 
컨센서스 크기 : 63 노드 (각 샤드) <br>
 
최대 블록 크기 : ~ 800KB <br>
 
Peak-TPS : ~ 12500 }}
 
  
== 문제점 ==
+
[[이더리움]](ethereum)은 블록체인 기술을 기반으로 스마트 계약 기능을 구현하기 위한 분산 컴퓨팅 플랫폼이다. 2015년 7월 [[비탈릭 부테린]](Vitalik Buterin)이 [[C++]]과 [[고]](Go) 언어로 개발했다. [[이더해시]](Ethash) 알고리즘 기반의 [[작업증명]](PoW) 방식으로 채굴 중이지만, 앞으로 작업증명 방식을 벗어나 [[지분증명]](PoS) 방식으로 변경할 예정이다.<ref>블록인프레스, 〈[https://blockinpress.com/archives/4806 이더리움 지분증명 합의 알고리즘 ‘캐스퍼’, 검토 절차 시작]〉, 《블록인프레스》, 2018-04-23</ref> 이더리움 이전의 블록체인 기반 기술은 전자화폐에 특화된 기능을 구현했기 때문에, 암호화폐 이외의 영역에서 사용하기에는 어려움이 있었다. 반면 이더리움은 [[비트코인]]과 비슷한 전자화폐의 기능과 더불어 [[솔리디티]](Solidity) 등의 [[튜링완전성]](Turing-Completeness)을 갖춘 확장용 언어를 이용해 [[스마트 계약]]을 작성함으로 여러 분야에 접목할 수 있다. 덕분에 블록체인 기술을 다양한 비즈니스 분야로 확장할 수 있게 되었다.
중앙화의 문제와 보안성의 문제를 가지게 되고, 보안의 문제는 1% 어택(Attack)의 문제가 생길 수 있으며, 100개의 샤드 시스템에서는 오직 1%의 해시 비율(Hash Rate)로 샤드를 지배할 수 있다. 샤드간의 커뮤니케이션이 너무 빈번하게 일어난다면 커뮤니케이션으로 인한 지연시간의 문제가 발생하고, 시스템의 상태가 모든 샤드에 복제되어 있지 않기 때문에 네트워크는 더 이상 오프라인 샤드에 대한 트랙재션의 유효성을 검사하지 못한다. 오프라인 샤드를 유지하기 위해 백업 노드를 갖게된다면 중앙집중식이 되어 보안성에 위협이 있으며, 네트워크가 한 번씩 재편성될 때 한번에 네트워크를 전환하게 되면 일부 동기화가 완료될때 까지 전체 시스템을 사용할 수 없게 될 수도 있고, 계정 기반 모델(Account-Based Model)로 상태가 지정된 블록체인에서 이 특정 샤드는 상태의 일부만을 유지하며, 교차분할 트랜잭션을 수행하지 못하도록 제한이 되어 있다.
 
  
한 샤드의 연결이 끊어질 경우 네트워크에 문제가 생길 수 있으며, 보안성 문제로는 하나의 샤드에 악성 노드가 모이는 것을 방지하려면 네트워크를 주기적이고 무작위로 셔플해야 하며, 노드를 셔플하려고하면 다른 노드의 상태를 알아야 하는데, 스테이트 샤딩은 스스로의 상태밖에 모르기 때문에 셔플을 할 수 없고, 악성 노드 방지가 어렵다.<ref>Ki Oh, 〈[https://zchats.info/Zilliqa_Korean?page=84 이더가 샤딩을 구현하면 질리카는?]〉, 《Zilliqa Сhats》, 2018-09-17 </ref>
+
이더리움 샤딩은 블록체인 네트워크 참여자의 모든 주소를 일정한 갯수로 잘라 각 덩어리를 하나의 연방으로 구성하는 방식으로, 각 샤드가 계정별로 트랜잭션을 나눠 처리하고 승인한다. 이더리움의 경우에는 전체 계좌에서 0x00부터 시작되는 계정들은 1번 샤드에서 관리하고 0x01부터 시작하는 계정은 2번 샤드에서 관리하는 식이다. 만약 샤드 1에 속하는 요청자가 트랜잭션을 발생시키면 해당 트랜잭션은 샤드 1의 오퍼레이션 노드로 전파되고 블록 제한자, 실행자, 검증자의 검증을 거친다. 이상이 없다면 샤드 1에 들어있는 EVM이 컨트랙트의 코드를 실행시키고 스테이트 변경함수를 통해 기존 스테이트는 새로운 값으로 변경된다. 이더리움은 스테이트를 단일 방식으로 처리하고 있다. 이더리움의 마지막 로드맵인 세레니티에서는 지분증명 합의 알고리즘이 적용됨과 동시에 1024개의 샤드가 연쇄 파이프처럼 건설된다. 스테이트로 통하는 통로가 한 개에서 1024개로 추가 개방돼 스테이트를 구역마다 나눠 관리하게 된다. 지분증명 합의 알고리즘과 샤딩 기술이 적용되면 이더리움의 트랜잭션 처리 속도는 1000배 정도 빨라져 약 1만4000TPS의 성능을 낼 것으로 전망된다. <ref>강민승 기자, 〈[https://www.mk.co.kr/news/economy/view/2018/12/788276/ 블록체인 성능 향상에 필수 `샤딩`…"쪼개라, 빨라질 것이니"]〉, 《매일경제》, 2018-12-18 </ref> {{자세히|이더리움}}
  
== 해결방안 ==
+
===엘론드===
빠른 샤드 전환 이 되야 하는데, 샤드에 대한 공격 성공 가능성을 줄이고자 한다면 검증자를 빠르게 전환해야 한다. 이전 부터 look ahead time을 두어 검증자가 자신이 맡을 샤드 블록을 미리 동기화 시킨다. 미리 동기화 하기 위해서는 동기화할 자료를 줄여서 빠르게 검증자를 준비할 수 있는 무국적 고객(stateless client)을 제안하는 이유는 블록 헤더만을 저장하는데 블록헤더만을 저장하기 때문에 거래에 대한 검증은 불가능하고, 거래 검증을 하려면 거래를 만들때, 검증에 필요한 Witness를 첨부해야하며, 영지식을 사용하여, Witness 의 크기를 줄이는 방법도있다. 자료의 가용성으로는 모두가 무국적 고객이라면 블록의 내용을 손실할 수 있어 누군가는 상태(state)를 저장하고 있어야 하며, 적절한 보상과 검증(Proof of Custody)가 필요하다. 어부(Fisherman) 딜레마는 이레이저 코딩(Erasure Coding)으로 해결가능하다. 난수생성으로는 난수를 사용하여 검증자를 샤드에 배정하는데, 공격자가 난수를 예측하거나 조작하여 샤딩보안에 문제가 생기면, 기존의 란다오(RANDAO) 난수 생성방식을 VDF(Verigiable DelayFunction)을 사용한다.
+
[[엘론드]](Elrond)는 보안, 효율성, 확장성 및 상호 운용성을 제공하는 퍼블릭 블록체인이다. 엘론드의 두 가지 가장 중요한 기능은 [[적응형 상태 샤딩]](adaptive state sharding)과 [[보안지분증명]](Secure Proof of Stake) [[합의 알고리즘]]이다. 그 중 적응형 상태 샤딩(adaptive state sharding)이라고 불리는 엘론드의 확장성 및 처리량 증가를 이끄는 접근 방식은 [[네트워크 샤딩]], [[트랜잭션 샤딩]], 스테이트 샤딩의 세 가지 샤딩 유형의 장점을 모두 결합한 것으로, 샤드 내부의 통신을 개선하고 병렬 처리를 통해 성능을 향상시키며 스토리지를 줄임으로써 거의 선형적으로 확장할 수 있는 솔루션을 말한다. 사용 가능한 리소스와 네트워크 사용량에 따라 샤드 수가 동적으로 변경되도록 허용하는 것은 처리량뿐만 아니라 효율면에서도 큰 영향을 미친다. 엘론드의 적응형 상태 샤딩 메커니즘은 일단 샤드의 수가 계산되면 이진 트리 구조를 기초로 한다. 이 숫자는 샤드에 대한 계정 주소의 결정적 매핑에 사용된다. 샤드에서의 트랜잭션 전송은 전송자 및 수신자 계정 주소를 지정된 샤드에 매핑하여 수행된다. 거의 선형적인 확장성을 보여주는 엘론드의 이러한 솔루션은 중앙 집중식 솔루션의 처리량을 능가한다는 점에서 큰 역할을 한다.
  
많은 샤드가 공격이나 실패점에서 회복 중에 있을 때 멈추지 말아야 한다. 네트워크는 새로운 노드들을 계속 수용하고 그들을 임의적으로 서로 다른 샤드에 할당해야 하며, 네트워크는 재편되어야 한다.스테이트 샤딩의 경우에 재편을 하기가 까다로운데, 각각의 샤드가 상태의 일부만을 유지하며, 네트워크를 모두 함께 재구성하는 것은 동기화가 완성될 때까지 전체 시스템의 불능을 불러와 정지 상태를 피하기 위해, 네트워크는 노드가 제거되기 전에 오래된 여러 노드를 가질 수 있도록 점진적으로 재구성해야 한다. 새로운 노드가 샤드에 들어오면, 노드가 샤드의 상태와 동기화하기 위한 충분한 시간을 갖도록 하는 이유는 들어온 노드가 모든 단일 트랜잭션을 바로 거부하게 된다.
+
엘론드의 적응형 상태 샤딩은 세 가지 목표를 고려하여 설계되었다. 첫 번째는 가용에 영향을 미치지 않는 확장성이다. 샤드의 수를 늘리거나 줄이는 것은 다운타임을 발생시키지 않고 노드에 무시할 정도로 작은 영향을 주거나 상태를 업데이트하는 동안 노드를 최소화한다. 두 번째는 빠른 전송 및 추적이다. 트랜잭션에 알맞은 샤드를 찾는 것은 결정적이며 계산하기가 쉽고 통신 라운드가 필요하지 않다. 마지막으로 효율성 및 적응성이다. 샤드는 주어진 시간에 가능한 한 균형을 유지해야 한다.<ref>''The Elrond Team'', 〈[https://elrond.com/files/Elrond_Whitepaper_EN.pdf ''Elrond A Highly Scalable Public Blockchain via Adaptive State Sharding and Secure Proof of Stake'']〉, 《엘론드 공식홈페이지》, 2019-06-19</ref>
  
 
{{각주}}
 
{{각주}}
  
 
== 참고자료 ==
 
== 참고자료 ==
* 엘론드 공식 홈페이지 - https://elrond.com/technology
+
* 엘론드 공식 홈페이지 - https://elrond.com/
 +
* 강민승 기자, 〈[https://www.mk.co.kr/news/economy/view/2018/12/788276/ 블록체인 성능 향상에 필수 `샤딩`…"쪼개라, 빨라질 것이니"]〉, 《매일경제》, 2018-12-18
 +
* 이경훈 기자, 〈[https://kr.thenodist.com/articles/36737 스테이트샤딩 블록체인 플랫폼 쿼크체인, 빗썸 상장]〉, 《더노디스트》, 2019-08-07
 +
* 블록인프레스, 〈[https://blockinpress.com/archives/4806 이더리움 지분증명 합의 알고리즘 ‘캐스퍼’, 검토 절차 시작]〉, 《블록인프레스》, 2018-04-23
 +
* 쿼크체인 QuarkChain, 〈[https://blog.naver.com/quarkchain/221351630904 쿼크체인 설명서 Part 3 : 쿼크체인의 상태 분할 샤딩]〉, 《네이버 블로그》, 2018-09-03
 +
* ''The Elrond Team'', 〈[https://elrond.com/files/Elrond_Whitepaper_EN.pdf ''Elrond A Highly Scalable Public Blockchain via Adaptive State Sharding and Secure Proof of Stake'']〉, 《엘론드 공식홈페이지》, 2019-06-19
 +
* phuzion7, 〈[https://www.dailycoinews.com/dailycoinews/article/read.do?articleNo=1642&lang=kr 블록체인 샤딩의 3가지 형태: BlockChain Sharding]〉, 《데일리 코인뉴스》, 2018-12-31
 
* sobly tv, 〈[https://medium.com/@sobly/샤딩이란-쉽게-이해해보자-7732bcbe0bb8 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03
 
* sobly tv, 〈[https://medium.com/@sobly/샤딩이란-쉽게-이해해보자-7732bcbe0bb8 샤딩이란? 쉽게 이해해보자]〉, 《미디엄》, 2018-09-03
* QuarkChain, 〈[http://a.to/19QkwgD 스테이트샤딩 블록체인 플랫폼 쿼크체인, 체인링크와 기술협업]〉, 《네이버》, 2019-07-26
+
* 스물네마리, 〈[https://www.blockchainhub.kr/bbs/board.php?bo_table=mari_blockchain&wr_id=189 적응형 스테이트 샤딩을 주 무기로 한 Elrond ]〉, 《블록체인허브》, 2018-06-21
* Las 낙서장, 〈[https://lascrea.tistory.com/192 Sharding (샤딩)]〉, 《티스토리》, 2019-04-09
 
* 경욱'S DOODLE, 〈[https://tconomy.io/1707 질리카 백서 분석하기 (1)]〉, 《티코노미》, 2018-09-29
 
 
* phuzion7, 〈[https://www.dailycoinews.com/dailycoinews/article/read.do?articleNo=1642&lang=kr 블록체인 샤딩의 3가지 형태: BlockChain Sharding]〉, 《데일리 코인뉴스》, 2018-12-31
 
* phuzion7, 〈[https://www.dailycoinews.com/dailycoinews/article/read.do?articleNo=1642&lang=kr 블록체인 샤딩의 3가지 형태: BlockChain Sharding]〉, 《데일리 코인뉴스》, 2018-12-31
* 강민승 기자, 〈[https://www.mk.co.kr/news/economy/view/2018/12/788276/ 블록체인 성능 향상에 필수 `샤딩`…"쪼개라, 빨라질 것이니"]〉, 《매일경제》, 2018-12-18
 
  
== 같이보기 ==
+
== 같이 보기 ==
 
* [[샤딩]]
 
* [[샤딩]]
 +
* [[네트워크 샤딩]]
 +
* [[쿼크체인]]
 +
* [[이더리움]]
  
 
{{블록체인 기술|검토 필요}}
 
{{블록체인 기술|검토 필요}}

2019년 8월 29일 (목) 13:57 기준 최신판

스테이트 샤딩(state sharding)은 상태가 지정된 상황에서, 특정 노드가 특정 상태값만 저장하고 있는 샤딩 기술을 말한다. 상태 샤딩이라고도 한다.

개요[편집]

스테이트 샤딩은 계정 기반 모델(account-based model)로, 상태가 지정된 블록체인에서 이 특정 샤드는 상태의 일부만을 유지하지만, 교차분할 트랜잭션을 수행하지 못하도록 제한되어 있다. 스테이트 샤딩은 시스템의 상태가 모든 샤드에 복제되어 있지 않기 때문에 네트워크는 더 이상 오프라인 샤드에 대한 트랜잭션의 유효성을 검사하지 못하게 된다. 만약 오프라인 샤드를 유지하기 위해 백업 노드를 갖게 된다면 중앙화되어 보안에 위협이 될 수 있다. 네트워크가 한 번씩 재편성될 때 한 번에 네트워크를 전환하게 되면 일부 동기화가 완료될 때까지 전체 시스템을 사용할 수 없게 된다.[1]

예를 들어, 이더리움의 총 블록 개수는 5,823,023개이다.(2018년 6월 20일 오후 기준) 만약 블록 한 개당 크기가 1KB라면 이더리움 블록체인의 총 크기는 5.8GB가 되며, 블록 한 개당 크기가 1GB라면 이더리움 블록체인의 총 크기는 5.8TB이다. 블록타임은 계속 줄어드는 추세이며 블록이 계속 쌓인다면 블록체인은 굉장히 무거워지게 될 것이다. 1만 명이 해당 블록을 나눠갖는다고 가정해보면, 한 사람당 582개의 블록을 가지고 있으면 된다. 혹은 1인당 블록을 1,000개를 가지게 된다고 하면, 5,823명이 블록을 나눠서 가지고 있으면 된다. 이것이 바로 스테이트 샤딩의 기본 원리이다. 원하는 데이터가 있다면 해당 샤드에 접근하여 보다 빠르게 열람할 수 있게 되어, 블록체인에 대한 부담을 덜어주고 보다 빠른 데이터 검색이 가능해진다.[2]

특징[편집]

계정 기반 모델을 이어가면 스테이트 샤드 블록체인의 경우에 특정 샤드는 상태의 일부만을 유지한다. 예를 들어, 만약 두 개의 샤드와 두 개의 사용자 계정만을 가진다면, 이들을 각각 엘리스(Alice)와 밥(Bob)이라 하고, 각 샤드는 한 명의 사용자 잔고를 보유한다. 엘리스가 밥에게 지불하는 트랜잭션을 생성하면, 이 트랜잭션은 첫 번째 샤드가 처리하게 된다. 일단 트랜잭션이 검증되면 밥의 새로운 계좌에 대한 정보가 그의 두 번째 샤드와 공유돼야 하고, 두 계정이 서로 다른 샤드에 의해 처리되면, 빈번한 샤드 간 커뮤니케이션과 상태 교환을 수반해야 한다. 샤드간 소통이 스테이트 샤드로 얻는 퍼포먼스를 해치지 않도록 하는 것은 스테이트 샤딩의 연구 과제이다.

  • 커뮤니케이션 오버헤드(communication overhead)
샤드 간의 커뮤니케이션이 너무 빈번하게 일어나면 커뮤니케이션으로 인한 지연시간의 문제가 발생할 수 있다. 샤드 간 커뮤니케이션 오버헤드, 즉 자원 소모를 줄이는 한 가지 방법은 사용자들의 샤드간 트랜잭션을 제한하는 것이다. 이는 앨리스가 밥과 직접 거래하는 것이 허용되지 않는다는 것을 의미하는데, 그럼에도 불구하고 앨리스가 밥과 거래를 해야 한다면 그녀는 그 샤드에 계정을 보유해야 한다. 앨리스가 샤드에 계정을 보유하므로써 샤드간 소통을 완전히 제거하지만 이는 곧 플랫폼의 사용성을 제한할 수 있다.
  • 데이터 유효성(data availability)
스테이트 샤드가 가진 두 번쩨 문제는 데이터 유효성이다. 어떤 이유로 특정 샤드가 공격을 받았고 제어 불능 상태에 빠진다고 생각해보자. 이때 시스템의 상태는 모든 샤드에 걸쳐 복제를 하지 않기 때문에, 네트워크는 제어 불능 샤드에 속한 트랜잭션을 검증할 수 없고, 결과적으로 블록체인은 사용 불능이 된다. 이때 시스템의 상태가 모든 샤드에 복제되어 있지 않기 때문에 네트워크는 더 이상 오프라인 샤드에 대한 트랜잭션의 유효성을 검사하지 못하게 된다. 오프라인 샤드를 유지하기 위해 백업 노드를 갖게 된다면 중앙화가 되어 보안에 위협이 생겨 51% 공격의 문제가 발생할 가능성이 생긴다. 이 문제를 해결하기 위해서는 데이터 불능으로부터 네트워크를 조정하고 복구할 수 있는 기록 또는 백업 노드를 유지하는 것이다. 그러나 이러한 노드들이 시스템 전체 상태를 저장해야 하기 때문에 중앙화의 위험을 불러올 수 있다.
  • 네트워크 재편
모든 샤딩 메커니즘에서 고려해야 할 점은 샤드들이 공격이나 실패점에서 회복 중에 있을 때 멈추지 말하야 한다는 것이다. 즉 네트워크는 새로운 노드들을 계속해서 수용하고, 그들을 임의적으로 서로 다른 샤드에 할당하는, 네트워크 재편을 해야 한다. 그러나 스테이트 샤딩의 경우 재편을 하기가 매우 까다롭다. 각각의 샤드가 상태의 일부만을 유지하기 때문에 네트워크를 모두 함께 재구성하는 것은 동기화가 완성될 때까지 전체 시스템의 불능을 불러올 수 있다. 이런 정지상태를 피하기 위해 네트워크는 노드가 제거되기 전에 충분히 오래된 노드들을 가질 수 있도록 점진적으로 재구성되어야 한다.[3]

활용[편집]

쿼크체인[편집]

쿼크체인(QuarkChain)

쿼크체인(QuarkChain)은 빠른 트랜잭션 처리 속도와 안정성을 보장하는 플랫폼을 위한 암호화폐이다. 쿼크체인은 수평 확장성 기술을 활용하여 블록체인의 확장성 문제를 해결하려는 것을 목표로 하고 있다. 쿼크체은 확장성 문제를 해결하기 위한 분산형 샤딩 솔루션을 제공하는데, 쿼크체인의 샤딩 기술은 두 가지 장점을 가진다. 첫 번째는 재사용 가능한 두 계층 블록체인을 통해 보안을 보장한다는 것이다. 쿼크체인 네트워크는 51% 공격을 피하기 위해 두 개의 블록체인으로 구성된다. 첫 번째 레이어는 샤드를 적용하고, 두 번째 레이어는 루트 블록체인을 사용하여 보안 및 확장성을 보장한다. 쿼크체인 샤딩 기술의 또 다른 특징은 스테이트 샤딩을 지원한다는 것이다. 스테이트 샤딩은 각 샤드의 데이터가 하위 상태로 분할되고, 각 노드가 작동하기 위해 다른 노드에 배치됨을 의미한다. 전체 네트워크의 데이터는 각 노드에 저장되고, 각 노드에서 스토리지 메모리 요구사항이 줄어든다. 가기.png 쿼크체인에 대해 자세히 보기

  • 샤딩 설계 개요
  • 분할한 상태 : 쿼크체인은 스마트 계약을 분할한다. 만약 재샤드(reshard)가 일어난다면 스마트 계약을 다른 샤드에 옮긴다. 스마트 계약은 코드와 저장소를 포함하고 있기 때문에 사용자 계정보다 데이터의 크기가 더 커질 수 있다. 사용자의 계정을 분할하지는 않기 때문에 사용자 계정의 상태는 샤드 간 트랜잭션을 통해 다른 샤드로 쉽게 옮길 수 있다. 따라서 사용자는 자신의 프라이빗 키를 통해 전체 샤드에 있는 모든 리소스로 쉽게 접속할 수 있다.
  • 원자성(Atomicity) : 스마트 계약은 fullShardID라고 하는 코드베이스에 기반한 샤드 키(shard key)를 각각 가지고 있으며, 모든 스마트 계약에 있는 같은 샤드키를 통해 처리되는 일괄처리(batch operation)는 원자성을 띤다. 더불어 다른 샤드 키를 통한 또 다른 스마트 계약으로의 접속시도는 차단된다.
  • 균등한 부하/크기 : 스마트 계약의 샤드 키가 균등하게 분포되어 있다는 가정을 통해 서로 다른 샤드의 스마트 계약 또한 균등하게 분할되어 있다고 예측할 수 있다.
  • 재샤드(reshard) : 저렴한 마이그레이션 비용으로 더 많은 샤드를 추가하기 위해 스마트 계약에 있는 샤드 키에 따라 재샤드 시의 샤드를 두 개의 샤드로 분열시킨다. 이는 다른 사전 재샤드한 샤드의 데이터의 마이그레이션을 고려할 필요가 없기 때문에 보다 단순하게 재샤드할 수 있다. 스마트 계약에 따른 행위는 재샤드 이전과 이후에도 같다. 즉, 같은 값에 의한 스마트 계약의 실행 결과와, 또는 같은 시스템의 상태 변화에 의한 스마트 계약의 쓰기 결과는 재샤드 전이나 재샤드 후의 결과 값은 같아야 한다.[4]
  • 시스템 상태와 쿼크체인의 상태 분할
CRUD(Create, Read, Update, Delete) 일괄 처리(batch operation)에 대한 원자성을 지원하기 위해 쿼크체인은 사용자의 계정과 스마트 계약의 각 주소에 32비트 샤드 키(shard key)를 더하는 방법을 통해 재정의 했다.
 주소 : RIPEMD160(공개 키) + 샤드키
여기에서 더하기(+)는 곱집합(cartesian product) 연산이며, 이 연산을 통한 쿼크체인은 총 192비트 데이터의 주소체계를 가지게 된다. 이 중 첫 160비트 주소는 쿼크체인에서 수신자(recipient)의 주소로 참조할 수 있다. 쿼크체인 네트워크에서 샤드의 숫자, 즉 샤드의 크기는 2의 거듭제곱의 형태 (2)ⁿ이다. 그리고 재샤드 작업은 네트워크 내 샤드 갯수의 두 배이다. 주어진 샤드의 크기를 통해 샤드의 인덱스는 다음과 같이 주어진다.
 Shard Id = Shard key % Shard size
샤드 내의 상태는 수신자의 주소값을 지닌 키(key)와 아래와 같은 값(value)들 간의 연결(mapping)이다.
 * 잔고 
 * 난수(Nonce) 
 * 코드 
 * 저장소 
 * 샤드키(ShardKey)
여기에서 샤드키는 키(key) - 값(value) 간의 짝이 생성될 때 설정이 되어 이후에는 변경이 불가능하다. 주소내의 추가적인 샤드키를 통해 사용자 혹은 수신자는 단일 프라이빗 키 관리를 통해 모든 샤드의 모든 주소들을 관리할 수 있게 된다.[4]
  • 트랜잭션
  • 잔고 전송 트랜잭션 : 잔고 전송 트랜잭션은 발신 주소와 수신처 주소에 따라 발생한다. 샤드내 트랜잭션(In-Shard Transaction)은 만약 발신/수신 주소가 샤드키는 다를 지라도 같은 샤드 아이디를 가지고 있다면 잔고가 샤드내 트랜잭션으로 전송되는 것이다. 이러한 트랜잭션은 같은 샤드 내의 수신처의 잔고만 업데이트하게 될 것이다. 만약 송수신 주소가 서로 다른 샤드 아이디를 가지고 있다면 이러한 전송을 샤드간 트랜잭션(Cross-Shard Transaction)이라고 하며, 트랜잭션의 원자성을 위한 추가적인 조정이 필요하게 된다. 다행인 것은 두 개의 샤드가 같은 암호화폐인 QKC를 통해 운영되고 있기 때문에 샤드간 트랜잭션은 이전의 체인간 트랜잭션에 비해 훨씬 간단한 구조를 가진다.
  • 스마트 계약 트랜잭션(Smart Contract Transaction) : 스마트 계약 트랜잭션은 동일 샤드내에서 발행이 되어야 한다. 쉽게 말해, 발신자 계정과 수신처의 스마트 계약 샤드 아이디는 반드시 같아야 한다. 스마트 계약은 동일한 샤드 키를 통해 다른 스마트 계약을 호출할 수 있다. EVM 속의 주소와 같이 코드 내의 다른 스마트 계약의 수신자를 기입하여 EVM과의 하위 호환성을 유지한다. 만약 스마트 계약이 다른 샤드에 각각 존재한다면, 아래의 어셈블리 코드와 동등한 형태의 스마트 계약 호출도 실패하게 될 것이다. 같은 샤드키의 스마트 계약은 항상 같은 샤드 내에서 분열이 되기 때문에 스마트 계약에 대한 읽기/쓰기와 같은 행동은 시스템 상태가 어떻게 분열되던지 간에 항상 같다고 보증할 수 있다.[4]
* PUSH 0*0 : 스택을 밀어 낸다.
* DUP1     : 스택 첫 번째 내용을 스택의 최상단으로 복사한다.
* REVERT   : 오류가 날 경우 오류 전으로 되돌린다.
  • 재샤드(Reshard)
재샤드는 하나의 샤드를 두 개의 분리된 샤드로 분열하는 동작이다. 따라서 샤드의 크기는 두 배로 커지게 된다. 샤드의 크기가 두 배로 된 후, 사용자 계정/스마트 계약의 수신처는 새로운 샤드 아이디의 또 다른 중요한 비트 부분을 통해 식별할 수 있다. 사용자 계정/스마트 계약의 샤드키가 균일하게 분포되어 있다는 가정하에, 절반의 사용자 계정/스마트 계약은 새로운 샤드로 분열이 도리 것이다. 또한 분열된 샤드의 코드를 REVERT 코드로 변경하거나 혹은 Null로 채운 저장소로 설정을 통해 분열된 샤드 내에 또 다른 분열된 샤드의 스마트 계약이 포함되어 있을 수 있다. 이러한 모조(Dummy) 스마트 계약은 새로운 샤드의 스마트 계약이 같은 샤드에 있으나, 다른 샤드키를 보유한 스마트 계약의 경우에는 여전히 호출에 실패할 수 있다는 것을 보여둔다.
만약 현재의 노드가 두 개의 분열된 샤드를 동시에 처리할 수 있는 수용력(capacity)이 부족할 경우, 새로운 샤드의 상태를 마이그레이션하여 처리하기 위하여 새로운 노드가 네트워크에 합류하게 된다. 이에 따라 시스템은 샤드 및 노드의 갯수가 증가함에 따라 수용력 또한 증가하게 된다. 이러한 동작은 클러스터(cluster)를 통해서 달성할 수 있다.[4]
  • 샤드 키(shard key) 선정
쿼크체인에서 부하의 균형을 유지하기 위해서는 모든 스마트 계약을 모든 샤드에 고르게 퍼트리는 것이 핵심이다. 스마트 계약이 생성되고 난 후 에 샤드키는 불변의 속성을 지니기 때문에 스마트 계약이 생성되는 도중에 샤드키를 선정하는 것이 무엇보다 중요하다.
  1. 첫째, 만약 스마트 계약이 다른 스마트 계약에 의존하여 생성이 된다면, 샤드 키는 의존하고 있는 다른 스마트 계약의 샤드 키와 반드시 같아야 한다.
  2. 둘재, 만약 스마트 계약이 다른 어떠한 스마트 계약에도 의존하지 않는다면, 사용자 혹은 지갑은 자유롭게 어떠한 샤드 키나 또는 아래의 몇 가지 규칙을 따르는 시스템을 선택할 수 있다.
* 임의로 생성된(Randomly Generated) 샤드키 
* 발신자 주소의 모든 32비트 
* 지갑의 아이피 주소
처음의 두 가지 선정방법은 균등하게 분배된 샤드키의 결과로 초래된다. 그러나 만약 수백 개 혹은 수천 개의 샤드가 있다고 가정한다면, 네트워크에 존재하는 어떠한 스마트 계약에도 접근하고 싶어하는 사용자의 경우는 샤딩의 효율을 감소시키거나 사용자의 경험을 악화시킬 빈번한 샤드간 트랜잭션, 혹은 다중 잔고들을 유지하고 싶을 것이다. 아이피 주소를 사용하게 될 경우 지리적인 정보를 통해 스마트 계약을 그룹화함으로써 문제가 경감될 가능성이 있다. 만약 사용자의 스마트 계약과의 상호작용이 지역 상품, 혹은 서비스와 같이 지리적으로 연관되어 있다면 사용자는 사용자가 거주하고 있거나 여행하는 지역과 관련된 샤드에 잔고를 유지할 수 있으며, 불필요한 샤드 간 트랜잭션을 잠재적으로 크게 줄임으로써 사용자 계정관리를 보다 간편하게 할 수 있다.[4]

이더리움[편집]

이더리움(Ethereum)

이더리움(ethereum)은 블록체인 기술을 기반으로 스마트 계약 기능을 구현하기 위한 분산 컴퓨팅 플랫폼이다. 2015년 7월 비탈릭 부테린(Vitalik Buterin)이 C++(Go) 언어로 개발했다. 이더해시(Ethash) 알고리즘 기반의 작업증명(PoW) 방식으로 채굴 중이지만, 앞으로 작업증명 방식을 벗어나 지분증명(PoS) 방식으로 변경할 예정이다.[5] 이더리움 이전의 블록체인 기반 기술은 전자화폐에 특화된 기능을 구현했기 때문에, 암호화폐 이외의 영역에서 사용하기에는 어려움이 있었다. 반면 이더리움은 비트코인과 비슷한 전자화폐의 기능과 더불어 솔리디티(Solidity) 등의 튜링완전성(Turing-Completeness)을 갖춘 확장용 언어를 이용해 스마트 계약을 작성함으로 여러 분야에 접목할 수 있다. 덕분에 블록체인 기술을 다양한 비즈니스 분야로 확장할 수 있게 되었다.

이더리움 샤딩은 블록체인 네트워크 참여자의 모든 주소를 일정한 갯수로 잘라 각 덩어리를 하나의 연방으로 구성하는 방식으로, 각 샤드가 계정별로 트랜잭션을 나눠 처리하고 승인한다. 이더리움의 경우에는 전체 계좌에서 0x00부터 시작되는 계정들은 1번 샤드에서 관리하고 0x01부터 시작하는 계정은 2번 샤드에서 관리하는 식이다. 만약 샤드 1에 속하는 요청자가 트랜잭션을 발생시키면 해당 트랜잭션은 샤드 1의 오퍼레이션 노드로 전파되고 블록 제한자, 실행자, 검증자의 검증을 거친다. 이상이 없다면 샤드 1에 들어있는 EVM이 컨트랙트의 코드를 실행시키고 스테이트 변경함수를 통해 기존 스테이트는 새로운 값으로 변경된다. 이더리움은 스테이트를 단일 방식으로 처리하고 있다. 이더리움의 마지막 로드맵인 세레니티에서는 지분증명 합의 알고리즘이 적용됨과 동시에 1024개의 샤드가 연쇄 파이프처럼 건설된다. 스테이트로 통하는 통로가 한 개에서 1024개로 추가 개방돼 스테이트를 구역마다 나눠 관리하게 된다. 지분증명 합의 알고리즘과 샤딩 기술이 적용되면 이더리움의 트랜잭션 처리 속도는 1000배 정도 빨라져 약 1만4000TPS의 성능을 낼 것으로 전망된다. [6] 가기.png 이더리움에 대해 자세히 보기

엘론드[편집]

엘론드(Elrond)는 보안, 효율성, 확장성 및 상호 운용성을 제공하는 퍼블릭 블록체인이다. 엘론드의 두 가지 가장 중요한 기능은 적응형 상태 샤딩(adaptive state sharding)과 보안지분증명(Secure Proof of Stake) 합의 알고리즘이다. 그 중 적응형 상태 샤딩(adaptive state sharding)이라고 불리는 엘론드의 확장성 및 처리량 증가를 이끄는 접근 방식은 네트워크 샤딩, 트랜잭션 샤딩, 스테이트 샤딩의 세 가지 샤딩 유형의 장점을 모두 결합한 것으로, 샤드 내부의 통신을 개선하고 병렬 처리를 통해 성능을 향상시키며 스토리지를 줄임으로써 거의 선형적으로 확장할 수 있는 솔루션을 말한다. 사용 가능한 리소스와 네트워크 사용량에 따라 샤드 수가 동적으로 변경되도록 허용하는 것은 처리량뿐만 아니라 효율면에서도 큰 영향을 미친다. 엘론드의 적응형 상태 샤딩 메커니즘은 일단 샤드의 수가 계산되면 이진 트리 구조를 기초로 한다. 이 숫자는 샤드에 대한 계정 주소의 결정적 매핑에 사용된다. 샤드에서의 트랜잭션 전송은 전송자 및 수신자 계정 주소를 지정된 샤드에 매핑하여 수행된다. 거의 선형적인 확장성을 보여주는 엘론드의 이러한 솔루션은 중앙 집중식 솔루션의 처리량을 능가한다는 점에서 큰 역할을 한다.

엘론드의 적응형 상태 샤딩은 세 가지 목표를 고려하여 설계되었다. 첫 번째는 가용에 영향을 미치지 않는 확장성이다. 샤드의 수를 늘리거나 줄이는 것은 다운타임을 발생시키지 않고 노드에 무시할 정도로 작은 영향을 주거나 상태를 업데이트하는 동안 노드를 최소화한다. 두 번째는 빠른 전송 및 추적이다. 트랜잭션에 알맞은 샤드를 찾는 것은 결정적이며 계산하기가 쉽고 통신 라운드가 필요하지 않다. 마지막으로 효율성 및 적응성이다. 샤드는 주어진 시간에 가능한 한 균형을 유지해야 한다.[7]

각주[편집]

  1. sobly tv, 〈샤딩이란? 쉽게 이해해보자〉, 《미디엄》, 2018-09-03
  2. 스물네마리, 〈적응형 스테이트 샤딩을 주 무기로 한 Elrond 〉, 《블록체인허브》, 2018-06-21
  3. phuzion7, 〈블록체인 샤딩의 3가지 형태: BlockChain Sharding〉, 《데일리 코인뉴스》, 2018-12-31
  4. 4.0 4.1 4.2 4.3 4.4 쿼크체인 QuarkChain, 〈쿼크체인 설명서 Part 3 : 쿼크체인의 상태 분할 샤딩〉, 《네이버 블로그》, 2018-09-03
  5. 블록인프레스, 〈이더리움 지분증명 합의 알고리즘 ‘캐스퍼’, 검토 절차 시작〉, 《블록인프레스》, 2018-04-23
  6. 강민승 기자, 〈블록체인 성능 향상에 필수 `샤딩`…"쪼개라, 빨라질 것이니"〉, 《매일경제》, 2018-12-18
  7. The Elrond Team, 〈Elrond A Highly Scalable Public Blockchain via Adaptive State Sharding and Secure Proof of Stake〉, 《엘론드 공식홈페이지》, 2019-06-19

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 스테이트 샤딩 문서는 블록체인 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.