의견.png

뉴머라이

위키원
kang19 (토론 | 기여)님의 2019년 9월 23일 (월) 14:28 판 (스테이킹 분석)
이동: 둘러보기, 검색
뉴머라이(Numrai) 로고
뉴머라이(Numrai) 로고와 글자

뉴머라이(Numerai)는 과적합(overfitting)을 방지하고 기계 지능 간의 협동을 이끌어내는 암호화폐이다.[1] 쉽게 말하자면 인공지능을 사용하는 헤지펀드이다. 단위는 NMR이다. 뉴머라이 회사는 헤지펀드암호화폐 기반 예측 시장을 운영하는 스타트업이다. 이 기업의 공동창업자는 리처드 크레이브프레드 에르샘이다. 이들은 지난 2017년 에어드랍을 통해서 자체 암호화폐인 뉴머라이토큰을 발행했다.[2] 이들은 2017년 6월부터 전문가들을 대상으로 주가를 예측하고, 그것이 맞으면 돈을 지급하고 틀리면 돈을 잃는 예측시장 프로토콜 이레이저(Erasure)를 운영했다. 뉴머라이를 창업한 리처드 크레이브는 데이터 과학자들에게 뉴머라이토큰을 지급해 프로토콜을 지금까지 운영했다고 설명했다.[3] 뉴머라이와 유사한 블록체인 기반의 예측 플랫폼으로 어거(Augur)와 엔도르(Endor)가 있다.

개요

기계 학습(Machine Learning) 간의 경쟁(competition)은 의도적인 과적합(overpfitting)에 취약하다. 이런 상황에서 뉴머라이는 과적합을 경제적으로 불합리하게 만드는 새로운 경매방식에 사용할 수 있는 새로운 암호화폐 뉴머라이 토큰을 제사한다. 이 새로운 경매방식은 데이터 과학자들이 새로운 데이터에 대한 자신의 예측모델 성능에 대한 자신감 정도를 표현할 수 있게 하여 최적의 입찰을 이끌어낸다. 이러한 경매에 따라 뉴머라이 토큰 또한 경제적 가치를 지니게 된다. 뉴머라이는 인공지능이 펀드를 운영하는 방식으로 이뤄지며, 인간이 모델(엔진)을 마들고 이에 기반하여 투자를 진행한다. 뉴머라이에서 사용하는 투자 모델은 21가지 수치 값을 통해 1과 0의 결과를 예측한다. 다양한 회사들에 대하여 21개의 투자 지표를 모으고, 그 지표를 분석하여 구매 여부를 결정한다. 여기서 구매하면 1을, 구매하지 않으면 0을 선택한다.[4]

등장배경

일반적으로 기계학습 알고리즘의 정확도를 측정하는 방식은 데이터를 훈련 데이터와 테스트 데이터로 나누는 것이다. 훈련 데이터를 바탕으로 훈련한 모델의 정확도는 해당 모델이 한 번도 본적 없는 테스트 데이터를 통해 측정한다. 하지만 데이터 과학자가 테스트 점수 형태로 테스트 데이터에 대한 피드백을 받아 이를 모델 선정하는 데 사용 한다면 테스트 데이터를 과적합한 모델이 나올 위험이 있다. 이는 새로운 데이터에 대한 모델의 성능을 저하시킨다.

과적합 곡선

이러한 과적합 문제를 "적응형 데이터 분석(Adaptive Data Analysis)"라고 한다. 적응형 데이터 분석으로 도출한 모델은 성능 저하부터 아예 쓸 수 없게 되눈 등 다양한 문제가 있다. 그러나 뉴머라이의 경우, 적응형 데이터 분석은 과거 데이터를 과적합 하여 실제로 예측할 때는 성능이 감소할 때 일어난다. 기계 학습 경쟁은 과거 데이터에 기반한 예측률에 따라 승자가 결정되므로 과거 데이터를 과적합할 유인이 있다. 그 결과 의도적으로 과적합을 하게 된다. 뉴머라이에게 꼭 필요한 것은 과거 데이터에만 잘 들어맞는 모델이 아니라 새로운 데이터에서 잘 작동하는 고성능 모델이다.

현재 이러한 제곧된 데이터(holdout)의 재사용(reuse)에 대한 최상(state of the art)의 해결책은 노출 되는 정보량을 제한하는 것이다. 이러한 해결책은 과학적 발견에는 충분할 수 있지만 기계학습 토너먼트에서 순위를 매기거나 사용자들에게 좋은 경험을 제공하는 데 있어서 상당한 걸림돌이 된다. 따라서 뉴머라이 측은 데이터 과학자들이 자신의 모델에 대한 자신감의 정도를 나타낼 수 있는 새로운 시스템을 제안했다. 데이터 과학자들은 새로운 암호화폐인 뉴머레어를 사용하여 자신들의 예측에 대해 배탱함으로 신규 토너먼트에 참여할 수 있다. 이러한 경매 방식은 새로운 데이터에 대핸 모델 성능에 대한 정확한 예측에 대해 보상한다. 데이터 과학자들은 뉴머라이를 통해 자신의 모델의 실제 성능에 대해서 어느 정도 자신감이 있는 지를 나타낼 수 이싿. 그 정도에 대해 표현하면 올바른 모형을 더욱 강조할 수 있어 헤지펀드 자체의 성능 또한 개선할 수 있다.

특징

뉴머라이는 이더리움 ERC-20을 기반으로 한 토큰이다. 이더리움 토큰은 이더리움 블록체인 상에서 실행하는 스마트 계약의 형태로 표현 된다. 누구나 뉴머라이 스마트 계약의 소스 코드를 확인할 수 있다. 새로 생산한 뉴머라이 토큰은 모두 뉴머라이 회사에게 전달된다. 뉴머라이의 이더리움 스마트 게약은 뉴머라이 토큰의 총량을 2,100만 개로 제한하고 있다. 뉴머라이는 기존 참가자의 과거 순위에 따라 백만 개의 뉴머라이 토큰을 기존 데이터 과학자들에게 분배할 것이다. 앞서 언급한 바와 같이 처음으로 분배한 이후, 토큰 갯수가 최대치에 달할 때까지 스마트 계약에 따라 매주 정해진 갯수의 뉴머라이 토큰을 생산할 것이다. 뉴머라이 기계학습 경쟁에서 뛰어난 성과를 보이는 데이터 과학자들이 지속적으로 뉴머라이 토큰을 얻을 수 있다.

예측에 자신 있다면 데이터 과학자는 뉴머라이 이더리움 스마트 계약으로 뉴머라이 토큰을 보낸다. 이 토큰을 받은 스마트 계약은 이 과학자가 보낸 뉴머라이 토큰을 t 시간 동안 동ㄱ결한다. 이 때 t는 새로운 데이터에 대한 모넬 성능을 평가하기 위해 필요한 시간이다. t 시간이 흐른 뒤, 뉴머라이는 새로운 데이터에 대한 모델의 성능 정보가 담긴 메세지를 네트워크에 보낸다. 걍매 방식에 따라 예측 성능이 좋은 데이터 과학자는 보상을 받는 동시에 배팅에 사용한 뉴머라이도 돌려 받지만, 그렇지 못한 과학자들은 배팅에 참가하기 위해 낸 뉴머라이 토큰을 잃게 된다. 이러한 비가역적인 뉴머라이 토큰의 소멸은 이더리움 블록체인에서 누구나 확인할 수 있다.

경매

대부분의 토너먼트는 상금의 정해진 총량이 없다. 뉴머라이는 데이터 고학자들에게 이 상금을 나누어준다. 또한 과학자들은 경매에 참여할 수 있다. 경매는 (c,s)의 형태를 갖는데 여기서 c는 데이터 과학자가 1달러를 확득하기 위해 거는 뉴머라이 토큰의 양으로 자신이 한 예측에 대한 자신감(confidence)의 정도를 나타낸다. 또한 s는 배팅하는 뉴머라이 토큰의 양(stake)를 나타낸다. 특정 시간동안 s는 이더리움 계약에 동결되어 있으며, 뉴머라이 회사를 포함해 그 누구도 그 자산에 접근할 수 없다. 일정한 시간이 지난 후 "다중단위(multiunit) 더치경매"에 의해 보상(payout)이 정해진다.

경매방식

경매 방식은 다중단위 더치경매에 추가적인 규칙을 추가시켜 사용한다. 모델 성능은 특정 시간이 지난 후 평가 받는다. 성능을 평가하는 기준은 이원 분류 문제에 적합한 로그 손실(logloss) 을 사용한다. 로그 손실이 ―ln(0.5)보다 작으면 예측 성능이 좋은 것이며 ―ln(0.5)보다 높으면 예측 성능이 나쁜 것으로 평가한다. 데이터 과학자들은 자신감 c가 높은 순으로 내림차순 정렬하여 순위를 매긴다. 이 순위에 따라 데이터 과학자의 예측 성능이 좋은 경우 s/c를 보상을 받으며 성능이 나쁘면 배팅했던 s를 잃게 된다. 이 과정은 정해진 상금이 고갈될 때까지 계속해서 진행 된다.

경매 예시

총 상금이 3,000달러이며 시간 t가 지났다고 가정하고, 다음과 같은 배팅 결과가 나왔다고 생각해보자.

뉴머라이 경매 예시
자신감 c 배팅량 s s/c Logloss < - In(0.5) 데이터 과학자
5 100000 2000 NO WSX
4 2000 500 YES XIRAX
1.5 3000 2000 YES PHIL_CULLITON
1 5000 2000 NO DAENRIS
0.5 300 600 YES ABRIOSI

WSX는 Logloss < - In(0.5)를 달성하지 못했으므로 그가 걸었던 1만 뉴머라이는 소멸된다. 그러나 XIRAX는 500 달러의 보상과 함께 배팅하는 데 사용한 뉴머라이 토큰을 돌려 받는다. PHIL_CULLITON은 2천 달러를 받고 뉴머라이 토큰을 돌려 받는다. 또한 DAENRIS의 뉴머라이 토큰은 없어진다. ABRIOSI는 상금 고갈로 인해 배팅했던 600 달러보다 적은 500 달러를 돌려받게 된다. ABRIOSI 아래의 모든 참가자들은 자신의 뉴머라이 토큰을 돌려 받고 보상은 받지 않게 된다.

스테이킹 분석

모델이 새로운 데이터에 대해 Logloss < - In(0.5)의 조건을 달성할 확률이 p라고 하자. p가 낮다면 모델이 과적합할 확률이 크다는 뜻이다. 여기서 s가 데이터 과학자가 베팅한 뉴머라이 토큰의 총량이라고 하자. 또한 e는 뉴머라이 토큰과 달러의 교환 비율, c는 자신감의 정도라고 하자. 데이터 과학자는 예상 이익이 0보다 크면 베팅을 클 경우 뉴머라이 토큰을 갖고 베팅을 할 것이다. 만약 데이터 과학자가 s를 베팅한 후 Logloss ≥―In(0.5)가 되면 데이터 과학자는 s/e를 잃게 된다. 만약 데이터 과학자가 s를 베팅한 후 Logloss < - In(0.5)가 되면 데이터 과학자는 s/c를 얻게 된다. 따라서 자신감 척도 c를 바탕으로 s 뉴머라이 토큰을 베팅한 경우 얻을 수 있는 예상 수익은 다음과 같다.


뉴머라이수식1.PNG


따라서 데이터 과학자는 아래와 같은 조건을 만족하는 경우 베팅 한다.


뉴머라이수식2.PNG


각주

  1. 뉴머라이 백서 번역본〉, 2017-02-20
  2. Leigh Cuen, 〈암호화폐 기반 예측시장 ‘뉴머라이’ 토큰판매로 $1100만 유치〉, 《코인데스크코리아》, 2019-03-26
  3. Nikhilesh De, 〈뉴머라이, 암호화폐 기반 주가 예측시장 대중에 공개〉, 《코인데스크코리아》, 2018-10-09
  4. tmkor,〈AI 블록체인 햇지펀드 numerai 토너먼트 참가해보기!〉, 《스팀잇》

참고자료

같이 보기


  의견.png 이 뉴머라이 문서는 암호화폐 종류에 관한 토막글입니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 이 문서의 내용을 채워주세요.