내쉬 균형이란 상대 플레이어의 전략이 예상 가능할 때, 자신의 최선택을 선택했을 때 그 결과로 형성된 균형 상태를 말한다.
내쉬 균형이 아니라는 것은 순수 전략(pure strategy)에서 존재하지 않음을 의미한다. 이때 순수 전략이란 가위바위보 게임처럼 100% 확률로 선택하게 되는 전략을 말하는데 죄수의 딜레마와 달리 확률을 따지지 않으며 타 플레이어들이 이 전략을 선택하고 있는 상황 하에서 자신의 전략을 바꾸는 것이 득인 플레이어가 한 명 이상 존재한다는 뜻이다.
개요
내쉬균형(Nash equilibrium)은 게임이론의 한 형태로 1994년 노벨경제학상을 공동 수상한 수학자 존 내쉬((John Forbes Nash. Jr)가 개발했다. 이는 각 참여자가 상대방의 전략을 주어진 것으로 보고 자신에게 최적인 전략을 선택할 때 그 결과가 균형을 이루는 최적 전략의 집합을 말한다. 이러한 전략 구성이 두 참여자에 의해 모두 예측되었을 때 이 게임은 내쉬 균형에 도달하게 된다. 내쉬 균형에 으르게 된다면 참여자는 전략을 수정할 필요가 없다. 오늘날 정치적 협상이나 경제 분야에서 전략으로 많이 활용되고 있다. 내쉬 균형의 대표적인 적용 예시로는 죄수의 딜레마(Prisoner’s Dilemma)가 있다. [1]
플레이어가 타 플레이어의 전략을 알고 있고 그들이 전략을 바꾸지 않는다고 할 때, 자신의 전략을 바꾸는 게 이득인지에 대한 질문의 답으로 그렇다고 한다면 그 전략은 내쉬 균형이 아니고 그렇지 않다고 한다면 그 전략은 내쉬 균형이다.
역사
내쉬균형은 1938년 쿠르노(Antoine Augustin Cournot)의 과점이론에서 처음으로 사용됐다. 과점이론에서 기업은 이익 극대화를 위해 산출물의 생산량을 고민한다. 이때 타 기업들의 산출량을 크게 고려한다. 쿠르노 균형에서 각 기업들의 산출물 극대화는 순수 전략인 내쉬 균형에 속한다.
폰 노이만(John von Veumann)과 모르겐슈타른(Oskar Morgenstern)이 1944년 발표한 게임이론과 경제행동(The Theory of Games and Economic Behavior)에서 내쉬균형 혼합전략이 소개되었다. 그러나 유한한 행동에서의 제로섬 게임에서만 존재한다고 한정했다. 이를 1951년 내쉬가 글 '비협조 게임'(Non-Cooperative Games)에서 유한한 행동의 묶음에서 적어도 하나 이상의 내쉬균형이 반드시 존재함을 증명하며 확장했다. 내쉬의 단서는, "n개의 경기자들의 균형점은 타 경기자들이 그들의 전략을 고수한 채 혼합전략을 이용해 수익을 극대화하는 점에서 이루어진다. 이는 연속 전략함수를 타 전략에 생산하며 불필요한 옵션들의 확장은 궁극적으로 균형점이나 고정점에 존재한다."로 폰 노이만의 균형정의보다 더 일반적이다.
젤텐(Reinhard Selten)은 1965년 신빙성 없는 위험에 근거를 둔 균형을 제거한 부분게임완전균형(Sub Game Perfect Equilibrium)에서 게임이 반복되거나 완전정보를 갖지 않을 때의 상황에서의 개선책을 발표했다.[2]
특징
- 내쉬 균형은 1개 이상일 수 있다.
- 내쉬 균형과 파레토최적은 다를 수 있다.
파레토최적이란 타인의 이익을 감소시키지 않고서는 어느 한 사람의 이익을 증가시키는 것이 불가능할 정도로 자원이 효율적으로 배분된 상태를 의미한다. 내쉬균형이 파레토최적이 아니라는 것은 '개인적인 합리성'이 늘 '집단적 합리성'은 아님을 의미한다.[3]
순수 전략이란 가위바위보 게임처럼 100% 확률로 선택하게 되는 전략을 말하는데 죄수의 딜레마와 달리 확률을 따지지 않으며 타 플레이어들이 이 전략을 선택하고 있는 상황 하에서 자신의 전략을 바꾸는 것이 득인 플레이어가 한 명 이상 존재한다는 뜻이다.
혼합 전략이란 여러 개의 전략을 미리 선택된 확률에 따라 무작위로 선택하는 것을 의미한다.
비교
죄수의 딜레마
죄수의 딜레마란 용의자 두 명을 격리해 따로 심문하며 둘 다 자백하지 않을 경우엔 제일 적은 형량을, 둘 다 자백할 경우는 그보다 높은 형량을, 한 명만 자백할 경우 그 한 명만 높은 형량을 제안했을 때 그들이 겪는 딜레마를 말한다. 두 명의 용의자가 최선의 선택을 한다면 둘 다 자백하지 않고 제일 적은 형량을 받겠지만, 상대를 신뢰하지 못하고 차선을 선택한다. 자백을 하기로 결정했다면, 그때부턴 상대방의 선택에 상관없이 달라질 것이 없어지며 이 균형을 내쉬 균형이라고 한다.
존 내쉬는 정보가 차단되고 여러 상황이 동시다발적으로 발생할 때, 사람들은 자신에게 이익이 되는 최선이 아니라 타인의 행동과 전략을 예상하고 그에 대응하는 차선택을 택한다고 주장했다.
죄수의 딜레마에서 각자가 자신의 이익을 추구함으로써 도달하게 되는 균형점은 파레토최적이 아닌 비효율적인 상태이다. 내쉬는 내쉬균형을 통해 애덤 스미스의 보이지 않은 손이 실패할 수도 있다고 증명했다.
미니맥스 정리
내쉬는 폰 노이먼의 미니맥스 정리를 확장하기 위해 폰 노이먼을 찾아갔으나 부정당했다.
미니맥스 정리는 플레이어가 2명이고 서로의 이득의 합이 0이 되는 제로섬 규칙이기에 한정적이나 내쉬 균형은 3명 이상의 플레이어가 게임에 참가하고 그들의 이득의 합이 0이 아닌 비 제로섬 규칙이기에 미니맥스 정리에 비해 더 일반적인 경우로 확장되어 있다.
크루노 균형
크루노는 최적반응의 개념을 균형 안정의 분석에서 도입한다. 내쉬 균형의 정의는 크루노의 정의보다 넓은 개념이다.
각주
- ↑ 박은태,〈죄수의 딜레마〉, 《경제학사전》, 2011-03-09
- ↑ 〈내시 균형〉, 《위키피디아》, 2018-07-30
- ↑ 히키신,〈파레토최적 〉, 《티스토리》, 2017-02-15
참고자료
같이보기
이 내시균형 문서는 블록체인 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
블록체인 : 블록체인 기술 □■⊕, 합의 알고리즘, 암호 알고리즘, 알고리즘, 블록체인 플랫폼, 블록체인 솔루션, 블록체인 서비스
|
|
블록체인 기술
|
Bech32 • BTP • DRC-20 • EIP • IPFS • KRC-20 • NFT 마켓플레이스 • P2P • P2PKH • P2SH • PFP • PUF • SPV • TPS • TRC-20 • UTXO • 가나슈 • 가명성 • 가스 • 가십 • 가십 프로토콜 • 개념증명(PoC) • 검증가능지연함수(VDF) • 게스 • 고스트 프로토콜 • 공공예산 • 글로벌신뢰인공지능 • 대체가능토큰 • 대체불가토큰(NFT) • 도지더리움 브릿지 • 디지털 자산 • 디지털 희소성 • 라운드 • 라운드 로빈 • 라이트하우스 • 랜덤 • 레그테크 • 레이든 • 리카르디안 계약 • 린스타트업 • 마스터키 • 마스트 • 메인넷 • 멜팅 • 믹싱 • 민팅 • 밈블윔블 • 반감기 • 베타넷 • 변경불가성 • 브릿지 • 블록체인 생태계 • 블록체인 클라우드 서비스(BaaS) • 블룸필터 • 비블록체인 • 비앱 • 비콘체인 • 비트코인코어 • 빤통경제 • 수정 고스트 프로토콜 • 스냅샷 • 스마트 계약 • 스마트 브리지 • 스웜프로토콜 • 스크립트퍼브키 • 스테이킹 • 스텔스 주소 • 스핀오프코인 • 슬래싱 • 시크릿 컨트랙트 • 심플 컨트랙트 • 아토믹스왑 • 암호경제(크립토 이코노미) • 앤드어스체인인공지능 • 앵커링 • 언스테이킹 • 에어드랍 • 에폭 • 오프체인 오더락 • 오피리턴 • 옵코드 • 원토큰 문제 • 웨이 • 위스퍼 프로토콜 • 위임 • 유니스왑 • 유동성 • 이더리움 가상머신(EVM) • 이더리움 클라이언트 • 이중지불 • 익명성 • 인증된 익명 아이디 • 인터레저 프로토콜(ILP) • 자산화 • 잠금 스크립트 • 최소기능제품(MVP) • 컨소시엄 블록체인 • 컬러드코인 • 코인셔플 • 코인소각 • 코인에이지 • 코인조인 • 코인토싱 • 크립토노트 • 키스토어 • 타임락 • 테스트넷 • 토다 • 토큰 이코노미 • 토큰화 • 튜링완전 • 튜링불완전 • 트랜잭션 아이디(TxID) • 트러스트 컨트랙트 • 트루빗 • 트릴레마 • 파워 • 파티셔닝 • 퍼블릭 블록체인 • 페널티 • 프라이버시 • 프라이빗 블록체인 • 플랫폼 • 플러딩 • 피어 • 피투피(P2P) • 하이브리드 블록체인 • 합의 • 해시락 • 해시타임락(HTLC) • 해제 스크립트 • 확장성
|
|
해시
|
레인보우 테이블 • 매핑 • 머클경로 • 머클루트 • 머클트리 • 분산해시테이블(DHT) • 블록해시 • 스큐드 머클트리 • 온라인툴즈 • 이전블록해시 • 카뎀리아 • 해시 • 해시레이트 • 해시맵 • 해시충돌 • 해시테이블 • 해시파워 • 해시함수 • 해싱
|
|
블록
|
고아블록 • 그래핀 • 논스 • 마이크로블록 • 베이킹 • 북키퍼 • 브랜치블록 • 브로드캐스팅 • 블록 • 블록높이 • 블록바디 • 블록생성자 • 블록정보 • 블록타임 • 블록헤더 • 비츠 • 세그윗 • 엉클블록 • 완결성 • 제네시스블록 • 타임스탬프 • 프룻 • 프룻체인
|
|
체인
|
더블체인 • 라이트닝 네트워크 • 라이트닝 루프 • 루트체인 • 루프체인 • 메인체인 • 방향성 비순환 그래프(DAG) • 베리파이어블 프루닝 • 블록격자 • 블록체인 • 사용자 활성화 소프트포크(UASF) • 사용자 활성화 하드포크(UAHF) • 사이드체인 • 서브체인 • 소프트포크 • 오페라체인 • 오프체인 • 온체인 • 인터체인 • 차일드체인 • 체인 • 탱글 • 테스트체인 • 토카막 네트워크 • 포크 • 포크체인 • 퓨어체인 • 프로덕트체인 • 프루닝 • 프리포크 • 플라즈마 알고리즘 • 플라즈마캐시 • 플래시 계층 • 하드포크 • 해시그래프 • 홀로체인
|
|
노드
|
검증인(밸리데이터) • 기본노드 • 노드 • 라이트노드 • 랜덤노드 • 마스터노드 • 베이킹노드 • 보조노드 • 보증노드 • 슈퍼노드(슈퍼대표, 대표노드) • 슬롯 • 슬롯리더 • 엔드포인트노드(레인저노드) • 의회 네트워크 • 작업노드 • 종단노드 • 종자노드(시드노드) • 중계노드 • 지갑노드 • 채굴노드(마이닝노드) • 쿼럼 • 풀노드 • 합의노드
|
|
샤딩
|
네트워크 샤딩 • 데이터베이스 샤딩 • 동적샤딩 • 샤드 • 샤딩 • 스테이트 샤딩 • 알고리즘 샤딩 • 적응형 상태 샤딩 • 체인샤딩 • 트랜잭션 샤딩
|
|
채굴
|
병합채굴 • 사전채굴 • 에이식(ASIC) • 에이식부스트 • 에이식 저항 • 일드파밍 • 채굴 • 채굴 난이도 • 채굴량 • 탄소감축채굴 • 페어런치
|
|
탈중앙화
|
TVL • 거버넌스 • 게임파이 • 다오(DAO) • 다이코(DAICO) • 닥(DAC) • 닥스(DAX) • 덱스(DEX) • 디앱(DApp) • 디지오(DGO) • 디튜브 • 디파이(DeFi) • 분산경제 • 분산원장(DLT) • 분산 클라우드 • 소셜파이 • 씨파이(C-Fi) • 오프체인 거버넌스 • 온체인 거버넌스 • 원장 • 준중앙화 • 중앙화 • 탈중앙화 • 탈중앙화 TPS • 탈중앙화 조직(DO) • 탈중앙화 지수(DQ)
|
|
분산아이디
|
DIDs • IETF • ToIP • 검증가능한 자격증명 • 검증인 • 디지털아이덴티티재단 • 발급자 • 보유자 • 분산아이디(DID) • 분산아이디 기관 • 분산아이디 인증(DID Auth) • 아이온 • 자기주권 • 자기주권신원 • 최소화된 자격증명 데이터 • 탈중앙화 키관리시스템 • 통합해석기
|
|
오라클
|
상호인증 블록체인 • 오라클 • 오라클 머신 • 오라클 문제 • 오라클 서비스 • 중간자
|
|
BIP
|
BIP • BIP9 • BIP16 • BIP32 • BIP39 • BIP43 • BIP44 • BIP47 • BIP49 • BIP63 • BIP70 • BIP84 • BIP141 • BIP148
|
|
ERC
|
ERC • ERC-20 • ERC-165 • ERC-223 • ERC-621 • ERC-721 • ERC-777 • ERC-827 • ERC-884 • ERC-998 • ERC-1155 • ERC-1404
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|