알파고

위키원
Asadal (토론 | 기여)님의 2018년 8월 6일 (월) 23:40 판
이동: 둘러보기, 검색

알파고(AlphaGo)는 구글 딥마인드(Google DeepMind) 회사가 개발한 인공지능(AI) 기반의 바둑 프로그램이다.

개요

2014년 영국의 데미스 하사비스(Demis Hassabis)가 설립한 스타트업 기업이었던 딥마인드구글에 인수되면서 본격적인 알파고 개발에 착수했다. 알파고(AlphaGo)라는 이름은 구글의 지주회사 이름인 알파벳(Alphabet)에 사용되었고, 그리스 문자의 첫 번째 글자로 최고를 의미하는 알파(α)라는 말에 바둑의 일본어 발음인 고(碁, ご)에서 유래한 영어 단어인 'Go'를 합친 말이다.

알파고는 단일 컴퓨터로 구동되는 단일 버전(single version)과 네트워크에 연결된 여러 대의 컴퓨터를 사용하는 분산 버전(distributed version)의 두 가지가 있다. 단일 버전의 알파고는 48개의 CPU와 4~8개의 GPU로 구동된다. 단일 버전이 알파고는 '크레이지 스톤'과 '젠'을 포함한 다른 바둑 프로그램과 500번의 대국에서 1패만 기록하였다. 분산 버전은 1,202~1,920개의 CPU와 176~280개의 GPU로 구성되어 있다. 다양한 수의 CPU와 GPU에서 비동기 모드와 분산 모드로 테스트되었고, 한 수당 생각할 시간은 2초씩 배정되었다.

종류

알파고 리

구글은 대한민국의 바둑 프로 기사 이세돌 9단과 대국을 성사시켜, 2016년 3월 9일부터 15일까지 서울의 포시즌스호텔에서 구글 딥마인드 챌린지 매치(Google Deepmind Challenge match)를 개최하였다. 인간과 인공지능의 대결, 문화와 과학의 대결 등으로 수많은 화제 불러일으키며 역사적인 세기의 대결로 주목받은 첫 대국은 한국어와 영어로 공식 해설이 제공되어 유튜브(YouTube) 생중계를 통해 전 세계 8천 만명 이상이 시청하였다. 대한민국에서는 한국방송공사(KBS2)에서 생중계되었다. 이 게임에서 알파고는 세계 최정상의 프로 바둑 기사인 한국의 이세돌 9단과 겨루어 4:1로 승리했다. 이세돌 9단에게 승리한 이 버전을 알파고 리(AlphaGo Lee)라고 부른다. 알파고 리는 정책망을 통해 최적의 수를 찾고, 가치망을 통해 승률을 계산하는 방식으로 바둑을 두었다. 한국기원은 알파고가 정상의 프로기사 실력인 입신(入神)의 경지에 올랐다고 인정하여 프로 명예 단증(9단)을 수여하였다.

알파고 마스터

이후 알파고 리의 알고리즘을 업데이트하여 더 우수한 성능의 알파고 마스터(AlphaGo Master)를 만들었다. 2017년 5월 바둑 세계 랭킹 1위의 프로 기사인 커제(柯洁) 9단과 3번기 공개 대국에서 알파고 마스터가 승리하였다. 또한 중국 대표 5인과의 상담기(相談棋, 단체전)에서도 모두 승리하며, 세계에서 가장 강력한 인공지능 바둑 프로그램임을 다시 한번 각인시켰다. 중국기원도 알파고에게 프로기사 9단 칭호를 부여했다.

알파고 제로

2017년 10월 일체의 사전 학습이나 인간이 둔 기보를 참조하지 않고 제로 상태에서 인공지능 스스로 자체 강화학습을 통해 바둑을 공부한 알파고 제로(AlphaGo Zero)가 나왔다. 알파고 제로는 알파고 리와 대결에서 100:0으로 승리했고, 알파고 마스터와 대결하여 89:11로 승리했다.

전망

구글 딥마인드의 데미스 하사비스 최고경영자(CEO)는 알파고 제로를 끝으로 더 이상 인공지능 바둑 프로그램을 개발하지 않을 것이라고 선언했다. 하지만 그는 인공지능을 활용할 수 있는 새로운 분야로 계속 연구하겠다고 밝히면서, 앞으로 인공지능은 인류가 새로운 지시 영역을 개척하고 진리를 발견할 수 있도록 돕게 될 것이라고 말했다.

같이 보기