디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

알파고의 또다른 버전 알파제로에 대하여

Wert(222.118) 2017.12.07 00:26:18
조회 1675 추천 28 댓글 14

아래에 올려주신 딥마인드의 새로운 연구 결과 논문을 바둑에 관련된 내용을 중심으로 간단히 소개합니다. 논문의 주소는 다음과 같습니다.


https://arxiv.org/pdf/1712.01815.pdf


이번 연구는 알파고 제로에 사용된 알고리즘의 일반화 가능성, 즉 다른 분야에 적용 가능하다는 것을 보여주기 위하여 시도되었다고 생각합니다. 첫 번째 대상으로 가장 쉽게 적용이 가능하다고 생각되는 체스와 일본장기를 설정한 것은 당연하다고 보여집니다.


알파제로는 알파고 제로에 남아있던 바둑에 특수한 요소들, 예컨대 바둑판의 회전대칭과 거울대칭의 성격을 이용하는 기술(이를 이용하면 자료를 8배로 늘릴 수 있음)을 버리고 체스와 일본장기에는 반드시 나타나는 무승부의 가능성을 도입하는 등을 제외하면 거의 대부분의 기술을 알파고 제로에서 그대로 가져왔습니다. 오히려 실험 시간을 단축하기 위해 1수당 트리 탐색 수를 절반으로 줄이는 등 알고리즘을 가볍게 만들고 학습 방식도 단순화하였습니다. 기보를 생산하기 위해 1세대 TPU 5000개를 사용하고,  학습용으로 64개의 2세대 TPU를 사용하였습니다.


학습시간은 체스의 경우 8시간(44백만 판), 일본장기의 경우 12시간(24백만 판), 바둑의 경우 34시간(21백만 판)을 각각 사용하였습니다. 각 게임별로 1판당 소요시간의 차이가 많이 나는 이유는 1수당 제한시간이 다르기 때문인데(체스 0.04초, 일본장기, 0.08초, 바둑 0.2초) 이는 게임마다 복잡성에서 차이가 많이 나기 때문입니다. 


아래의 글에서도 소개되었듯이, 체스의 경우 학습이 시작된 후 4시간만에 2016년 인공지능 체스 챔피언인 스톡피시를 앞지르기 시작하였고, 일본장기의 경우 2시간만에 인공지능 일본장기 챔피언인 엘모를 능가하였습니다. 또한 바둑의 경우 8시간만에 알파고 리(돌파고)를 앞질렀습니다.


바둑용 알파제로의 성장곡선을 보면 대체로 20시간 전후해서 알파고 제로 20블럭/3일훈련 버전(elo 4350)을 앞지르기 시작한 것으로 보이는데 최종 버전의 알파제로와 알파고 제로 20블럭/3일훈련 버전의 1수당 1분 제한의 100번 승부에서 알파제로가 60승 40패로 60%의 승률을 기록하였습니다. 논문에 나와있는 elo 레이팅 공식에 대입해보면 알파제로 최종버전(34시간 훈련)의 elo는 4500점을 약간 상회하는 것으로 추정됩니다.


제가 주목하였던 것은 알파제로와 알파고 제로의 흑백 승률인데, 알파제로가 흑으로 29승 21패, 백으로 31승 19패를 기록하였습니다. 백이 매우 유리하다는 중국룰로 대국하였을텐데 알파제로의 흑백 승률이 비슷하게 나온 것은 제게는 의외였습니다. 100-200판으로 결론을 내리는 것은 성급하다고 생각되지만 흑백의 승률 차이가 크게 나는 것은 마스터나(elo 4858) 알파고 제로 40일 훈련버전(elo 5185) 처럼 극도로 높은 수준에서 나타나고 인간의 기력보다도 꽤 높은 elo 4500 수준에서도 중국룰은 백에게 크게 기울지 않는 것 같습니다. 


알파제로는 어떤 스타일의 바둑을 둘까?  알파고 제로처럼 묻지마 33을 좋아할까. 알파제로와 알파고 제로의 기보 100개가 가능한 빨리 공개되길 바랍니다.

추천 비추천

28

고정닉 2

3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
401215 릴라 개발자는 레이팅 6천짜리 인공지능만드는게 목표던데 [1] ㄹㄴㄹㄴ(182.218) 17.12.24 229 0
401213 바둑둘사람? ㅇㅇ(121.127) 17.12.24 73 0
401212 알파고가 33 파는 이유 [21] 듀에르(77.111) 17.12.24 879 3
401209 인공지능바둑 이름은 크레이지스톤이 제일멋있음 [2] ㄷㅎ(1.233) 17.12.24 227 0
401208 릴라 제로 얘를 두는거 보고 싶은데 [1] ㄹㄴㄹㄴ(182.218) 17.12.24 221 0
401206 인간기보가 들어간 인공지능프로그램은 아직 미완성... [1] ㅇㅈㅇㅇㅈ(121.170) 17.12.24 160 1
401205 릴라제로...... [1] zz(110.46) 17.12.24 323 0
401204 정의로운 갓현욱. 당시 남자기사 상대. 박지은,최정 실력평가 냉정하게 정립 ㅇㅇ(223.39) 17.12.24 145 0
401203 갓현욱이 남자기사에게 강했다는 박지은. 여자한테만 여포 최정 ㅇㅇ(223.39) 17.12.24 75 0
401202 박지은 17세에 조훈현이겼는데 최정은 27세에는 신진서 이기겠냐? ㅇㅇ(223.39) 17.12.24 89 0
401201 이현욱:최정은 그당시 박지은 만한 파괴력이 아직까지는 없다 ㅇㅇ(223.39) 17.12.24 129 0
401200 릴라는 릴라제로개발 선택한게 신의한수임 [1] bb(118.33) 17.12.24 275 2
401199 은둔고수 이 미친새끼 이제 노리타로 컨셉 변경했냐 [1] ㄹㄴㄹㄴ(182.218) 17.12.24 120 0
401198 아이 ㅅㅂ 한게임에서도 많이 지는데 뭔 알파고 마스터급이냐 [1] ㄹㄴㄹㄴ(182.218) 17.12.24 162 1
401197 크리스마스 알파고 툴 나오면, 프로들은 과연 좋아할까? [1] 은둔고수(223.62) 17.12.24 265 2
401196 한게임 인공지능 한돌 틀딱들이 알파고마스터 급이라던데 ㅋㅋ어이상실 [3] cc(175.199) 17.12.24 437 0
401195 요새 애새끼들은 왜 첫수를 우상귀에 안놓냐? [1] ㅇㅇ(202.14) 17.12.24 288 0
401194 근데 알파고면 대놓고 이름을 제로알파에 영국국기 쓸까 [3] ㅇㅇ(202.14) 17.12.24 222 0
401193 업퀴가 개미라면 강유찬은 개미핥기다 ㅇㅇ(223.39) 17.12.24 28 0
401192 업퀴벌레 굴욕어그로 폭로하는것도 적폐냐? ㅇㅇ(223.62) 17.12.24 57 0
401190 제로알파 대만국기 뜨는데? [4] ㅇㅇ(186.88) 17.12.24 420 0
401189 중국 굴욕외교 규탄하는것도 적폐냐? [6/1] ㅇㅇ(58.232) 17.12.24 336 20
401188 왕초보 바린이가 고수 형님들께 조언을 구합니다. [2] PeterPan갤로그로 이동합니다. 17.12.24 197 1
401187 현재 릴라 제로 근황 ㄴㄹㄴㄹ(182.218) 17.12.24 213 0
401186 제로알파 프로였네 [3] ㅇㅇ(223.39) 17.12.24 462 0
401182 묻지마 33침입에 대한 짧은 생각 [8] Wert(222.118) 17.12.24 747 15
401181 크리스마스 이브다 듀에르(175.223) 17.12.24 135 0
401180 제로알파의 정체 [1] ㅇㅇ(118.41) 17.12.24 248 0
401179 누가 릴라제로 바둑판 보이게 학습시키는 방법좀 알려주라... [4] Sij(110.13) 17.12.24 238 0
401178 몇살같냐??? [17] 슈퍼초딩갤로그로 이동합니다. 17.12.24 375 4
401177 조읍읍은 한국바둑 호흡기 떼려고 작심을 했냐 [6/1] ㅇㅇ(223.33) 17.12.24 816 14
401176 정준이 어린이 승부수 타이밍 봤냐? 물건이더라 ㅇㅇ(223.39) 17.12.24 99 1
401175 장혜연 쌍수했냐 [6] ㅇㅇ(202.14) 17.12.24 661 1
401174 근데 솔직히 zephago 아이디 삭제 당했다는게 말이 되냐? [4] ㅇㅇ(202.14) 17.12.24 353 3
401173 야 살빼는 법좀 알려줘라 [9] 슈퍼초딩갤로그로 이동합니다. 17.12.24 331 5
401172 제로알파 알파고 맞다고 밝혀지면 아이디 줄 생각 없냐 ㅇㅇ(202.14) 17.12.24 240 2
401168 릴라제로 성장속도가 굉장히 빠르다 [3] ㅇㅅㄷ(221.166) 17.12.24 415 0
401167 릴라 제로 30f49ac5 가 너무세네 ㅋㅋㅋㅋ [1] fssfd(182.218) 17.12.24 299 0
401166 릴라제로도 이젠 초반 33파기시작함 [3] ㅎㅇ(117.74) 17.12.24 556 4
401163 어린이명인전 결승보니 정준우 어린이가 최정보다 수읽기 잘할것 같더라 [1] ㅇㅇ(223.62) 17.12.24 224 4
401161 원래 바둑은 남이두는거 기보로보면 체감못함 [1] 젠충(118.18) 17.12.24 207 3
401160 제로알파의 착수방식 [1] ㅇㄷ(114.171) 17.12.24 344 1
401158 근데 만약 프로한테 이기면 ㅋㅋㅋ 그 프로 자격 박탈해야 하는거 아니냐 [1] ㄴㄹㄴㄹ(182.218) 17.12.24 150 0
401157 왜 자꾸 릴라 제로 레이팅 그대로 부르냐 ㅋㅋㅋ [1] ㄴㄹㄹㄴ(182.218) 17.12.24 136 0
401156 알파제로건 뭐건 타이젬프로들이랑 대국해봐야 안다니까 ㅁㄴㅇㄹ(153.156) 17.12.24 106 0
401154 제로알파 진거보니 막판에 ㅈㄴ 어이없는 수두고 패만들어주네 ㅋㅋㅋ [3] ㅇㅇ(223.62) 17.12.24 324 0
401153 제로알파기보보고 누가 평가좀해봐라 기력어느정도인지 [2] vv(128.53) 17.12.24 233 0
401152 근데 제로 알파 레이팅 3천 이하일수도 있따 ㄴㄹㄹㄴ(182.218) 17.12.24 108 0
401151 알파고제로 이긴 7단 젠충 아니냐 ㅋㅋㅋ [2] ㄹㄴㅇㄹㄴ(182.218) 17.12.24 317 0
401150 cgos 에 랭크된 레이팅을 왜믿음? gg(112.121) 17.12.24 102 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2