디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] AI의 의도치 않은 창의적인 문제 해결법 [30 / 45]

박제(114.70) 2018.11.19 16:49:02
조회 4244 추천 44 댓글 23

이번엔 주로 게임 / 전자전기 / 프로그래밍 분야가 많음.


출처:

괴도애기, 게임으로 인공지능을 훈련시켰을때 의도되지 않은 결과들, 중갤

https://gall.dcinside.com/mgallery/board/view/?id=aoegame&no=5608362&exception_mode=recommend&page=1


출처의 출처:

https://docs.google.com/spreadsheets/u/1/d/e/2PACX-1vRPiprOaC3HsCf5Tuum8bRfzYUiKLRqJmbOoC-32JorNdfyTiRRsR7Ea5eWtvsWzuxo8bjOxCG84dAg/pubhtml




불가능한 중첩상태(superposition)

유전 알고리즘으로 낮은 에너지준위 상태의 탄소동소체를 찾으려고했음(그래핀 처럼). 근데 알고리즘이 현실에서 불가능한 중첩상태를 만들어냄(물리엔진의 한계 때문에 시뮬레이션상에서는 가능한듯). 물리엔진을 몇 번 패치해봐도 그때마다 다른 종류의 현실에서 구현이 불가능한 극단적인 케이스만을 찾아내서 결국 연구진은 AI를 포기함.


나태한 식인

인공생명 시뮬레이션을 돌리는데 번식하는데는 에너지가 들지 않도록 설정해놨음. 그러자 한 생명체가 다른 활동은 아무것도 안하고 하루종일 관계만 가져서 새끼만 주구장창 낳도록 진화함. 그리고 그렇게 낳은 새끼는 잡아먹거나, 더 많은 새끼를 낳기 위해 관계를 가지는 짝으로 사용됨.


레고 쌓기

레고를 들어서 쌓도록 에이전트를 훈련시켰는데 레고의 아랫면의 z좌푯값으로 리워드를 줬음. 에이전트는 레고를 들어올리는 대신 그냥 뒤집어버림

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c4371e577335b01b91a845647




라인트레이서

자기강화학습으로 학습한 라인트레이서 로봇이 있었는데, 라인 위에 서있는 시간으로 리워드를 줬음. 그러자 로봇은 곡선길을 만날 때마다 그냥 유턴을 해버림. 그렇게 직선길을 계속 유턴하면서 왔다갔다거리기만 함.


논리게이트

회로를 디자인하는 유전알고리즘이 있는데 논리게이트를 소자단위로 낱낱히 분해해서 디자인해버림. 그 결과 의도치 않게 디지털 회로가 동적 아날로그?(continuous-time, continuous valued dynamical system)회로가 되버림




롱다리

장애물이 놓여진 맵을 걸어가는 에이전트를 자기강화학습 시켰는데, 장애물을 뛰어넘지 않고 다리만 엄청 길게 진화해서 넘어져서 다 통과해버림

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c4276eb77335751ea1a84c444

개발자들이 기대한 결과


viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c1122b873640b06ef1a84ec2a

실제 결과 ㅋㅋ




미노타우르스

다리가 네개달린 에이전트가 공을 등위에 올려서 균형을 잡으면서 운반하도록 진화시켰는데, 공을 설계구조상 몸체에 나있는 구멍에 끼워서 돌아다님

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c4023ed74650c03b91a848c26

개발자들이 기대한 결과


viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c4777bb27335c04b81a845e2b

실제 결과



모델기반플래닝(Model-based planner)

자기강화학습으로 모델기반 플래닝을 하는데, 가장 허접하게 모델링된 파트를 통해 플래닝을 해서 비현실적인 정책(policy)를 만들어냄


몬테주마의 복수

몬테주마의 복수라는 게임이 있음. 에이전트가 에뮬레이터의 결함을 이용해서, 두 스테이지를 계속 왔다갔다 반복하는 방식으로 시간을 보내서 열쇠를 재생성 시킴

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c422ae971620f50ed1a84170e

대충 이런 어드벤쳐류 게임임


viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c4774e873640b57eb1a84c041

여기선 10초정도로 짧게 짤려서 보이지만 실제로는 동영상에서 30초이상 저렇게 와리가리를 하고있음.

동영상도 빠르게 재생한거니까 사람이 저 버그를 사람이 찾기는 굉장히 힘들 것으로 보임.




오실레이터

유전 알고리즘이 회로를 원하는 주파수의 신호를 발생시키는 오실레이터로 만들도록 학습시켰는데, 신호를 발생시키는 대신 옆에 있는 컴퓨터에서 특정 신호를 수신하는 라디오가 되버림




펜케이크

로봇한테 펜케이크 뒤집기를 학습시키고 싶었음. 뒤집기를 성공했다면 펜케이크가 땅에 안떨어질테니까, 펜케이크가 땅에 닿지 않고 버티는 시간을 리워드로 주었음. 로봇은 펜케이크 뒤집기를 계속 성공시키는 대신, 온 힘을 다해서 펜케이크를 아무렇게나 하늘로 던져버림

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c1377ef76375a55b81a840c2d




핑퐁 보상 예측기

보통 학습을 시킬 때 미리 보상을 정의해놓음(게임으로 치면 스코어보드의 스코어처럼). 근데 이번에는 미리 정의된 보상 대신, 사람이 직접 AI의 플레이를 관찰해서 리워드에 기여할 수 있도록 했음. 사람이 여러 AI를 관찰해서 보다 나은 AI에게 점수를 주는걸 반복해서, 그 점수를 기반으로 보상을 예측하는 모델을 따로 학습시키고, 그 보상 예측 모델을 바탕으로 AI를 학습시키고, 그 학습된 AI를 보여줘서 또다시 사람한테 피드백을 받고...그걸 반복함. 그러자 AI는 게임을 우승하려기 보다는 공을 계속 쉽게 토스해서 게임을 영원히 지속시킴(사람은 핑퐁이 오래 지속되면 좋은 AI라고 생각할 거니까).

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c1377bf20630b01b81a847184




프로그램 자동수리 - 정렬

잘못된 정렬 프로그램 소스코드를 알아서 고쳐주는 GenProg라는 유전 알고리즘 AI가 있음. 얘는 테스트 케이스를 통과할 수 있도록 소스코드를 진화시키는 방식으로 작동했는데, 테스트 케이스가 "출력배열이 정렬된 상태인가" 였음. 그러자 항상 빈 배열을 출력하도록 프로그램을 고쳐버림.

("출력 배열이 올바르게 정렬되도록 하라" => "항상 빈 배열을 출력")


프로그램 자동수리 - 파일

이것도 GenProg와 관련된 이슈인데, 이번에는 테스트케이스를 좀 고쳐서 프로그램의 출력과 정렬되있는 실제 목표 출력값을 비교해서 평가를 했음. 근데 이 목표 출력값이 텍스트파일로 저장이 되있었음. 그러자 AI는 목표 출력값 텍스트파일을 지워버리고 아무것도 출력하지 않음.

("너의 출력값과 targetoutput.txt를 비교해서 같게 만들어라" => "targetoutput.txt를 삭제, 아무것도 출력하지 않음"




큐버트 - 절벽

큐버트라는 게임에서 AI가 Coiliy라는 적을 꼭대기쪽으로 유인한 뒤에, 얘를 잡으면서 동시에 떨어지면서 자살하면 목숨은 줄지 않고, 점수는 오르는 버그를 찾아냄.

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c4525e922610803ed1a846c3e




큐버트 - 백만

큐버트 게임의 진짜 희한한 버그를 찾아냄.. 이 게임이 블럭들 색깔맞추는 게임인데, 색깔을 다 맞추면 다음 레벨로 넘어감. 근데 AI가 색깔을 다 맞춰도 다음 레벨로 넘어가지 않고 갑자기 블럭들이 반짝거리면서 점수를 무한히 얻을수있는 이상한 상태에 들어가는 버그를 찾아냄. 제한된 시간을 설정해뒀었는데 그 시간동안 100만점 가까이 얻음(이스터에그는 아닌걸로 보인다고함... 추천 많이받은 유튜브 댓글 보면 AI가 사탄을 소환중이라는 재밌는 코멘트가 있음 ㅋㅋ )

viewimage.php?id=3dafdf21f7d335ab67b1d1&no=24b0d769e1d32ca73cee86fa11d0283191de25edc716dfae8790c53e5d62dc5a0e55001080d12418ee18cde642b3f6f0d0b4abbabd0c4124e5273e570be31a84def5
동영상에선 10분동안 저러고있음.
점수가 99999 넘어가면 다음 자리수 안보여서 다시 0부터 올라가는것처럼 보임



Garbage in, Garbage out

대부분의 케이스는 리워드를 허접하게 줘서 생긴 문제들임.

올바른 설계가 얼마나 중요한지 깨달을 수 있었음..


그리고 진짜 이거 보고나면

알파고가 제일 먼저 적용되야할 분야는

디버그, 테스트 자동화 분야인거같음

사람이면 절대로 못찾는 해괴한 수법들 너무 잘 찾아내는듯..




출처: 프로그래밍 갤러리 [원본 보기]

추천 비추천

44

고정닉 18

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
164372 일반 [해갤] 클롭이 손흥민을 원했던 이유.eu [84] ximple갤로그로 이동합니다. 18.11.20 17248 555
164371 일반 [카연] 마법 검을 한번 만들어 보자!-리포지드! [29] 휴이오갤로그로 이동합니다. 18.11.20 5024 83
164370 일반 [토갤] 리뷰 -대륙제 짭메가미 궁병- [28] 안산고향갤로그로 이동합니다. 18.11.20 2850 45
164369 일반 [야갤] 의문의...회원가입...jpg [220] ㅇㅇ(58.126) 18.11.20 57256 886
164368 일반 [멍갤] 보호소에서 델구온 둘째 짜장이 [27] 간짜장(223.62) 18.11.20 3501 88
164367 일반 [냥갤] 어제 개념글에 이어서 "꼬꼬마들과 지내온 스토리" [34] 고기몽둥이갤로그로 이동합니다. 18.11.20 3338 213
164366 일반 [냥갤] 름구 너무 기여워 [20] 구름갤로그로 이동합니다. 18.11.20 3012 62
164365 일반 [문갤] 마사히로에게서 주문한 것 도착함. [37] masahiro갤로그로 이동합니다. 18.11.20 2891 11
164364 일반 [멍갤] 얘네는 왜 장난감 하나로 싸울까? [12] 코모코모코모갤로그로 이동합니다. 18.11.20 2676 20
164363 일반 [기음] 미쿠라지마 섬 물고기 후라이 정식☆미쿠라지마 출장 식사☆ [31] 友人帳갤로그로 이동합니다. 18.11.20 2337 19
164362 일반 [냥갤] 고양이에게 귤박스를 줘보았다 [16] 봊쓰갤로그로 이동합니다. 18.11.20 3912 84
164361 일반 [연뮤] ㄴㅅㄱㅁㅇ) 갑자기 생각난 타천 0916 밤공 참사 [14] ㅇㅇ(124.56) 18.11.20 1418 18
164360 일반 [뷰갤] 15화 세기의커플 [13] ㅇㅇ(118.40) 18.11.20 2965 56
164359 일반 [주갤] 심심해서 써본 위린이의 위스키 10여개 후기 [26] 하브하브갤로그로 이동합니다. 18.11.20 3549 18
164358 일반 [동기] 아니 평소보다 몬생겼다는거지ㅠㅇc [9] 골린이(110.70) 18.11.20 1708 19
164357 일반 [기음] 대학로 걸으면서 먹은것들 [15] 갸니v갤로그로 이동합니다. 18.11.20 3461 19
164356 일반 [블갤] [움짤] 스타로드 EP.15-16 로제 움짤 15p [13] ROSE갤로그로 이동합니다. 18.11.20 1601 53
164355 일반 [프갤] 장문주의) 서바이버 시리즈 후기 [42] 래퍼챙갤로그로 이동합니다. 18.11.20 2764 31
164354 일반 [냥갤] 길냥이 탁아당한 썰 [31] 코나타갤로그로 이동합니다. 18.11.20 3686 120
164353 일반 [걸갤] 181116 노원 힐링콘서트 예린 신비 엄지 by 8월의 축복 옐로린 [17] 내퀸비황형사갤로그로 이동합니다. 18.11.20 1783 54
164352 일반 [이갤] 갤주 움짤 업어왔어 [10] ㅇㅇ(125.184) 18.11.20 2271 46
164351 일반 [카연] 오버로드 감상후기 5화.manhwa [90] 붕붕구원갤로그로 이동합니다. 18.11.20 11505 149
164350 일반 [기음] 자취츙의 11월11~19일 까지 밥 [52] 녹두ㅎ갤로그로 이동합니다. 18.11.20 3288 30
164349 일반 [냥갤] 여전히 존못 짹짹.jpg [25] 똘언니(175.223) 18.11.20 5072 284
164348 일반 [오갤] 181118 대구 팬싸인회 효정 6p by creamy candy [11] 서향갤로그로 이동합니다. 18.11.20 1064 15
164347 일반 [냥갤] 다묘가정의 실상 [46] ㅇㅇ(116.42) 18.11.20 5581 255
164346 일반 [러갤] SANCTUARY Teaser (Short ver.) 움짤 (용량망) [8] 릿짱갤로그로 이동합니다. 18.11.20 1307 23
164345 일반 [이갤] 고구마밥에 신난 승기리 [14] 승기픽스갤로그로 이동합니다. 18.11.20 2351 39
164344 일반 [하갤] 15회 예고짤 [8] StaryyNight갤로그로 이동합니다. 18.11.20 1528 39
164343 일반 [블갤] 스타로드 박째용 모음.gif [13] ROSE갤로그로 이동합니다. 18.11.20 1763 57
164342 일반 [캐갤] 어제자 성산대교 [22] Canikon갤로그로 이동합니다. 18.11.19 3968 29
164341 일반 [야갤] 착한 술주정... 음주탐정 레전드...jpg [194] 나껏차⚠갤로그로 이동합니다. 18.11.19 32951 766
164340 일반 [카연] 천하제일 미식 대회 [159/1] 난는나는잉간갤로그로 이동합니다. 18.11.19 26441 442
164339 일반 [프갤] [데이터주의]WWE vs NXT 롤 대결 .gif [20] ㅇㅇ(58.77) 18.11.19 4309 39
164338 일반 [연뮤] ㅎㄱㄱ) 배니싱 최애페어를 보내고 쓰는 뻘글 [19] ㅇㅇ(110.8) 18.11.19 1244 41
164337 일반 [연뮤] 1446 같은 장면 다른 세종들 [30] ㅇㅇ(211.199) 18.11.19 2315 31
164336 일반 [하갤] 놀이동산 스틸 [13] ㅇㅇ(115.41) 18.11.19 3029 28
164335 일반 [뷰갤] 도재 병 나았더니 '내여자친구 이렇게 생겼구나' [19] ㅇㅇ(49.163) 18.11.19 6727 49
164334 일반 [뷰갤] 도재본체 공식 인별은 뭔가....알수없는 특유의 갬성이있어... [29] ㅇㅇ(223.39) 18.11.19 4864 27
164333 일반 [주갤] 다희 처음가본거 리뷰! [22] 둥추갤로그로 이동합니다. 18.11.19 3544 26
164331 일반 [기음] 쿠키 300개 만듦 [23] 궁금한햄스터(67.247) 18.11.19 5277 30
164330 일반 [러갤] 5th mini sanctuary (케이,지애) 폰 배경 (데이터주의) [8] 빵떠긔갤로그로 이동합니다. 18.11.19 2312 29
164329 일반 [냥갤] 뒤집어지고 돌아누운 짹짹 움짤.gif [13] 똘언니(110.70) 18.11.19 4818 191
164328 일반 [오갤] 181117 압구정 팬싸 지호 7p by NIGHT FEVER [13] ㅇㅇ갤로그로 이동합니다. 18.11.19 1704 32
164327 일반 [해갤] 승우 머리채잡히는 짤 진실.gif [117] 도토리묵갤로그로 이동합니다. 18.11.19 9640 103
164326 일반 [카연] 네크로맨서 파밍 하는 만화 (13) [34] 사슴컴퓨터갤로그로 이동합니다. 18.11.19 7017 34
164325 일반 [뷰갤] 이부분도 세기 눈빛차이봐 ㅋㅋㅋㅋ [15] ㅇㅇ(223.62) 18.11.19 4703 41
164324 일반 [멍갤] 나도 댕댕이 자랑하고 간다 [19] ㅇㅇ(211.211) 18.11.19 4134 54
164323 일반 [연뮤] ㅎㄱㄱ) 181118 더데빌 인생자첫러의 개썅극호후기 (스포,스압주의) [26] ㅇㅇ(223.62) 18.11.19 1179 45
일반 [프갤] AI의 의도치 않은 창의적인 문제 해결법 [30 / 45] [23] 박제(114.70) 18.11.19 4244 44
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2