디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] 월드 모델링을 위한 확산: Atari에서는 시각적 세부 사항이 중요합니다

ㅇㅇ(125.191) 2024.05.22 14:20:05
조회 60 추천 0 댓글 0
														

https://arxiv.org/abs/2405.12399


https://github.com/eloialonso/diamond



29b4d12beadc3c996fb8d3bb029f2334db5b1121fa21dd142bfeb633a251


월드 모델은 안전하고 샘플 효율적인 방식으로 강화 학습 에이전트를 훈련하기 위한 유망한 접근 방식을 구성합니다. 최근 세계 모델은 주로 환경 역학을 모델링하기 위해 개별 잠재 변수의 시퀀스에서 작동합니다. 그러나 컴팩트한 이산 표현으로의 압축은 강화 학습에 중요한 시각적 세부 정보를 무시할 수 있습니다. 동시에 확산 모델은 이미지 생성을 위한 지배적인 접근 방식이 되었으며, 이산 잠재성을 모델링하는 잘 확립된 방법에 도전하고 있습니다.


이러한 패러다임 전환에 힘입어 우리는 확산 세계 모델에서 훈련된 강화 학습 에이전트인 DIAMOND(DIffusion As a Model Of eNvironment Dreams)를 소개합니다. 우리는 세계 모델링에 적합한 확산을 만드는 데 필요한 주요 디자인 선택을 분석하고 개선된 시각적 세부 정보가 어떻게 에이전트 성능 향상으로 이어질 수 있는지 보여줍니다. DIAMOND는 경쟁력 있는 Atari 100k 벤치마크에서 평균 인간 표준화 점수 1.46을 달성했습니다. 월드 모델 내에서 완전히 훈련된 에이전트를 위한 새로운 최고 수준입니다. 세계 모델링 확산에 대한 향후 연구를 촉진하기 위해 우리는 이 https URL 에서 코드, 에이전트 및 플레이 가능한 세계 모델을 공개합니다 .





추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
17958 일반 이번주에 보이스버전 나온다고 하지않앗음? [1] ㅇㅇ(222.96) 23:24 13 1
17957 일반 1월 자살 사망자 전년 대비 34% 증가‥"유명인 자살 영향" [3] 특술람갤로그로 이동합니다. 22:48 23 0
17956 일반 테드짱 ㅇㅅㅇ 선갤러(122.36) 22:48 14 0
17955 일반 agi가 ubi로 끝나지 않길 바라는 [4] 특술람갤로그로 이동합니다. 22:19 52 0
17954 일반 특갤 원숭이들 발작하는거 꿀잼 ㅋㅋㅋ ㅇㅇ(118.235) 22:13 27 2
17953 일반 기본소득은 절대로안나옴 ㅇㅇ(14.42) 21:44 27 2
17952 정보글 레이 커즈와일 신간 번역 [2] 특술람갤로그로 이동합니다. 21:08 60 0
17951 일반 1인1치킨 쉽다는 사람 진짜 먹어본게 맞긴함? 선갤러(39.112) 20:52 19 0
17950 일반 6월 18~19일까지 4일 남았으셈 [3] 선갤러(125.191) 20:42 58 0
17949 정보글 극단적인 장기 계획을 위해 가치 반복 네트워크를 5000개 레이어로 확장 [1] 선갤러(125.191) 20:38 29 0
17948 일반 하룻밤의지식여행점해야될거같다 (61.105) 20:31 18 0
17947 일반 전 구글 차이나 사장 "2027년까지 AI가 전 세계 일자리 절반 대체" [1] 선갤러(125.191) 20:04 44 0
17946 일반 특갤은 특이점이 온다 갤러리x = 이슬람이 온다 갤러리로 바꿔라 ㅋㅋ [1] 선갤러(211.245) 19:45 54 5
17945 정보글 AGI를 구축할 수 있나요? 사라 워커와 렉스 프리드먼 선갤러(125.191) 19:45 27 0
17944 정보글 세인레그 이탈리아 인터뷰 [2] 선갤러(125.191) 19:30 64 1
17943 일반 기본소득 내놔!! [5] 선갤러(125.191) 18:28 68 1
17942 일반 코큰 아저시 2032년 agi 온다 ㅋㅋ [4] ㅇㅇ(172.226) 18:08 113 2
17941 일반 북한 풍선 못막은 이유가 서울에 군부대가 없어서 그럼 [2] 선갤러(121.131) 16:46 42 0
17940 일반 레이커즈와일이 책 팔려고 [1] (61.105) 16:26 62 0
17939 일반 조선빵쯔들 [8] 빵쯔박멸(223.62) 15:44 83 1
17938 일반 gpt5 나오기 전에 모든 예상 접어두기로 함 [2] ㅇㅇ(118.235) 15:32 62 0
17937 일반 레커는 그냥 이론가지 [2] 선갤러(222.98) 15:14 59 1
17936 일반 펄펄 끓는 중국…"일부선 지표온도 70도↑·신발 안신으면 화상 선갤러(125.191) 14:35 37 0
17935 일반 레커 책은 그냥 라면받침이나 땔감이라고 보면 됨 [1] ㅇㅇ(118.235) 13:52 79 7
17934 일반 서울에서 군복‏무 한게 은수저가 아니면 머임? [2] 선갤러(49.170) 13:32 30 0
17933 일반 치타가 있잖아 ㅇㅇ(172.226) 13:07 20 0
17932 정보글 스노든, 오픈AI의 전 NSA 국장 이사회 임명에 '맹비난' [8] 선갤러(125.191) 11:16 113 2
17931 정보글 레이커즈와일 "우리는 그들과 결합할 것" [4] 선갤러(125.191) 11:03 157 3
17930 일반 다이슨스피어 후보 발견 선갤러(125.191) 10:54 47 0
17929 정보글 openai 영리회사 전환 고려중 [4] 선갤러(125.191) 10:31 100 2
17928 일반 술담배는해도 특슬람은 하지마셈 [4] ㅇㅇ(211.234) 09:39 100 6
17927 일반 기본소득은 언제나오셈 [7] ㅇㅇ갤로그로 이동합니다. 08:55 75 0
17926 정보글 메타 "유럽서 '메타 AI' 당분간 출시하지 않을 것" [1] 선갤러(125.191) 07:49 55 0
17925 일반 2024 여름 gpt5 [4] ㅇㅇ갤로그로 이동합니다. 07:34 80 1
17924 정보글 비동기식 탄도 가역 컴퓨팅이 가능함 증명됨 [4] 특술람갤로그로 이동합니다. 07:29 74 0
17923 일반 99%는 현재 상황을 이해 못하는중 [3] 특술람갤로그로 이동합니다. 07:25 92 0
17922 정보글 MIT의 새로운 기술은 전체 뇌 반구를 3D로 자세히 보여줍니다. [4] 특술람갤로그로 이동합니다. 07:21 70 0
17921 정보글 엔비디아 340b 오픈소스 발표 [11] 선갤러(125.191) 06:57 86 2
17920 일반 agi 가 안오고 세상이 [1] (61.105) 02:31 62 1
17919 일반 선형쭝쭝이냐 특이쭝쭝이냐 하나도 안중요해여 ㅇㅅㅇ [3] 선갤러(122.36) 00:06 57 1
17918 일반 솔직히 말하자면 나는 특이점이 실존하는지도 모르겠음 [3] Ausus2갤로그로 이동합니다. 06.14 130 7
17917 일반 박제 특술람갤로그로 이동합니다. 06.14 47 0
17916 일반 특이점은 안 온 다 [1] ㅇㅇ(221.157) 06.14 74 0
17915 일반 gpt 시대 대입제도 좀 바꿔야 하지 않나? [1] 선갤러(121.190) 06.14 61 0
17914 일반 프로젝트 gobi = gpt-4o [3] 특술람갤로그로 이동합니다. 06.14 112 0
17913 일반 특갤 근황 선갤러(36.38) 06.14 64 2
17912 일반 팩트)선형갤에서 활동하는 특슬람들은 [2] 선갤러(1.221) 06.14 161 13
17911 일반 갤 럭 시 = 찐 따 폰 임 선갤러(14.35) 06.14 17 0
17910 일반 특갤 버러지들 단체로 지랄발작중 [2] ㅇㅇ(106.101) 06.14 223 16
17909 일반 빌게이츠가 밀어주는 최예진 인터뷰 영상있네 [4] 인안나갤로그로 이동합니다. 06.14 112 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2