디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 구글의 현실적인 비디오 생성 모델

특갤용갤로그로 이동합니다. 2024.01.24 15:21:09
조회 3174 추천 29 댓글 24
														

Latest AI news 2024/01/24 최신 AI 뉴스


Lumiere: A Space-Time Diffusion Model for Video Generation

Lumiere: 현실적인 비디오 생성을 위한 시공간 확산 모델
Google Research

abstract


We introduce Lumiere -- a text-to-video diffusion model designed for synthesizing videos that portray realistic, diverse and coherent motion -- a pivotal challenge in video synthesis. To this end, we introduce a Space-Time U-Net architecture that generates the entire temporal duration of the video at once, through a single pass in the model. This is in contrast to existing video models which synthesize distant keyframes followed by temporal super-resolution -- an approach that inherently makes global temporal consistency difficult to achieve. By deploying both spatial and (importantly) temporal down- and up-sampling and leveraging a pre-trained text-to-image diffusion model, our model learns to directly generate a full-frame-rate, low-resolution video by processing it in multiple space-time scales. We demonstrate state-of-the-art text-to-video generation results, and show that our design easily facilitates a wide range of content creation tasks and video editing applications, including image-to-video, video inpainting, and stylized generation.

우리는 Lumiere를 소개합니다 -- 현실적이고 다양하며 일관된 움직임을 묘사하는 비디오를 합성하기 위해 설계된 텍스트-투-비디오 확산 모델입니다. 이는 비디오 합성에서 중요한 도전 과제입니다. 이를 위해, 우리는 비디오의 전체 시간적 기간을 모델의 단일 패스를 통해 한 번에 생성하는 시공간 U-Net 구조를 도입합니다. 이는 기존의 비디오 모델들이 먼 키프레임을 합성한 후 시간적 초고해상도를 적용하는 방식과는 대조적인데, 이러한 접근은 전역적인 시간적 일관성을 달성하기 어렵게 만듭니다. 공간적 및 (중요하게) 시간적 다운샘플링과 업샘플링을 배치하고 사전 훈련된 텍스트-투-이미지 확산 모델을 활용함으로써, 우리의 모델은 여러 시공간 척도에서 처리하여 전체 프레임률의 저해상도 비디오를 직접 생성하는 방법을 배웁니다. 우리는 최첨단 텍스트-투-비디오 생성 결과를 보여주며, 우리의 설계가 이미지-투-비디오, 비디오 인페인팅, 스타일화된 생성 등 다양한 콘텐츠 생성 작업과 비디오 편집 애플리케이션에 쉽게 적용될 수 있음을 보여줍니다.



24b0d121e09c28a8699fe8b115ef046b6a6899302b





https://lumiere-video.github.io/


 


https://arxiv.org/pdf/2401.12945.pdf

자동등록방지

추천 비추천

29

고정닉 14

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
415472 정보/ MIT와 IBM, 무차별 대입 수학에서 영리한 AI 방법 발견 [14] ㅇㅇ갤로그로 이동합니다. 02.04 1786 29
415467 일반 미용사 로봇 [16] 떼껄룩해적단갤로그로 이동합니다. 02.04 1873 20
415426 정보/ 폰노이만 구조를 뛰어넘는 신경망은 이미 있긴 함 [15] ㅇㅇ(211.202) 02.03 2246 23
415379 정보/ 제미나이 울트라 2월 7일 출시 ??? [10] 니지카엘갤로그로 이동합니다. 02.03 702 13
415363 정보/ 뇌에 기억을 주입하는게 어려운 이유.EU [13] ㅇㅇ(59.29) 02.03 3783 28
415358 정보/ LLM 랭킹 현황 [23] ㅇㅇ(110.35) 02.03 2699 23
415353 일반 포스텍, 100배 저렴한 센서 제작 기술 개발 [2] ㅇㅇ갤로그로 이동합니다. 02.03 963 19
415351 일반 아침에는 네발, 점심에는 두발, 저녁에는 세발인건 뭐야? [23] 제이시갤로그로 이동합니다. 02.03 2485 33
415333 정보/ ASML, 미드저니와 런웨이를 이용해서 광고를 만들다. [15] 은바다갤로그로 이동합니다. 02.03 1355 21
415315 정보/ GitHub Copilot Chat 공개 [8] ㅇㅇ­갤로그로 이동합니다. 02.03 1811 17
415309 정보/ AI에게 ‘맘마’ ‘멍멍이’부터 가르치면… [19] ㅇㅇ갤로그로 이동합니다. 02.03 2950 22
415283 일반 디즈니 애니매트로닉스 로봇 [8] ㅇㅇ(61.84) 02.02 1619 28
415276 정보/ 알트만이 스케일의 시대는 끝났다고 이미 말했었음 [9] ㅇㅇ(14.138) 02.02 913 10
415267 일반 래커센세 움짤 완성도있게 만들어봄 [11] ㅇㅇ갤로그로 이동합니다. 02.02 1953 32
415223 일반 "뉴럴링크보다 낫다"...中도 인간 뇌에 컴퓨터 칩 이식 시작 [ [16] ㅇㅇ갤로그로 이동합니다. 02.02 2464 29
415213 일반 “너의 존재가 이 세상에 알려지면…이젠” [22] ㅇㅇ(147.46) 02.02 3814 38
415208 정보/ 1000만 컨텍스트 길이의 언어모델에 대한 논문이 나옴 [11] ㅇㅇ(211.59) 02.02 1900 26
415205 일반 "뇌에 칩 이식... 이제 공부할 필요 없다고요?" " 생각하는 대로 움 [9] ㅇㅇ갤로그로 이동합니다. 02.02 2240 18
415178 일반 샘알트만이 투자한 핵융합회사 곧 실험로 지음 [7] ㅇㅇ갤로그로 이동합니다. 02.02 1529 30
415154 일반 메타 리얼리티랩스 적자폭 사상최대인듯 [10] ㅇㅇ(118.39) 02.02 1735 22
415150 정보/ 커즈와일 최신강연 우리는 인공지능과 하나된다 [15] ㅇㅇ갤로그로 이동합니다. 02.02 3040 39
415134 일반 요즘은 인공지능 훈련에 아기도 활용하네 [9] 슈퍼130클럽갤로그로 이동합니다. 02.02 2018 27
415090 일반 바드 프로 착시 테스트 [7] et갤로그로 이동합니다. 02.02 1982 21
415063 AI창 구글 바드로 생성해본 실사 사진 [7] 초존도초갤로그로 이동합니다. 02.02 2675 25
415062 일반 Bard 이름 변경 및 앱 출시 예정 [3] 12eueu(124.51) 02.02 1357 18
415046 일반 여자로봇을 아내로 산 만화.jpg [15] 007빵(175.194) 02.02 3018 25
415037 일반 구글 공식 트윗 [3] ㅇㅇ(116.120) 02.02 1941 20
415030 일반 딥마인드 Imagen2 출시 [6] ㅇㅇ갤로그로 이동합니다. 02.02 1584 22
415020 일반 openai가 AGI 감춘다는 썰이 제일 어이없음 [23] ㅇㅇ(58.127) 02.01 2557 33
414975 일반 아까 알트만 1년 발언 번역 좀 이상한 듯?? [3] ㅇㅇ(112.186) 02.01 1527 19
414967 일반 이쯤에서 다시 레카콜라 명언폭격 들어간다 [7] ㅇㅇ(1.230) 02.01 1216 25
414954 정보/ 세계경제포럼 알트만과 나델라 대화내용 [22] oo(39.124) 02.01 2702 22
414946 일반 주커버그 청문회에서 난리났었네 [7] ㅇㅇ(113.59) 02.01 1522 17
414939 정보/ 국23내 첫 수소액화플랜트 준공 [2] 007빵(175.194) 02.01 1226 23
414928 일반 뉴럴릴크 특갤 공식선언문.txt [22] ㅇㅇ(1.243) 02.01 2840 50
414927 일반 여기 철학토론갤아님 [13] ㅇㅇ(1.243) 02.01 1578 35
414907 일반 GPT4응용하기(마크다운) [11] et갤로그로 이동합니다. 02.01 1240 20
414903 일반 그냥 미국에서 신기술이 많이 나오니까 관심이 있는건데 [10] ㅇㅇ갤로그로 이동합니다. 02.01 2613 33
414874 정보/ 비대면 약배송 기정사실화…시범사업 손질 '초읽기 [13] 연맛갤로그로 이동합니다. 02.01 1415 34
414867 정보/ 니지6 '그림체 일관성' 기능 출시 [29] ㅇㅇ갤로그로 이동합니다. 02.01 3739 42
414857 정보/ 니지저니6 beta 향후 업데이트 계획 [7] ㅇㅇ갤로그로 이동합니다. 02.01 1279 28
414828 일반 Open ai 생물학적 위험에 관한 연구 [7] ㅇㅇ(116.120) 02.01 1372 18
414822 정보/ AI는 인간의 수면을 모방하여 학습한 내용을 더 잘 유지할 수 있습니다. [27] ㅇㅇ갤로그로 이동합니다. 02.01 2520 25
414730 일반 오늘 올라온 테슬라봇 영상 보면 모션캡처 부품이 달려 있음 [4] ㅇㅇ갤로그로 이동합니다. 01.31 2127 32
414728 일반 구글 ceo "제미니 울트라 곧 출시" [24] ㅇㅇ갤로그로 이동합니다. 01.31 3091 27
414720 일반 GPT4 커스텀 인스트럭션 기능 꿀팁 [3] ㅇㅇ(61.34) 01.31 1420 21
414716 일반 특붕아.. 이리와서 앉아봐라 [15] et갤로그로 이동합니다. 01.31 2284 30
414677 일반 현재 구글 oai 상황 [7] ㅇㅇ갤로그로 이동합니다. 01.31 2536 34
414672 일반 00년대생은 생애소득 40% 세금으로 내야.gisa [7] ㅇㅇ갤로그로 이동합니다. 01.31 1637 21
414656 일반 UPS 1만2000명 감원 AI덕분에 가능.news [5] ㅇㅇ갤로그로 이동합니다. 01.31 350 12
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2