디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] MS, ‘대화하는 얼굴’ AI 공개앱에서 작성

ㅇㅇ(116.120) 2024.04.19 16:23:04
조회 397 추천 5 댓글 7
														

톰스가이드에 따르면 해당 기술은 한 장의 초상화 사진과 오디오 파일만으로 고도의 리얼리즘을 구현한 입모양 동기화와 얼굴 움직임을 담은 영상으로 변환한다.

VASA-1은 현재 연구용 프리뷰 단계로, 마이크로소프트 연구팀 외에는 아직 사용해볼 수 없다. 그러나 공개된 데모 영상은 이미 품질 면에서 높은 수준을 보여주고 있으며, 기존 립싱크 기술과 비교하여 입 주위의 잔상 없이 자연스러운 움직임을 구현해내고 있다. 이 모델은 가상 캐릭터의 애니메이션화뿐만 아니라 실제 사진을 대상으로도 작동하는 가능성을 보여준다.

아울러 VASA-1은 고정된 전면 이미지가 아닌 다양한 방향의 샷에도 적용이 가능하며, 사용자의 눈동자 방향, 머리의 거리, 심지어 감정까지 입력으로 받아 표현할 수 있는 높은 조절 능력을 갖췄다. 이 기술의 주요 사용 사례로는 게임 내 AI 구동 NPC의 자연스러운 립싱크 개선, 소셜 미디어용 가상 아바타 제작, AI 기반 영화 제작 등이 있을 수 있다. 

현재 이 모델은 512x512 픽셀 이미지를 초당 45프레임으로 생성할 수 있으며, 이 작업은 데스크탑급 엔비디아 RTX 4090 GPU를 사용해 약 2분이 소요된다. 연구 단계에 머물러 있는 이 기술이 개발자에게나 대중에게 공개될 가능성은 아직 미지수이다.


자동등록방지

추천 비추천

5

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
474044 일반 gpt4o별로란애들은 ㅇㅇ갤로그로 이동합니다. 06:37 130 0
474043 일반 개발자 연설 타임은 듣는 사람 없나? [2] ㅇㅇ(14.63) 06:23 82 0
474042 일반 1.5 flash 괜찮긴한듯 [1] ㅇㅇ(119.77) 06:20 120 0
474041 일반 구글 어쩌고 하던 삼성 알바들 이제 없나 ㅇㅇ(218.150) 06:17 121 3
474039 일반 과연 오픈ai가 이번에 떡상을 하곘나? [35] ㅇㅇ(117.20) 06:05 492 0
474037 일반 진짜 사람같아 질수록 걱정하는 사람들이 많네 [6] ㅇㅇ(117.20) 05:40 353 0
474036 일반 플라잉 카는 언제 나오려나 [2] ㅇㅇ(1.247) 05:25 114 0
474035 일반 오늘도 플랫한특갤ㅋㅋㅋㅋㅋ ㅇㅇ(222.102) 05:23 91 0
474033 일반 애초에 이든은 몇주째 부재중이었는데 ㅋㅋㅋ ㅇㅇ(220.118) 05:20 77 0
474032 일반 특이점 이후엔 대략 중동 산유국 처럼 되지 않을까? [3] ㅇㅇ(175.192) 05:18 149 0
474031 일반 이든 파딱 짤렸노 ㅋㅋㅋㅋ [1] ㅇㅇ(220.126) 05:17 187 0
474030 일반 특갤보면 양띵생각난다 ㅇㅇ(39.124) 05:14 93 0
474029 일반 진지하게 구글 ai스튜디오에서 1.5플래시 ㄱㄱ [2] VV(223.38) 05:14 166 3
474028 일반 구글이 컨텍스트 렝쓰 늘리는 이유가 [2] ㅇㅇ(218.153) 05:11 151 1
474027 일반 gpt 4o 솔직히 별론데? [1] ㅇㅇ(180.66) 05:10 245 0
474026 일반 특갤의상징 사진 [2] ㅇㅇ(1.239) 05:10 175 0
474025 일반 특이점이온다 특이점은웃고있다 [1] ㅇㅇ(119.207) 05:09 34 0
474024 일반 근데 AI의 발전이 꼭 유토피아만 있는건 아니지 않음? [7] ㅇㅇ갤로그로 이동합니다. 05:06 174 1
474022 일반 ?됨게떻어 황근 주갤 일와즈커이레 [4] ㅇㅇ(211.118) 05:03 70 0
474021 일반 귀여운 땀르쿤 보고가삼 [1] ㅇㅇ(222.101) 05:01 98 1
474020 일반 갤주 성경 거꾸로 읽으니 읽을만하네 ㅇㅇ(175.192) 05:01 65 0
474019 일반 gpt gpt gpt!! ㅇㅇ(118.34) 05:00 25 0
474018 일반 컴공인데 네트워크 통신쪽으로 틀어야겠다. [9] ㅇㅇ(59.26) 04:59 228 0
474017 일반 야옹야옹 오픈ai ㅇㅇ(39.115) 04:58 48 0
474016 일반 제미나이 1.5 Flash 이거 1.5 Pro 썼던 사람이면 개이득임 [14] VV(223.38) 04:57 273 0
474015 일반 gpt4o 신기능 언제열림? 사만다 [1] ㅇㅇ(121.147) 04:56 128 0
474014 일반 근데 gpt발전하면 개랑도 대화할수있지않을까 ㅇㅇ(1.240) 04:50 39 0
474013 일반 앤트로픽은 발표회 언제함? zsefa갤로그로 이동합니다. 04:48 50 0
474012 일반 구글 쉴드가 아직도 있네 ㅋㅋ ㅇㅇ(58.78) 04:43 91 0
474011 일반 구글에.애이아이는.은제.애이.지.아이.달성하나요 [1] 떼껄룩해적단갤로그로 이동합니다. 04:40 98 0
474010 일반 구글은 여전히 병신이네 ㅇㅇ(125.134) 04:37 79 0
474009 일반 제미나이 진짜 존나 웃기네ㅋㅋㅋㅋㅋ [9] ㅇㅇ(118.223) 04:34 621 17
474008 일반 요새 기술로는 마이크로 카메라를 안경에 심는거야 일도 아니지 [2] ㅇㅇ(175.192) 04:32 118 0
474007 일반 유튜브 뉴스보니까 그놈의 "무섭다" [12] 껌젖갤로그로 이동합니다. 04:31 346 2
474006 일반 사실 제미니도 oai가 만든거임 ㅇㅇ(106.101) 04:27 121 0
474004 일반 구글과 OAI는 다른 전략을 쓸수밖에없는데 [5] ㅇㅇ(218.153) 04:25 229 0
474003 일반 삼성이 살려면 이 방법밖에 없다 ㅇㅇ(58.78) 04:24 151 0
474002 일반 현재패턴대로면 미래가 보임 맘보토갤로그로 이동합니다. 04:24 186 0
474001 일반 진짜 1.5 울트라도 없는 건 충격적이다 ㅇㅇ갤로그로 이동합니다. 04:23 107 1
474000 일반 그래서 특이점언제옴? [1] ㅇㅇ(222.232) 04:22 67 0
473999 정보 gemma 2 27b llama3 70b랑 비빈다고 함 [5] (223.38) 04:18 260 1
473998 일반 이 와중에 gpt-4o 근황.png [7] ㅇㅇ(14.63) 04:17 555 1
473997 일반 오늘 보니까 결국 구글이 이길 수 밖에 없는게 [4] 걸갤러(125.187) 04:16 352 0
473996 일반 뜬금없긴 한데 애플도 생각보다는 ai기술 좀 있는 것 같기도 하고 [1] ㅇㅇ(118.223) 04:15 163 0
473995 일반 진심 제미나이는 허깅챗 오픈소스 LLM보다 못 한 듯 TS망상갤로그로 이동합니다. 04:13 62 0
473994 정보 구글 아스트라 시연 영상 (구글 글래스? 깜짝공개) [5] ㅇㅇ갤로그로 이동합니다. 04:12 473 5
473993 일반 자다 일어났는데 구글 떡상함? [4] ㅇㅇ(222.236) 04:11 346 0
473992 일반 4o는 3.5 포지션같음 맘보토갤로그로 이동합니다. 04:10 162 0
473990 일반 요약 없슴? ㅇㅇ(223.62) 04:08 37 0
473989 일반 병신.jpg ㅇㅇ(119.77) 04:08 145 3
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2