디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 또 등장한 '소라'의 한계 지적..."영화 제작은 시기상조"

ㅇㅇ(182.230) 2024.04.29 18:43:46
조회 535 추천 14 댓글 13
														

https://www.aitimes.com/news/articleView.html?idxno=159205

 



https://youtu.be/G4wJ4WeJrz4



오픈AI의 비디오 생성 도구인 '소라(Sora)'가 한편의 영화를 제작하기에는 아직 기술적으로 문제가 많다는 지적이 나왔다. 얼마 전 같은 목소리를 냈던 폴 트릴로와 동시에 소라로 한달간 전문가 영상을 제작한 샤이 키즈 팀의 증언이다.  


테크크런치는 27일(현지시간) 소라 홍보 목적으로 단편 영화 ‘에어 헤드(Air Head)’를 만든 아티스트 패트릭 세더버그가 자신의 경험과 함께 소라의 능력 및 한계를 설명한 인터뷰를 소개했다.


이에 따르면 오픈AI는 지난 2월 엄선된 일부 제작 팀에 소라에 대한 제한된 접근 권한을 부여했다. 가장 주목을 받은 팀 중 하나는 소라 단편 영화 '에어 헤드'를 제작한 샤이 키즈 팀이었다. 시드니 리더가 이 영화를 제작했으며, 월터 우드먼이 작가이자 감독이었고, 패트릭 세더버그는 후반 작업을 담당했다. 


대부분은 제작된 단편 영화가 전적으로 소라를 통해 거의 완성된 형태로 나왔다고 생각하지만, 실제로는 견고한 스토리보드, 편집, 색상 보정, 로토스코핑 및 VFX와 같은 후속 작업을 거친 전문적인 제작물로 알려졌다.


애플이 ‘아이폰 촬영’이라고 말하지만, 스튜디오 설정, 전문 조명 및 촬영 이후의 색상 작업은 보여주지 않는 것과 마찬가지다.


즉 소라가 인상적이기는 하지만, 우리가 생각한 것처럼 뚝딱 영화를 만들어 주지는 않는다는 설명이다.



7ce88974b58707f739ee82e145ee756b8414075452945ab0d7fd1671830fea883b



먼저 소라는 장면마다 일관성을 완벽하게 제어할 수 있는 기능이 아직 없다는 지적이다. 동일한 프롬프트를 두번 실행하더라도 결과는 달라진다.


전통적인 영화 제작에서 간단한 문제인 캐릭터 의상 선택과 같은 문제들은 생성 AI에서는 큰 문제가 된다. 이를 해결하는 것은 매우 수고스러운 일이었다는 증언이다.


에어 헤드의 경우 장면마다 실제 노란색 풍선 머리를 동일하게 만드는 확실한 방법이 없었다. 노란색 풍선을 요청해도 노란색이 아닐 때도 있었으며, 어떤 때는 얼굴이 박혀 있거나 풍선 앞쪽에 얼굴이 그려진 것처럼 보이는 경우도 있었다. 소라가 생성한 풍선 머리에는 줄이 달려있는 경우도 많았다. 후반 작업에서 소라가 생성한 장면에서 원하지 않는 요소도 확인하고 일일이 제거해야 했다. 



7ce88974b58707f739ee82e142ee756aa591ee8322a9df6f0b5d1b1dc642a2b17845



또 캐릭터나 카메라의 정확한 타이밍과 움직임을 조절하는 것은 실제로 불가능하다고 전했다. 예를 들어, 손 흔들기와 같은 제스처의 타이밍은 매우 대략적이다. ‘오른쪽으로 패닝’이나 ‘트래킹 샷’과 같은 영화 제작의 일상적인 촬영 기법을 사용하는 것도 일관성이 없다. 


세더버그는 "실제 생성에서 이러한 다양한 동작이 어디에서 발생하는지에 대한 시간 제어가 있긴 하지만 정확하지 않다. 이것은 그저 행운을 빌어보는 것과 같다"라고 말했다. 


그 결과로 같은 장면을 각각 10~20초씩 수백번 생성했고, 그중 소수의 영상만 사용할 수 있었다. 세더버그는 비율을 300대 1로 추정했지만, 이는 전통적인 촬영에 비해 아주 높은 비율이다.



https://youtu.be/KFzXwBZgB88



흥미로운 점은 에어 헤드 클립 중 많은 것들이 슬로우 모션으로 촬영된 것처럼 생성됐다는 것이다. 이는 프롬프트에서 요청된 것이 아니었지만 알 수없는 이유로 발생했으며, 실시간으로 촬영된 것처럼 보이도록 다시 조정해야 했다.


세더버그는 “이유는 모르겠지만 50~75% 속도의 클립이 많은 것 같다”라며 "그래서 슬로우모션처럼 느껴지지 않도록 타이밍을 조정하는 데 꽤 많은 시간을 소모했다"라고 밝혔다. 


마지막으로 소라는 저작권을 위반하거나 타인이 만든 것처럼 보이는 이미지를 생성하는 것을 허용하지 않는 것도 장애물로 꼽혔다. 예를 들어, 소라에게 ‘스타워즈’ 클립을 요청하면 거부한다.


그리고 ‘레트로-미래적 우주선 위의 로브 착용자가 레이저 검을 들고 있는’과 같은 우회적인 방법으로 시도하더라도, 거부한다. ‘아로노프스키 형태의 샷’이나 ‘히치콕 줌’과 같은 것을 요청해도 마찬가지다. 모델이 어떤 메커니즘을 통해 무엇을 시도하고 있는지 인식하기 때문이다. 


세더버그는 “제작 가치와 품질 측면에서 소라는 아직 영화에 사용되기에는 멀었다. 최고의 컴퓨팅 성능을 갖추고 있지만 실제로 수많은 사용자에게 서비스를 제공하기에는 아직 충분하지 않다”고 지적했다.


이어 “이것은 여전히 슬롯머신처럼 요행을 바라는 측면이 있다”며 “무언가를 요청하면 소라는 아이디어를 섞어서 제공하지만, 실제 물리 엔진을 갖고 있지는 않다”고 덧붙였다.


한편 이에 앞서 지난 19일에는 영화감독 폴 트릴로가 비슷한 평가를 내놓은 바 있다.


그 역시 '뽑기'와 비슷한 프롬프트 입력 결과와 일관성 유지의 어려움 등으로 장편 영화를 만들기에는 아직 무리라고 지적했다. 


자동등록방지

추천 비추천

14

고정닉 9

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
472184 일반 아직 한참 멀었네 ㅇㅇ갤로그로 이동합니다. 05.14 31 0
472183 일반 스트리밍에서 너 소개한다고 하니까 놀라면서 저요? ㅋㅋㅋ 이러는거 [3] ㅇㅇ갤로그로 이동합니다. 05.14 94 0
472182 일반 GPT5는 언제 나온다는거 찌라시도 없음? [2] ㅇㅇ(110.34) 05.14 98 0
472181 일반 api 은근 비싸던데 [2] ㅇㅇ(114.206) 05.14 145 0
472180 일반 GPT-5 나와도 이 정도 추론 문제도 못 풀거 같은데 [6] ㅇㅇ(120.142) 05.14 169 0
472179 일반 음성 기능을 써보면 엄청 혁신적인걸 느끼게 될거 같음 [2] ㅇㅇ갤로그로 이동합니다. 05.14 118 2
472178 일반 소리버젼 업데이트 되어야 ... 그때부터 대단하다고 난리날 듯 ㅇㅇ갤로그로 이동합니다. 05.14 30 0
472177 일반 실망했다 어쩌구 하는 애들 ㅈㄴ 이해가 안 가네 [7] ㅇㅇ갤로그로 이동합니다. 05.14 229 14
472176 일반 4o는 걍 클로드3 보다 대답 퀄이 떨어짐 해워닝갤로그로 이동합니다. 05.14 115 0
472175 일반 와 4o 이제 써보는데 ALSO랑 맛이 같네 ㄷㄷ ㅇㅇ(121.124) 05.14 134 0
472174 일반 확실히 샘 알트만은 마케팅의 천재임 ㅇㅇ(106.245) 05.14 66 1
472173 일반 현직입니다 내일 agi 나옵니다 [1] ㅇㅇ(211.197) 05.14 82 0
472172 일반 어쨌든 구글 i/o도 볼거면 개추 [4] ㅇㅇ(39.113) 05.14 98 3
472171 일반 얼마나 ㅈ밥이면 실베도 못감?? ㅇㅇ갤로그로 이동합니다. 05.14 50 0
472170 일반 슬슬 챗봇붐은 끝물이네 ㅇㅇ갤로그로 이동합니다. 05.14 74 0
472169 일반 솔직히 본인 픽 식음 ㅇㅇ(218.235) 05.14 60 0
472168 일반 근들갑 조진거 반동쎄게 오네ㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.14 89 1
472167 일반 특이점이 온다 [1] ㅇㅇ(1.239) 05.14 48 0
472166 일반 Gpt4o 고비 모델이 작년에 완성된거잖아 [1] ㅇㅇ(118.235) 05.14 111 0
472165 일반 4o너무 별로라 오히려 내일이 기대되네 ㅇㅇ갤로그로 이동합니다. 05.14 102 0
472164 일반 그립읍니다 Singnice갤로그로 이동합니다. 05.14 57 0
472163 일반 야발 손목 낫는 특이점 언제오냐고 [2] ㅇㅇ갤로그로 이동합니다. 05.14 62 0
472161 일반 4o가 좋은게 아닌이유 [1] ㅇㅇ(125.141) 05.14 164 2
472160 일반 3.5한테 너 무슨 모델이냐 물어 봤을때 4라고 하기도함? [4] ㅇㅇ갤로그로 이동합니다. 05.14 128 0
472159 일반 내일 구글io는 몇 시에 함? [1] ㅇㅇ(49.142) 05.14 92 0
472158 일반 다시 챗아레나 켰으면 개추 ㅋㅋ ㅇㅇ(211.46) 05.14 61 0
472157 일반 도파민 안나오면 개추 ㅇㅇ갤로그로 이동합니다. 05.14 33 0
472156 일반 남자 목소리도 섹시하게 만들어달라고 [2] ㅇㅇ(114.202) 05.14 83 0
472155 일반 사칙연산은 해결됐는데 유입새끼가 자꾸 글 싸네 [3] ㅇㅇ갤로그로 이동합니다. 05.14 106 2
472154 일반 Openai 핵심개발자들 뛰쳐나간 이유가있다니까 ㅋㅋ ㅇㅇ(220.70) 05.14 180 1
472153 일반 오픈ai 마케팅은 걍 희망고문임 [2] ㅇㅇ갤로그로 이동합니다. 05.14 77 0
472152 일반 근데 진짜 솔직히 음성 같은건 다른 기업에게 넘겨줘도 되는거 아님? [4] 버거왕갤로그로 이동합니다. 05.14 109 2
472151 일반 3.5 업그레이드 됨 ㅇㅇ갤로그로 이동합니다. 05.14 57 0
472150 일반 일단 한국어 목소리를 들어보고 싶다 [2] ㅇㅇ갤로그로 이동합니다. 05.14 73 0
472149 일반 ai 기술 자체가 양산화, 상용화 속도가 진짜 빠르긴하네 ㅇㅇ(211.184) 05.14 41 0
472148 일반 Gpt4 출시는 혁신이었음 [8] Singnice갤로그로 이동합니다. 05.14 271 2
472147 일반 4o 무료로 풀렷다 카지 않앗냐 [3] ㅇㅇ(124.80) 05.14 258 0
472146 일반 본인 똥게이라 잘 모르는데 4o목소리 [6] ㅇㅇ(114.202) 05.14 154 0
472145 일반 옆그레이드 아쉽다 ㅇㅇ갤로그로 이동합니다. 05.14 31 0
472144 일반 노동의욕 없어졌음 [2] 특붕이(115.77) 05.14 110 1
472143 일반 진짜 추상적인 수학의 개념이 기계 쪽에서도 어렵다니 [1] ㅇㅇ(220.77) 05.14 59 0
472142 일반 AGI (초등학생도 하는 사칙연산 찐빠 일어남) [3] ㅇㅇ(118.37) 05.14 141 0
472141 일반 GPT-5는 그냥 야부리 털기 & 코딩 특화 모델일 듯 ㅇㅇ(120.142) 05.14 62 0
472140 일반 gpt4o 챗봇아레나에 뜨는데? ㅇㅇ(121.159) 05.14 130 0
472139 일반 근데 gpt-4o도 별로 달라진건 없는데? ㅇㅇ(221.164) 05.14 53 0
472138 일반 귀랑 입 막고 손으로 글만 쓰게 하는데 ㅇㅇ갤로그로 이동합니다. 05.14 39 0
472137 일반 gpt 보이스 발표를 너무 대충했음 이렇게 해야함 ㅇㅇ(210.90) 05.14 84 1
472136 일반 also gpt2 이건 어디서 사용함? [1] 이런내가특특갤로그로 이동합니다. 05.14 116 0
472135 일반 국내 AI 전문가는 어느정도 수준임 [1] ㅇㅇ(106.102) 05.14 88 0
472134 일반 아직 택도 없어 보이는데 [3] ㅇㅇ(110.34) 05.14 144 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2