디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 또 등장한 '소라'의 한계 지적..."영화 제작은 시기상조"

ㅇㅇ(182.230) 2024.04.29 18:43:46
조회 528 추천 14 댓글 13
														

https://www.aitimes.com/news/articleView.html?idxno=159205

 



https://youtu.be/G4wJ4WeJrz4



오픈AI의 비디오 생성 도구인 '소라(Sora)'가 한편의 영화를 제작하기에는 아직 기술적으로 문제가 많다는 지적이 나왔다. 얼마 전 같은 목소리를 냈던 폴 트릴로와 동시에 소라로 한달간 전문가 영상을 제작한 샤이 키즈 팀의 증언이다.  


테크크런치는 27일(현지시간) 소라 홍보 목적으로 단편 영화 ‘에어 헤드(Air Head)’를 만든 아티스트 패트릭 세더버그가 자신의 경험과 함께 소라의 능력 및 한계를 설명한 인터뷰를 소개했다.


이에 따르면 오픈AI는 지난 2월 엄선된 일부 제작 팀에 소라에 대한 제한된 접근 권한을 부여했다. 가장 주목을 받은 팀 중 하나는 소라 단편 영화 '에어 헤드'를 제작한 샤이 키즈 팀이었다. 시드니 리더가 이 영화를 제작했으며, 월터 우드먼이 작가이자 감독이었고, 패트릭 세더버그는 후반 작업을 담당했다. 


대부분은 제작된 단편 영화가 전적으로 소라를 통해 거의 완성된 형태로 나왔다고 생각하지만, 실제로는 견고한 스토리보드, 편집, 색상 보정, 로토스코핑 및 VFX와 같은 후속 작업을 거친 전문적인 제작물로 알려졌다.


애플이 ‘아이폰 촬영’이라고 말하지만, 스튜디오 설정, 전문 조명 및 촬영 이후의 색상 작업은 보여주지 않는 것과 마찬가지다.


즉 소라가 인상적이기는 하지만, 우리가 생각한 것처럼 뚝딱 영화를 만들어 주지는 않는다는 설명이다.



7ce88974b58707f739ee82e145ee756b8414075452945ab0d7fd1671830fea883b



먼저 소라는 장면마다 일관성을 완벽하게 제어할 수 있는 기능이 아직 없다는 지적이다. 동일한 프롬프트를 두번 실행하더라도 결과는 달라진다.


전통적인 영화 제작에서 간단한 문제인 캐릭터 의상 선택과 같은 문제들은 생성 AI에서는 큰 문제가 된다. 이를 해결하는 것은 매우 수고스러운 일이었다는 증언이다.


에어 헤드의 경우 장면마다 실제 노란색 풍선 머리를 동일하게 만드는 확실한 방법이 없었다. 노란색 풍선을 요청해도 노란색이 아닐 때도 있었으며, 어떤 때는 얼굴이 박혀 있거나 풍선 앞쪽에 얼굴이 그려진 것처럼 보이는 경우도 있었다. 소라가 생성한 풍선 머리에는 줄이 달려있는 경우도 많았다. 후반 작업에서 소라가 생성한 장면에서 원하지 않는 요소도 확인하고 일일이 제거해야 했다. 



7ce88974b58707f739ee82e142ee756aa591ee8322a9df6f0b5d1b1dc642a2b17845



또 캐릭터나 카메라의 정확한 타이밍과 움직임을 조절하는 것은 실제로 불가능하다고 전했다. 예를 들어, 손 흔들기와 같은 제스처의 타이밍은 매우 대략적이다. ‘오른쪽으로 패닝’이나 ‘트래킹 샷’과 같은 영화 제작의 일상적인 촬영 기법을 사용하는 것도 일관성이 없다. 


세더버그는 "실제 생성에서 이러한 다양한 동작이 어디에서 발생하는지에 대한 시간 제어가 있긴 하지만 정확하지 않다. 이것은 그저 행운을 빌어보는 것과 같다"라고 말했다. 


그 결과로 같은 장면을 각각 10~20초씩 수백번 생성했고, 그중 소수의 영상만 사용할 수 있었다. 세더버그는 비율을 300대 1로 추정했지만, 이는 전통적인 촬영에 비해 아주 높은 비율이다.



https://youtu.be/KFzXwBZgB88



흥미로운 점은 에어 헤드 클립 중 많은 것들이 슬로우 모션으로 촬영된 것처럼 생성됐다는 것이다. 이는 프롬프트에서 요청된 것이 아니었지만 알 수없는 이유로 발생했으며, 실시간으로 촬영된 것처럼 보이도록 다시 조정해야 했다.


세더버그는 “이유는 모르겠지만 50~75% 속도의 클립이 많은 것 같다”라며 "그래서 슬로우모션처럼 느껴지지 않도록 타이밍을 조정하는 데 꽤 많은 시간을 소모했다"라고 밝혔다. 


마지막으로 소라는 저작권을 위반하거나 타인이 만든 것처럼 보이는 이미지를 생성하는 것을 허용하지 않는 것도 장애물로 꼽혔다. 예를 들어, 소라에게 ‘스타워즈’ 클립을 요청하면 거부한다.


그리고 ‘레트로-미래적 우주선 위의 로브 착용자가 레이저 검을 들고 있는’과 같은 우회적인 방법으로 시도하더라도, 거부한다. ‘아로노프스키 형태의 샷’이나 ‘히치콕 줌’과 같은 것을 요청해도 마찬가지다. 모델이 어떤 메커니즘을 통해 무엇을 시도하고 있는지 인식하기 때문이다. 


세더버그는 “제작 가치와 품질 측면에서 소라는 아직 영화에 사용되기에는 멀었다. 최고의 컴퓨팅 성능을 갖추고 있지만 실제로 수많은 사용자에게 서비스를 제공하기에는 아직 충분하지 않다”고 지적했다.


이어 “이것은 여전히 슬롯머신처럼 요행을 바라는 측면이 있다”며 “무언가를 요청하면 소라는 아이디어를 섞어서 제공하지만, 실제 물리 엔진을 갖고 있지는 않다”고 덧붙였다.


한편 이에 앞서 지난 19일에는 영화감독 폴 트릴로가 비슷한 평가를 내놓은 바 있다.


그 역시 '뽑기'와 비슷한 프롬프트 입력 결과와 일관성 유지의 어려움 등으로 장편 영화를 만들기에는 아직 무리라고 지적했다. 


자동등록방지

추천 비추천

14

고정닉 9

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
470975 일반 4o무료로 풀릴건데 결제를 왜함?(진짜 모름) [6] ㅇㅇ(182.219) 05.14 358 0
470973 일반 gpt4o로 UI/UX 디자인 -> html 해본 결과 [5] 코드발사대(14.36) 05.14 269 0
470972 일반 내일 당장 도서관 가서 책 닥치는대로 다 찍어서 맥여야지 [3] ㅇㅇ갤로그로 이동합니다. 05.14 134 0
470971 일반 쉬벌 존나빠르긴하네 진짜좋다 이건 ㅋㅋㅋ [1] rtOS갤로그로 이동합니다. 05.14 163 0
470970 일반 Gpt-5뭔지 알겠네 ㅋㅋㅋㅋ [6] ㅇㅇ(112.161) 05.14 251 0
470969 일반 GPT-4o 남자목소리도 듣고가라 ㅇㅇ(59.5) 05.14 126 1
470968 일반 GPT-4o의 멀티모달 설 ㅇㅇ(211.192) 05.14 88 0
470966 일반 아오 특평 ㅋㅋ 억빠할라고 해도 좀 코딩 해보고 말하지 [20] ㅇㅇ갤로그로 이동합니다. 05.14 298 1
470965 일반 선형충 방빼ㅋㅋㅋㅋㅋ ㅇㅇ(182.219) 05.14 33 0
470964 일반 신규구독은 뭔소리냐 ㅇㅇ갤로그로 이동합니다. 05.14 81 0
470963 일반 근데 유료가 80개면 무료는 몇개 제한일까? [3] ㅇㅇ(39.113) 05.14 196 0
470962 일반 몇주안에 음성도 제공된다는건 이미 알트만 손 떠났다는거임 ㅇㅇ갤로그로 이동합니다. 05.14 79 0
470961 일반 Gpt 기억상실 방지방법 [1] ㅇㅇ(110.46) 05.14 135 0
470960 일반 지피티 이년한테 본인 야추사진 보여주고 [1] ㅇㅇ(211.235) 05.14 95 0
470959 일반 수식 사진찍어서 변환하는데 써먹을수있겠다 ㅇㅇ갤로그로 이동합니다. 05.14 61 0
470958 일반 이제 밈도 진짜 딱딱 이해하네 ㅋㅋ [2] TS망상갤로그로 이동합니다. 05.14 216 2
470957 일반 아직도 안떴으면 개추 ㅇㅇ(39.113) 05.14 27 0
470956 일반 근데 이거 왜 80개로 늘어난거임? [2] ㅇㅇ(175.208) 05.14 121 0
470955 일반 4o also이긴한데 압축률 좆되는 모델같다 ㅇㅇ;; [2] ㅇㅇ(218.153) 05.14 234 0
470954 일반 저 수준의 음성인식이 경제에 어느정도 영향 미칠지 궁금함 [2] ㅇㅇ갤로그로 이동합니다. 05.14 108 0
470953 일반 아직 3.5쓰고있는 흙붕이면 개추ㅋㅋ [2] ㅇㅇ(182.219) 05.14 130 3
470952 일반 훨씬 빠르게 느껴지는 4o 빙냥이ㄱㅇㅇ갤로그로 이동합니다. 05.14 61 0
470951 일반 시발 영상처럼 바로바로 대답도 안해주고 [2] ㅇㅇ(211.235) 05.14 124 0
470950 일반 이미지 분석이좆되는데이거 [1] ㅇㅇ(14.35) 05.14 147 0
470949 일반 그래서 언제 ai 랑 같이 겜할수 있슴? ㅇㅇ(175.192) 05.14 27 0
470948 일반 아직 데모에서 보여준 대화기능은 안되네??? [5] rtOS갤로그로 이동합니다. 05.14 172 0
470947 일반 gpt4o가 수학은제일잘하네 [1] ㅇㅇ(221.168) 05.14 163 0
470946 일반 음성대화 진짜 인간과 하는것처럼 된것만으로도 업글이지 ㅇㅇ(182.219) 05.14 38 0
470945 일반 여기 들어가면 공홈 데모영상들 볼수있다 ㅇㅇ(211.192) 05.14 40 0
470944 일반 특들갑 ㅇㅇ(118.235) 05.14 44 0
470943 일반 슬슬 식으면 개추ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [3] 수퍼고수(110.10) 05.14 320 10
470942 일반 ㅈㄴ 빠르긴한데 비디오 음성 실시간 안되는데? [4] ㅇㅇ(121.137) 05.14 170 0
470940 일반 성능이 제일 좋은건 아닌거 같음 역량은 오푸스보다 못해 [6] ㅇㅇ(112.161) 05.14 185 0
470938 일반 이제 GPT 끼리 실시간 음성대화 가능 [1] ㅇㅇ(211.192) 05.14 147 0
470937 일반 근데 이제 뭐함? ㅇㅇ(182.219) 05.14 37 0
470936 일반 한국어는 아직 클로드가 좆바르지? [3] ㅇㅇ(1.229) 05.14 196 0
470935 일반 무료충 다죽이고 제한 200개 해줘야함 [2] ㅇㅇ(211.46) 05.14 108 1
470934 일반 본인 방금 구독하자마자 떴다 ㅋㅋㅋ [1] oo(211.255) 05.14 181 0
470933 일반 gpt4o로 하고싶은거: 도서관책 전부 사진찍어서 맥이기 [4] ㅇㅇ갤로그로 이동합니다. 05.14 162 2
470932 일반 이제 슬슬... ㅇㅇ(58.29) 05.14 46 0
470930 정보/ gpt4o 벤치마크보면 [1] ㅇㅇ(221.168) 05.14 195 1
470929 일반 10분안에 나도 gpt4o 안주면 구독해지함 ㅅㄱ ㅇㅇ(121.162) 05.14 49 0
470928 일반 ㅅㅂ 나도 풀렸다 ㅇㅇ(218.154) 05.14 33 0
470926 일반 자러감 ㅇㅇ(39.124) 05.14 48 0
470925 일반 야 근데 이미지 이해쪽은 그냥4보다 더 잘하는것같다 언어모델갤로그로 이동합니다. 05.14 44 0
470924 일반 아니 근데 라마 400b 왜 gpt4 못이김? [3] ㅇㅇ갤로그로 이동합니다. 05.14 140 0
470923 일반 성능도 성능인데 무료인게 지리네 [3] ㅇㅇ(125.183) 05.14 195 0
470922 일반 와 떳다!! 사진술갤로그로 이동합니다. 05.14 69 0
470921 일반 진짜 망한거 같은데? ㅇㅇ(112.161) 05.14 120 0
470920 일반 4o 체감상 also보다 좆구리고 claude 보다 속도빼고는 그닥.. ㅇㅇ(218.153) 05.14 169 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2