https://www.aitimes.com/news/articleView.html?idxno=159205
https://youtu.be/G4wJ4WeJrz4
오픈AI의 비디오 생성 도구인 '소라(Sora)'가 한편의 영화를 제작하기에는 아직 기술적으로 문제가 많다는 지적이 나왔다. 얼마 전 같은 목소리를 냈던 폴 트릴로와 동시에 소라로 한달간 전문가 영상을 제작한 샤이 키즈 팀의 증언이다.
테크크런치는 27일(현지시간) 소라 홍보 목적으로 단편 영화 ‘에어 헤드(Air Head)’를 만든 아티스트 패트릭 세더버그가 자신의 경험과 함께 소라의 능력 및 한계를 설명한 인터뷰를 소개했다.
이에 따르면 오픈AI는 지난 2월 엄선된 일부 제작 팀에 소라에 대한 제한된 접근 권한을 부여했다. 가장 주목을 받은 팀 중 하나는 소라 단편 영화 '에어 헤드'를 제작한 샤이 키즈 팀이었다. 시드니 리더가 이 영화를 제작했으며, 월터 우드먼이 작가이자 감독이었고, 패트릭 세더버그는 후반 작업을 담당했다.
대부분은 제작된 단편 영화가 전적으로 소라를 통해 거의 완성된 형태로 나왔다고 생각하지만, 실제로는 견고한 스토리보드, 편집, 색상 보정, 로토스코핑 및 VFX와 같은 후속 작업을 거친 전문적인 제작물로 알려졌다.
애플이 ‘아이폰 촬영’이라고 말하지만, 스튜디오 설정, 전문 조명 및 촬영 이후의 색상 작업은 보여주지 않는 것과 마찬가지다.
즉 소라가 인상적이기는 하지만, 우리가 생각한 것처럼 뚝딱 영화를 만들어 주지는 않는다는 설명이다.
![7ce88974b58707f739ee82e145ee756b8414075452945ab0d7fd1671830fea883b](https://dcimg4.dcinside.co.kr/viewimage.php?id=39b5d535ecdc3fb362bec4bc02c8&no=24b0d769e1d32ca73de983fa11d02831c6c0b61130e4349ff064c51af2d3cfaefc1cc16a7d9255e2bfd7d09758b8b7517cf85585e5a27e06b6c321e2da07ea0a30bf764027527e346810)
먼저 소라는 장면마다 일관성을 완벽하게 제어할 수 있는 기능이 아직 없다는 지적이다. 동일한 프롬프트를 두번 실행하더라도 결과는 달라진다.
전통적인 영화 제작에서 간단한 문제인 캐릭터 의상 선택과 같은 문제들은 생성 AI에서는 큰 문제가 된다. 이를 해결하는 것은 매우 수고스러운 일이었다는 증언이다.
에어 헤드의 경우 장면마다 실제 노란색 풍선 머리를 동일하게 만드는 확실한 방법이 없었다. 노란색 풍선을 요청해도 노란색이 아닐 때도 있었으며, 어떤 때는 얼굴이 박혀 있거나 풍선 앞쪽에 얼굴이 그려진 것처럼 보이는 경우도 있었다. 소라가 생성한 풍선 머리에는 줄이 달려있는 경우도 많았다. 후반 작업에서 소라가 생성한 장면에서 원하지 않는 요소도 확인하고 일일이 제거해야 했다.
![7ce88974b58707f739ee82e142ee756aa591ee8322a9df6f0b5d1b1dc642a2b17845](https://dcimg4.dcinside.co.kr/viewimage.php?id=39b5d535ecdc3fb362bec4bc02c8&no=24b0d769e1d32ca73de983fa11d02831c6c0b61130e4349ff064c51af2d3cfaefc1cc16a7d9255e2bfd7d09758b8f304bda435646699b21c70146b1e73f7985f6ac88ad3c8)
또 캐릭터나 카메라의 정확한 타이밍과 움직임을 조절하는 것은 실제로 불가능하다고 전했다. 예를 들어, 손 흔들기와 같은 제스처의 타이밍은 매우 대략적이다. ‘오른쪽으로 패닝’이나 ‘트래킹 샷’과 같은 영화 제작의 일상적인 촬영 기법을 사용하는 것도 일관성이 없다.
세더버그는 "실제 생성에서 이러한 다양한 동작이 어디에서 발생하는지에 대한 시간 제어가 있긴 하지만 정확하지 않다. 이것은 그저 행운을 빌어보는 것과 같다"라고 말했다.
그 결과로 같은 장면을 각각 10~20초씩 수백번 생성했고, 그중 소수의 영상만 사용할 수 있었다. 세더버그는 비율을 300대 1로 추정했지만, 이는 전통적인 촬영에 비해 아주 높은 비율이다.
https://youtu.be/KFzXwBZgB88
흥미로운 점은 에어 헤드 클립 중 많은 것들이 슬로우 모션으로 촬영된 것처럼 생성됐다는 것이다. 이는 프롬프트에서 요청된 것이 아니었지만 알 수없는 이유로 발생했으며, 실시간으로 촬영된 것처럼 보이도록 다시 조정해야 했다.
세더버그는 “이유는 모르겠지만 50~75% 속도의 클립이 많은 것 같다”라며 "그래서 슬로우모션처럼 느껴지지 않도록 타이밍을 조정하는 데 꽤 많은 시간을 소모했다"라고 밝혔다.
마지막으로 소라는 저작권을 위반하거나 타인이 만든 것처럼 보이는 이미지를 생성하는 것을 허용하지 않는 것도 장애물로 꼽혔다. 예를 들어, 소라에게 ‘스타워즈’ 클립을 요청하면 거부한다.
그리고 ‘레트로-미래적 우주선 위의 로브 착용자가 레이저 검을 들고 있는’과 같은 우회적인 방법으로 시도하더라도, 거부한다. ‘아로노프스키 형태의 샷’이나 ‘히치콕 줌’과 같은 것을 요청해도 마찬가지다. 모델이 어떤 메커니즘을 통해 무엇을 시도하고 있는지 인식하기 때문이다.
세더버그는 “제작 가치와 품질 측면에서 소라는 아직 영화에 사용되기에는 멀었다. 최고의 컴퓨팅 성능을 갖추고 있지만 실제로 수많은 사용자에게 서비스를 제공하기에는 아직 충분하지 않다”고 지적했다.
이어 “이것은 여전히 슬롯머신처럼 요행을 바라는 측면이 있다”며 “무언가를 요청하면 소라는 아이디어를 섞어서 제공하지만, 실제 물리 엔진을 갖고 있지는 않다”고 덧붙였다.
한편 이에 앞서 지난 19일에는 영화감독 폴 트릴로가 비슷한 평가를 내놓은 바 있다.
그 역시 '뽑기'와 비슷한 프롬프트 입력 결과와 일관성 유지의 어려움 등으로 장편 영화를 만들기에는 아직 무리라고 지적했다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.