디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 소라 간략정리

ㅇㅇ(125.131) 2024.12.10 11:38:43
조회 2156 추천 0 댓글 3
														


OpenAI의 Sora 공개: 상세 분석 및 논쟁


Sora 소개 및 주요 특징


10개월의 기다림 끝에 OpenAI는 유료 사용자에게 Sora를 공개했습니다.


프롬프트를 통해 최대 20초의 저해상도 비디오와 10초의 1080p 비디오를 생성할 수 있습니다.


월 $200의 비용으로 사용 가능합니다.


Sora는 아름다운 사용자 인터페이스를 가지고 있지만, 비디오는 새로운 물리 법칙을 따릅니다.


EU와 영국을 제외한 거의 모든 국가에서 사용 가능합니다.


VPN을 사용하면 사용할 수 있습니다.


ChatGPT 유료 사용자는 Sora를 사용할 수 있으며, 표준 $20 요금제는 1,000 크레딧을 제공하고 720p 해상도와 5초 길이 제한이 있습니다.


$200 요금제는 10,000 크레딧을 제공하며 워터마크 없이 다운로드할 수 있습니다.


크레딧은 빠르게 소진될 수 있으며, 다음 달로 이월되지 않습니다.


Sora의 기능 및 한계


Sora는 런던의 샤드와 같은 랜드마크를 인식하여 비디오를 생성할 수 있습니다.


미래적인 유튜브 인트로 제작도 가능합니다.


스토리보드 기능은 애플 제품처럼 세련되고 깔끔한 사용자 인터페이스를 제공합니다.


하지만 Sora는 물리학 법칙을 따르지 않고 환각을 일으키는 등 생성형 AI의 한계를 보여줍니다.


이전 비디오에서 소개된 이미지를 사용하고 표지판이 거북이에서 떨어지는 장면을 생성하도록 지시했지만, 표지판은 떨어지지 않았습니다.


$200 요금제를 사용하더라도 이 비디오는 허용치의 5% 이상을 사용하며, $10의 비용이 발생합니다.


아스날 셔츠와 같은 독점적인 요소를 포함하는 프롬프트는 차단됩니다.


다른 이미지 생성기에서 이미지를 생성한 후 이미지 프롬프트로 사용하면 우회할 수 있습니다.


하지만 생성된 비디오는 여전히 오류가 발생할 수 있습니다. (예: 고슴도치가 골을 넣는 대신 감자를 응시, 감자가 공중에 뜨는 현상)


이미지 프롬프트 사용은 성공 여부가 일정하지 않습니다.


AI Insiders 로고를 튀어나오게 하려고 시도했지만 로봇이 다른 로봇으로 변형되는 문제가 발생했습니다.


$9 Patreon 구독을 통해 미디어가 잘못 보도한 내용을 다룬 비디오를 공개합니다.


고슴도치가 채소를 자랑하는 1080p 비디오는 선명하고 깨끗하게 생성되었습니다.


텍스트, 이미지뿐만 아니라 비디오도 프롬프트로 사용할 수 있습니다.


거북이가 움직이도록 모션 브러시 도구를 사용했지만, Sora는 거북이를 다른 방향으로 움직였습니다.


제품 페이지에 선별된 비디오 샘플이 제공됩니다. (예: 1950년대 교외의 평온함, 부두에서 컨테이너를 싣는 선박의 드론 샷)


Runway, Pika와 같은 경쟁자가 있지만, Sora는 특히 고해상도에서 우수한 성능을 보입니다.


Sam Altman의 라이브 데모에서 크레인이 물고기를 잡지 못하는 문제가 발생했습니다.


Google DeepMind는 Vo라는 생성형 비디오 모델을 개발했지만, 일반 사용자에게는 공개되지 않았습니다.


Sora 시스템 카드 분석 및 논쟁


Sora는 현재 사용 가능한 최고의 비디오 생성 모델이지만, 가격이 비싸고 생성 횟수가 제한적이며 물리학 법칙을 따르지 않습니다.


시스템 카드는 자세한 정보를 제공하지 않습니다.


Sora 개발팀은 "Sora를 만든 목적은 현실 세계를 이해하고 시뮬레이션하는 것"이라고 반복적으로 언급하며, 이를 AGI 달성을 위한 중요한 이정표라고 주장합니다.


하지만 비디오 생성기 개발과 AGI 달성을 연결하기는 어렵습니다.


Sora는 현실 세계를 이해하는 데는 아직 멀었고, ChatGPT의 01과 같은 모델보다 더 나아가지 못했습니다.


Sora 개발 이유에 대한 정당화처럼 들립니다.


데이터 출처에 대한 언급이 없으며, "주로 업계 표준 기계 학습 데이터 세트에서 수집했다"고만 언급합니다.


소송의 위험을 인지하고 있기 때문에 구체적인 언급을 피하는 것으로 보입니다.


특정 주제에 대한 높은 수준의 검열을 위해 자체 GPT를 사용하며, 이를 통해 제3자 콘텐츠와 기만적인 콘텐츠를 식별할 수 있습니다.


살아있는 예술가의 스타일로 비디오 생성을 요청할 수 없으며, 실제 사람의 사진이나 비디오를 이미지 프롬프트로 사용할 수 없습니다.


Sora를 둘러싼 논쟁 및 OpenAI의 변화


Sora 출시를 전후로 OpenAI는 여러 가지 논란에 휩싸였습니다.


80,000 Hours의 팟캐스트는 OpenAI를 "천년의 도둑"이라고 비판합니다.


12월 2일, OpenAI는 광고 허용 가능성을 열었습니다.


Sam Altman은 과거에 "AI와 광고의 결합은 불안하다"고 언급했으며, 광고를 최후의 수단이라고 표현했습니다.


12월 6일, Financial Times는 OpenAI가 AGI 달성 시 Microsoft와의 상업적 계약을 무효화하고 이익을 비영리 단체에 기부하겠다는 약속을 철회할 가능성을 보도했습니다.


Sam Altman은 AGI가 자본주의를 붕괴시킬 것이라고 언급했습니다.


AGI는 전 세계 일자리의 절반을 대체할 수 있습니다.


OpenAI는 이 약속을 여러 번 언급했으며, 헌장에도 명시되어 있습니다.


하지만 OpenAI는 AGI를 상업적 목적으로 사용하려는 의도를 보이고 있습니다.


Microsoft가 AGI를 독점할 가능성을 상상해 보십시오.


OpenAI는 Microsoft의 투자 제한을 해제하기 위해 이 조항을 삭제하려는 것입니다.


AGI는 OpenAI의 모든 상업 및 IP 라이선스 계약에서 제외됩니다.


Microsoft는 OpenAI에 130억 달러를 투자했습니다.


이는 소문이 아니라 Financial Times가 OpenAI 관계자의 발언을 직접 인용한 내용입니다.


Sam Altman은 "무슨 일이 일어날지 모르기 때문에 유연성을 남겨두었다"고 말했습니다.


OpenAI는 AGI 이후의 세상에서 돈의 역할이 불분명하기 때문에 투자자들에게 기부 정신으로 투자할 것을 요청했습니다.


OpenAI의 비영리 단체는 여전히 존재하며, 현재 지분에 대한 "완전한 가치"를 받을 것입니다.


이는 Microsoft가 AGI를 소유하지 않는 것과는 다릅니다.


Microsoft는 AI를 통해 인건비를 절감할 수 있다고 홍보하고 있습니다.


Microsoft는 작년에 1만 명을 해고했습니다.


Microsoft는 Co-pilot을 사용하여 고객 서비스 에이전트의 처리량을 12% 향상시켰습니다.


OpenAI는 군사 산업 단지 내에서 활동하기 시작했습니다.


OpenAI는 무기 개발이나 군사 및 전쟁에 모델을 사용할 수 없다는 규칙을 변경했습니다.


"무기 개발 또는 사용, 재산 파괴를 통해 자신이나 타인을 해치는 데 기술을 사용하지 마십시오"라는 규칙에서 "재산 파괴"는 삭제되었습니다.


10월에는 "사람들을 보호하고 적을 저지하기 위해서만 사용할 수 있다"로 변경되었습니다.


OpenAI의 기술은 이제 전장에서 드론 공격으로부터 미국과 동맹군을 방어하는 데 사용될 것입니다.


방어 무기는 공격적으로 사용될 수 있습니다.


OpenAI는 AI를 책임감 있게 관리하는 방법에 대해 오랫동안 논의했지만, 이제는 완전히 다른 규칙을 따르는 방위 기술 산업에서 일할 것입니다.


미국 군대가 고객인 시스템에서 기술 회사는 제품 사용 방식을 결정할 수 없습니다.


Washington Post에 따르면 OpenAI 직원들은 이 거래에 반대하며 투명성을 요구하고 있습니다.


직원들은 OpenAI 기술이 인간 조종 항공기에 사용되지 않을 것이라는 확신을 원합니다.


방어 무기는 인간이 조종하는 공격 항공기에 사용될 수 있습니다.


방어적 사용 사례는 여전히 AI의 군사화를 의미합니다.


터미네이터 영화에서 인류를 공격하는 AI 시스템 Skynet도 북미에 대한 공중 공격을 방어하기 위해 설계되었습니다.


OpenAI는 Anthropic, Meta와 함께 군사 기술 사용을 허용하도록 정책을 변경했습니다.


결론


Sora는 물리학을 무시하면 놀라운 비디오를 생성할 수 있고 사용자 인터페이스는 훌륭하지만, 크레딧 대비 가격이 비쌉니다.


OpenAI의 12일간의 제품 출시는 다른 논란을 가리기 위한 전략일 수 있습니다.


자동등록방지

추천 비추천

0

고정닉 0

댓글 영역

전체 댓글 0
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
3007 설문 실제 모습일지 궁금한 미담 제조기 스타는? 운영자 25/05/05 - -
571617 공지 뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250427) ㅇㅇ갤로그로 이동합니다. 24.11.23 33620 45
609935 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [1] ㅇㅇ갤로그로 이동합니다. 25.01.18 19299 30
571620 공지 본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다. ㅇㅇ갤로그로 이동합니다. 24.11.23 5632 15
572292 공지 직업 비하, 조롱 글 30일 차단됩니다. ㅇㅇ갤로그로 이동합니다. 24.11.24 4999 6
717495 일반 나는 머스크말을 100%믿는 사람으로써 이번주에 AGI가 나오는거에 ㅇㅇ갤로그로 이동합니다. 11:50 19 0
717494 일반 진짜 전기 낭비네 이건 [2] 4테라갤로그로 이동합니다. 11:49 54 2
717493 일반 제미나이는 0506이 아니라 코딩 전용으로 했어야할듯... [1] 갉달비갤로그로 이동합니다. 11:48 37 0
717492 일반 치타쉑 다시 우리 안으로 들어간 거임? ㅇㅇ(49.246) 11:48 15 0
717491 일반 구글은 걍 가장 돈을 잘 버는 기업중 하나고 2.5 프로가 그렇게 [1] ㅇㅇ갤로그로 이동합니다. 11:48 30 0
717490 일반 Aider 벤치마크 비용 정상화 이후 비교 [1] ㅇㅇ(220.79) 11:47 24 0
717489 일반 근데 gpt4o 요즘 또 더 좋아진것 같은데 나만 그렇게 느낌? [1] ㅇㅇ(126.254) 11:46 21 0
717488 정보/ 속보) Aider 벤치마크 제작자 : 제미니 돈 더들어간다 [2] ㅇㅇ(220.79) 11:44 105 4
717487 일반 근데 왜 보이스,tts 쪽은 발전이 별로 없음? [1] ㅇㅇ(126.254) 11:44 26 0
717486 정보/ IBM,ㅡ AI로 인력 재편... 전체 고용은 오히려 증가 [6] ㅇㅇ갤로그로 이동합니다. 11:43 63 2
717485 일반 트럼프 중대발표 테크쪽 얘기가 아니네 [10] ㅇㅇ갤로그로 이동합니다. 11:39 184 0
717484 일반 제미니 2.0에서 이미지 뽑는데 [5] ㅇㅇ(116.42) 11:39 74 0
717483 일반 아이큐 떡락이유는 이거지 ㅇㅇ갤로그로 이동합니다. 11:38 57 0
717482 일반 이자 원금 계산도 못하는 구글 AI [1] 무한탐구(218.234) 11:35 132 0
717481 일반 5월 잼황 아이큐 하락? [2] ㅇㅇ갤로그로 이동합니다. 11:31 143 2
717480 일반 구글 ai스튜디오 원래 좀 끊기나 [1] ㅇㅇ(121.142) 11:30 55 0
717479 일반 모솔인데 gpt한테 전반적인 헤어,패션, 화장품 같은 질문해도 되나? [3] ㅇㅇ(211.203) 11:30 45 0
717478 일반 보니까 구글 분할빔 맞으면 지금보다 더 심해질듯 ㅇㅇ(121.144) 11:29 59 0
717477 일반 갑자기 모든 중국인과 이슬람이 사라진 세상 [2] ㅇㅇ갤로그로 이동합니다. 11:26 67 0
717475 일반 요즘 라이브벤치는 그냥 쓰레기 된거 같네 [1] ㅇㅇ갤로그로 이동합니다. 11:25 73 0
717474 일반 ais가 뭐임? [2] ㅇㅇ갤로그로 이동합니다. 11:25 77 0
717473 정보/ 미국, 국가별 등급에 따른 AI반도체 수출통제 계획 폐기 방침 니지카엘갤로그로 이동합니다. 11:23 79 0
717472 일반 삼성전자, ‘AI 생산성 혁신 그룹’ 신설 [4] ㅇㅇ(112.185) 11:23 97 0
717471 일반 지피티 무료쓰는데 한도 얼마나 줄은거임? [2] 불신갤로그로 이동합니다. 11:22 65 0
717470 일반 제미나이 프로 0506 reddit 반응 모음 [1] ㅇㅇ갤로그로 이동합니다. 11:21 163 2
717469 일반 2.5 잼황 5월달 코딩 벤치 궁금한데 왜 안돌리지 ㅋㅋ ㅇㅇ갤로그로 이동합니다. 11:21 35 0
717468 일반 확률 계산하는거해봤는데 ㅇㅇ(14.42) 11:16 41 0
717467 일반 4o는 비추론모델 아니었나? [7] ㅇㅇ갤로그로 이동합니다. 11:13 147 1
717466 일반 지브리풍 그림 딸깍 미쳤네. [2] ㅇㅇ갤로그로 이동합니다. 11:09 141 0
717465 일반 계속 소설 성능 개판됐다길래 써봤는데 진짜 개판됐네ㅋㅋㅋㅋ [2] ㅇㅇ(121.144) 11:02 222 0
717464 일반 다음 중 가장 돈을 많이 벌 수 있는 기술은? [5] ㅇㅇ(125.190) 11:02 125 0
717463 일반 ais 0506 작문 능력 떨어졌음? [1] ㅇㅇ(126.158) 11:01 106 0
717462 일반 그래도 나중에 몸이 아프지 않는 시대가 온다면 [1] ㅇㅇ(211.189) 10:55 97 0
717461 일반 지금 코딩 기준 제미니 vs 클로드 누가 우위임? [3] ㅇㅇ(121.142) 10:54 118 0
717460 일반 커스텀 gpt 다들 쓰냐? [2] ㅇㅇ(183.96) 10:53 70 0
717459 일반 ais 딸숭이 질문좀 [6] ㅇㅇ(115.95) 10:51 139 0
717458 일반 카카오, AI 메이트 '카나나' 일부 이용자 대상 시범 서비스 [2] ㅇㅇ(112.185) 10:50 174 2
717457 일반 챗gpt 유료 구독이후 체중감소했음 [2] Rokos갤로그로 이동합니다. 10:45 183 0
717456 일반 원시시대부터 지금까지 인간생활은 바뀌지 않아 [3] ㅇㅇ(183.101) 10:43 139 1
717455 일반 겨울이네ㅋㅋ [1] 먼데이갤로그로 이동합니다. 10:42 62 0
717454 일반 그록은 유료 1개월 사용결과 구토욱갤로그로 이동합니다. 10:41 100 0
717453 일반 월 세전 500버는데 챗gpt 구독할돈 없다 [7] Rokos갤로그로 이동합니다. 10:40 259 0
717452 일반 코딩안할꺼면 잼민이 구독하는게 나음? [4] ㅇㅇ(210.178) 10:37 101 0
717451 일반 아 지피티 왤케 시발 멍청하지 ㅇㅇ갤로그로 이동합니다. 10:31 70 0
717450 일반 한국 시차로 그록 오늘은 나올일 없겠네 [1] MCmh860pt갤로그로 이동합니다. 10:29 112 0
717449 일반 지피티 한 8개월썼는데 구취했다.. [2] 세종대가고싶어서울었어갤로그로 이동합니다. 10:28 232 1
717448 일반 검열 적은 xai가 agi 완성했으면 좋겠는데 ㅇㅇ갤로그로 이동합니다. 10:27 52 0
717447 일반 디씨 댓글 시간표시 살짝 바뀜 [6] 바다기린갤로그로 이동합니다. 10:25 205 0
717445 일반 머스크 새 트윗 [4] 데이터센터속천재들의나라갤로그로 이동합니다. 10:21 517 8
717444 일반 야설 쓰려면 그록이 맞는 거 같은데 [5] ㅇㅇ갤로그로 이동합니다. 10:19 173 0
뉴스 ‘금주를 부탁해’ 공명 “’첫사랑’ 아이콘 욕심” 디시트렌드 05.07
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2