디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다앱에서 작성

rtOS갤로그로 이동합니다. 2024.05.14 15:52:12
조회 7167 추천 53 댓글 42
														

74e9847ebd82618723e880914f9c706a2ae8480ff4ddabe8b4d68c6ba3acf65dd0830c0c4229932457a48ecd3463799658e0417421

질문 : 음성 출력을 2배속으로 할 수 있나요?

사람들은 GPT-4o를 오해하고 있는 것 같아. 
이건 텍스트 모델에 음성이나 이미지 부착이 있는 게 아니야. 
원래부터 다중 모달 입력, 다중 모달 출력 모델이야. 
빠르게 말하게 하고 싶어? 그냥 명령하면 돼. 
고래 소리로 번역해야 해? 몇 가지 예시만 주면 돼




그러니까 GPT-4o는 
LLM 모델(텍스트 → 텍스트) +   TTS 모델(텍스트 → 음성)  조합이 아니라
본질적으로 하나의 모델이고 기존과는 달리 텍스트로 표현하기 어려운 어떤 소리든 만들어 낼 수 있다는 뜻 ㄷㄷㄷ



또한 소리를 들을때도 STT 모델(음성 → 텍스트)로 LLM 모델에 텍스트로 변환된 정보를 입력해주는게 아니기 때문에, 텍스트로 표현되지 못하는 온갖 소리도 인식할 수 있다는 의미 ㄷㄷㄷ



게다가 이미지를 인식할때도 비전 모델(이미지 → 텍스트)로 LLM 모델에 텍스트로 변환된 정보를 입력해주는게 아니기 때문에, 텍스트로 표현할때 무시되는 온갖 사소한 디테일도 인식할 수 있다는 의미 ㄷㄷㄷ



**해당 능력들은 데모에서 선보인 것들이고
몇주 뒤에 출시예정이고 현재는 멀티모달 능력은 잠겨있음
자동등록방지

추천 비추천

53

고정닉 32

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
489514 정보/ 지렸다 GPT-2 만들기 영상 올라옴 [9] 초존도초갤로그로 이동합니다. 06.10 1155 16
489246 일반 유니트리 휴머노이드 로봇 이거 사기 아님? [95] ㅇㅇ(211.226) 06.10 3825 26
489232 일반 최신 llm ai들이 추론붕괴 현상을 보임 [42] ㅇㅇ(106.101) 06.10 5180 38
489209 정보/ 노벨상 연구 공부한 AI 화학자, 4분만에 새 화학실험 방법 내놨다 [20] ㅇㅇ갤로그로 이동합니다. 06.10 2263 21
489180 일반 하루만 기다리면 특이점이 와요! [17] ㅇㅇ(1.239) 06.10 4422 23
489053 일반 이제 그냥 다 개ㅈ같으면 개추ㅋㅋㅋ [16] ㅇㅇ(103.150) 06.09 5563 61
488996 일반 kling 성능 진짜 미쳤다 [12] ㅇㅇ갤로그로 이동합니다. 06.09 1613 15
488976 일반 얀르쿤 "기하급수적 발전이란 것은 없다" [53] ㅇㅇ(119.197) 06.09 5593 49
488851 일반 중국판 소라 홍보영상인데 좀 쩌네 [32] lightvector갤로그로 이동합니다. 06.09 4302 20
488785 AI창 Meta 수석 인공지능 과학자 얀 르쿤 전용 주제가(BGM, OST) [18] ㅇㅇ갤로그로 이동합니다. 06.08 2871 23
488700 일반 Bit LoRA (3.8B 규모 비트넷 실험) [18] 람냥갤로그로 이동합니다. 06.08 3052 31
488662 일반 중국판 소라 이 기능 존나 미쳤는데???? [40] lightvector갤로그로 이동합니다. 06.08 5713 46
488623 일반 뤼x 금지어 건의함 [3] ㅇㅇ(14.55) 06.08 1977 23
488600 일반 이새끼 하나면 니들이 빠는 초지능따위 싹 다 몰살가능함ㅋㅋㅋㅋ [19] ㅇㅇ(211.36) 06.08 3769 32
488531 정보/ GPT류 챗봇 쓰는 사람들 개꿀팁 준다 들어와봐라.txt [48] lightvector갤로그로 이동합니다. 06.08 5664 43
488370 AI창 ||수정|| 아이유 데뷔초 생목까지 따라하는 AI ㄷㄷ [39] ㅇㅇ갤로그로 이동합니다. 06.08 4218 34
488019 정보/ 오늘 구글에서 낸 asi 논문 [41] ㅇㅇ(49.142) 06.07 5487 40
487986 정보/ 젠슨 황 "차세대 물결은 '물리적 AI'...모든 것이 로봇화될 것" [4] lightvector갤로그로 이동합니다. 06.07 2648 19
487974 정보/ 오픈AI, 챗GPT ‘환각’ 이유 밝힌다…역설계로 오작동 원인 추적 [18] lightvector갤로그로 이동합니다. 06.07 4844 21
487934 일반 걍 어찌됐건 oai는 약속 어긴거임 [32] ㅇㅇ(118.235) 06.07 4262 27
487517 정보/ 레오폴드 SITUATIONAL AWARENESS 요약 [48] 다이아몬드핸드갤로그로 이동합니다. 06.06 4596 55
487442 일반 지미 애플 해석해 주께. [18] mahogany갤로그로 이동합니다. 06.06 3818 22
487289 일반 6월 6일 오늘은 현충일이다 [19] ㅇㅇ(59.26) 06.06 3056 46
487185 정보/ 오픈 AI 퇴사자 "OpenAI, 미-중-러에 AGI 입찰 경쟁 시도" [24] ㅇㅇ(59.17) 06.06 4323 21
487069 정보/ 세계 최고 암연구소 논문 수십 편 조작 의혹 '파문' [17] ㅇㅇ갤로그로 이동합니다. 06.05 3019 21
487012 일반 내일 GPT-5 아니란 거에 양불알 다 건다 [60] ㅇㅇ(223.39) 06.05 4380 50
486935 정보/ 알트만 중국 스파이설이 ㄹㅇ 헛소리인 이유 [18] ㅇㅇ(112.221) 06.05 2331 39
486857 일반 AI 직업대체 긍정/부정 논쟁에서 가장 웃긴게 ㅋㅋ [23] lightvector갤로그로 이동합니다. 06.05 3979 37
486743 정보/ MS CTO "차세대 모델, 박사 과정 시험 통과할 수준" [47] ㅇㅇ(59.17) 06.05 3543 38
486676 정보/ 전현직 OAI 직원 11명, "첨단 인공지능에 대해 경고할 권리" [17] ㅇㅇ(119.77) 06.05 2310 17
486155 정보/ mmlu pro 업데이트 나옴 [23] ㅇㅇ갤로그로 이동합니다. 06.04 3056 25
486083 정보/ SD3 2b모델 6월 12일 공개 [4] ㅇㅇ(175.208) 06.04 1038 15
486034 AI창 elevenlabs 여자목소리 만들어봄 [44] ㅇㅇ갤로그로 이동합니다. 06.04 3781 28
485821 일반 이분이 갤주여야 되는 거 아님??? [48] oo(175.125) 06.03 5331 56
485635 정보/ 구글에서 AGI 정렬 매니저를 구인 중 [37] lightvector갤로그로 이동합니다. 06.03 4333 20
485745 일반 4년자 IT 개발자에 있어서 AI이후 많이 변했음 [72] ㅇㅇ(218.157) 06.03 5158 39
485406 일반 힌튼"AI 의사가 인간 의사보다 훨씬 뛰어나다" [39] ㅇㅇ갤로그로 이동합니다. 06.02 3945 34
485320 일반 십새끼 필터 과정 [19] ㅇㅇ갤로그로 이동합니다. 06.02 4891 37
485287 정보/ Elevenlabs 효과음 생성 AI 출시 [30] Ad_Astra갤로그로 이동합니다. 06.02 5716 70
485232 일반 6월6일 특갤 좆창날꺼 같으면 개추 ㅋㅋㅋ [16] ㅇㅇ(58.29) 06.02 5037 44
485155 정보/ 앤트로픽 cos "앞으로 3년이 내 직업의 마지막 일 수도" [52] 선갤러(125.191) 06.01 5592 45
485102 정보/ 샘알트만 "사회 전체 구조가 논쟁과 재구성을 겪게 될 것 " [27] ㅇㅇ(125.191) 06.01 4241 30
485099 정보/ 메타, 최강 비전 모델 ‘라마3-V’ 공개…"8B로 GPT-4V와 동급" [32] ㅇㅇ갤로그로 이동합니다. 06.01 3866 27
484999 정보/ ai로 영상의 각도를 바꿀 수 있습니다! [27] 한가운데갤로그로 이동합니다. 06.01 4045 26
484968 일반 gpt 4o가 거품 소리를 듣는 이유가 [16] ㅇㅇ(121.168) 06.01 5156 29
484926 일반 ToonCrafter 애니 그냥 스캠 광고 목적이 강한듯 [26] ㅇㅇ(218.158) 06.01 3994 47
484753 일반 이제보니까 도라에몽<-이새끼 특슬람 끝판왕 아니냐? [24] ㅇㅇ(1.236) 05.31 3737 34
484743 일반 제미니 탈옥시키니까 페미 말투도 개찰짐 [22] ㅇㅇ(218.144) 05.31 4566 28
484731 일반 제미니 특갤 학습도 잘했노 ㅋㅋ [17] ㅇㅇ(59.17) 05.31 3440 38
484655 정보/ KAIST, 물리학 20년 난제 풀어…"기존 메모리 1만배 늘릴 수 있다 [34] ㅇㅇ갤로그로 이동합니다. 05.31 3618 26
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2