디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다앱에서 작성

rtOS갤로그로 이동합니다. 2024.05.14 15:52:12
조회 7075 추천 53 댓글 43
														

74e9847ebd82618723e880914f9c706a2ae8480ff4ddabe8b4d68c6ba3acf65dd0830c0c4229932457a48ecd3463799658e0417421

질문 : 음성 출력을 2배속으로 할 수 있나요?

사람들은 GPT-4o를 오해하고 있는 것 같아. 
이건 텍스트 모델에 음성이나 이미지 부착이 있는 게 아니야. 
원래부터 다중 모달 입력, 다중 모달 출력 모델이야. 
빠르게 말하게 하고 싶어? 그냥 명령하면 돼. 
고래 소리로 번역해야 해? 몇 가지 예시만 주면 돼




그러니까 GPT-4o는 
LLM 모델(텍스트 → 텍스트) +   TTS 모델(텍스트 → 음성)  조합이 아니라
본질적으로 하나의 모델이고 기존과는 달리 텍스트로 표현하기 어려운 어떤 소리든 만들어 낼 수 있다는 뜻 ㄷㄷㄷ



또한 소리를 들을때도 STT 모델(음성 → 텍스트)로 LLM 모델에 텍스트로 변환된 정보를 입력해주는게 아니기 때문에, 텍스트로 표현되지 못하는 온갖 소리도 인식할 수 있다는 의미 ㄷㄷㄷ



게다가 이미지를 인식할때도 비전 모델(이미지 → 텍스트)로 LLM 모델에 텍스트로 변환된 정보를 입력해주는게 아니기 때문에, 텍스트로 표현할때 무시되는 온갖 사소한 디테일도 인식할 수 있다는 의미 ㄷㄷㄷ



**해당 능력들은 데모에서 선보인 것들이고
몇주 뒤에 출시예정이고 현재는 멀티모달 능력은 잠겨있음
자동등록방지

추천 비추천

53

고정닉 32

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 7815 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3091] 특갤용갤로그로 이동합니다. 23.08.06 39161 43
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7203 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 13294 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 8910 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8335 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9119 30
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22696 33
484225 정보/ OpenAI, 무료 유저에게 기능 오픈 [7] ㅇㅇ(210.110) 09:05 773 15
484206 정보/ '모라' 미쳤는데 이거 gpt5 에 통합될듯 ㅋㅋ [38] ㅇㅇ(125.134) 07:43 852 16
484167 정보/ MS, 미세조정 기술 '로라' 개선한 '모라' 공개 [5] ㅇㅇ갤로그로 이동합니다. 01:46 1058 22
484116 일반 몇일동안 얀르쿤 VS 머스크 키베 요약 [33] 있었갤로그로 이동합니다. 05.29 2260 26
483759 정보/ 샘알트만 재산 절반 기부 서명 [45] 특술람갤로그로 이동합니다. 05.29 3150 32
483708 정보/ 정부, 뉴욕대에 'AI랩' 구축…공동소장으로 얀 르쿤 선임 [54] ㅇㅇ갤로그로 이동합니다. 05.29 2515 25
483634 정보/ 오픈AI 글로벌 부사장 "우리의 사명은 초지능 구축이 아니다" [15] ㅇㅇ갤로그로 이동합니다. 05.28 3360 26
483580 정보/ 오랜만에 재밌게 읽은 논문(트랜스포머 계산문제 해결) [13] ㅇㅇ(119.77) 05.28 2459 33
483576 일반 큰거 떴는데 [25] ㅇㅇ갤로그로 이동합니다. 05.28 4435 26
483217 정보/ 알파고로 보는 AI가 보여줄 미래 [27] ㅇㅇ(59.26) 05.27 4322 33
483143 일반 얀르쿤 다크나이트 맞음 ㅇㅇ [45] ㅇㅇ(218.147) 05.27 3798 39
483130 정보/ 리사 수) 2027년까지 에너지 효율 100배 끌어올린다 [13] ㅇㅇ갤로그로 이동합니다. 05.27 3028 19
483122 정보/ NASA, '날씨 예측 모델' 오픈 소스 공개 [14] ㅇㅇ갤로그로 이동합니다. 05.27 2059 21
483121 정보/ 영화 '퓨리오사'에 생성 AI 활용..."아역에 주연 얼굴 합성" [12] ㅇㅇ갤로그로 이동합니다. 05.27 2471 20
483113 일반 머스크 까는 얀르쿤 [34] ㅇㅇ갤로그로 이동합니다. 05.27 3261 35
483018 정보/ 이세돌 9단 “AI 발전은 긍정적…두려워 말라” [52] ㅇㅇ(125.191) 05.27 3385 30
482996 정보/ 전 구글X COO 모가댓 "믿거나 말거나 AGI 늦어도 2027까지 온다 [32] ㅇㅇ(125.191) 05.27 3175 33
482974 정보/ “억대 연봉 옛말 됐다”…이 직원 4명분 AI가 도맡아 ‘대규모 칼바람’ [21] lightvector갤로그로 이동합니다. 05.27 2994 16
482985 일반 특붕쿤콘, 특붕쿤콘dlc가 출시됐습니다!!!!!! [56] ㅇㅇ갤로그로 이동합니다. 05.27 2029 37
482249 정보/ 컴퓨터 저장 장치의 가격은 1950년대 이후 기하급수적으로 하락했습니다. [28] 은바다갤로그로 이동합니다. 05.25 2979 17
482593 정보/ 머스크 "세계 최대 데이터센터 구축으로 AGI 본격 경쟁" [18] AGI#갤로그로 이동합니다. 05.26 3000 21
482432 정보/ 국내 최초 Ai 게임회사의 신작.jpg [25] ㅇㅇ(61.74) 05.25 5323 26
482862 일반 이 짤 ㅈㄴ 웃기네ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [17] ㅇㅇ(61.97) 05.26 4176 41
482728 일반 대체 우리 아버지 어머니 세대들은 '논문' 이거 어떻게 쓴거냐? [37] ㅇㅇ(58.29) 05.26 1613 22
482528 일반 아무튼 완장잘못맏는듯.... [5] ■x갤로그로 이동합니다. 05.26 870 13
482246 일반 일러스트레이터들에게 하고싶은 말 [27] 엠창인생막장의끝갤로그로 이동합니다. 05.25 1179 17
481987 일반 마크롱 대통령"AI는 혁명" [20] ㅇㅇ갤로그로 이동합니다. 05.24 5081 25
481992 일반 와 시o발 뭐냐......................? [33] ㅇㅇ(121.159) 05.24 6516 28
482101 일반 머스크 "AI가 미래 인간 일자리 전부 뺏어...노동은 취미 활동" [48] 내복맨갤로그로 이동합니다. 05.25 5097 29
482012 정보/ 코히어, 한국어 포함 23개 언어 지원 LLM 출시..."전작보다 강력 [10] ㅇㅇ(125.191) 05.25 3517 29
481981 일반 특이점 와 이 씨발 앰생선형충새끼들아ㅋㅋㅋㅋㅋㅋㅋㅋㅋ [38] ㅇㅇ(218.52) 05.24 4712 50
481938 일반 전율의 2023 [43] agi2024갤로그로 이동합니다. 05.24 3880 41
481774 일반 이 모델 하나면 니들이 빠는 모델 전원 몰살 가능함ㅋㅋㅋㅋㅋ [13] ㅇㅇ갤로그로 이동합니다. 05.24 1815 18
481690 일반 얀르쿤.. 얀르쿤..! 오보에테.. 나이..? [2] ㅇㅇ(221.140) 05.24 953 22
481644 일반 [충격] 얀르쿤 초지능AI 프로젝트 시작한다 [46] ㅇㅇ(218.147) 05.24 3930 32
481635 정보/ 바이두 CEO "인간만큼 똑똑한 AI, 10년도 더 걸릴 것" [19] ㅇㅇ(125.191) 05.24 1013 12
481559 정보/ '금문교 클로드' 사용 가능 [17] ㅇㅇ(119.77) 05.24 988 13
481333 일반 OpenAI "차세대 모델은 1~2년 안 비교할 수 없을 정도로 발전" [60] ㅇㅇ(125.191) 05.24 5666 32
481306 정보/ 멀티모달 에이전트 예시 영상 바로보기 [6] ㅇㅇ갤로그로 이동합니다. 05.23 542 15
481297 정보/ GPT보이스 데모 풀영상 바로보기 [10] ㅇㅇ갤로그로 이동합니다. 05.23 628 13
481181 일반 "인공지능 시대 기본.소득으로 준비" [10] ㅇㅇ(116.120) 05.23 708 15
480830 정보/ 경기도 공무직 시간외수당 정산, 챗GPT로 자동화했다 [33] ㅇㅇ(124.56) 05.23 4768 29
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2