디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 텍스트, 비전, 오디오 데이터를 하나의 신경망에서 .. 어떻게했을까

ㅇㅇ(121.143) 2024.05.14 12:32:58
조회 85 추천 0 댓글 4
														

기존 LLM은 텍스트를 많이 학습한거고,


비전은 이미지 학습, 오디오는 사람들 목소리 학습(유튜브에서든 어디서든) 인데


오디오랑 텍스트랑 연결하는걸 어떻게 했을까 ㄷㄷㄷ 이부분이 기술적 도약이라고 봄 


그리고 그냥 데이터 다 짬뽕시켜놓고 스케일 키웠더니, AI가 output으로 감정표현하고 노래부르는 오디오를 만들어냈다? 이게 말이됨? 이게 안신기해? 

자동등록방지

추천 비추천

0

고정닉 0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
483708 정보/ 정부, 뉴욕대에 'AI랩' 구축…공동소장으로 얀 르쿤 선임 [54] ㅇㅇ갤로그로 이동합니다. 05.29 2610 25
483707 일반 5도 안냈는데 벌써 6 훈련하는거 괘씸하네... [6] ㅇㅇ(118.235) 05.29 364 0
483706 일반 요즘 국제정세 방송 많이 보는데 [13] ㅇㅇ(117.20) 05.29 385 1
483705 일반 4o 전에는 4보다 10배는 빨랐는데 지금은 [2] ㅇㅇ갤로그로 이동합니다. 05.29 293 0
483704 일반 코딩ㅈ도 모르는 특붕이 사이트 만들어옴 [2] ㅇㅇ(104.28) 05.29 352 2
483703 일반 이거 뭐냐 gpt5냐 [2] ㅇㅇ갤로그로 이동합니다. 05.29 389 1
483702 일반 나는 인간을 믿지 못한다. 초인공지능을 믿을 뿐. [6] oo(110.11) 05.29 145 0
483701 일반 강아지도 영생하겠지? [3] 난난난갤로그로 이동합니다. 05.29 207 0
483700 일반 GPT5는 8월에나오냐? ㅇㅇ(135.125) 05.29 59 0
483699 일반 근데 llm 은 문돌이네 난난난갤로그로 이동합니다. 05.29 91 1
483698 일반 연금개혁 필요없다!!!!!! [1] ㅇㅇ(121.146) 05.29 155 0
483697 일반 gpt5는 진짜 결제하고 써볼까 생각 중 ㅁㅁ(39.7) 05.29 82 0
483696 일반 멀티모달 공개 2주 지남 [2] ㅇㅇ갤로그로 이동합니다. 05.29 186 0
483695 일반 개인적으로 나는아직 ai는많이부족하다생각함 [3] ㅇㅇ(135.125) 05.29 164 2
483694 일반 소라도 대선 이후에 내는데 gta5도 그러겟져 ㅇㅅㅇ [1] ㅇㅇ(122.36) 05.29 140 0
483693 일반 근데 open ai 얘네 챗gpt 거의완벽하게만들어내면은출시안하는거아님? ㅇㅇ(180.65) 05.29 86 0
483692 일반 진짜 성능 작살나게 좋은갑네 [6] ㅇㅇ(117.20) 05.29 580 0
483691 일반 외국에선 특슬람들을 뭐라 부름? [4] ㅇㅇ(14.38) 05.29 222 1
483690 일반 4o 개느려졌네 [1] ㅇㅇ갤로그로 이동합니다. 05.29 87 0
483689 일반 옴니 사용가능해?? ㅇㅇ갤로그로 이동합니다. 05.29 28 0
483688 일반 8월에 뭐 또나오고 gta5 11월 아님 내년초일거에여 ㅇㅅㅇ [3] ㅇㅇ(122.36) 05.29 165 0
483687 일반 반려 AI도 언젠가 생기겠지? [5] ㅇㅇ(180.69) 05.29 126 0
483686 일반 존버906일차 [2] alphaca갤로그로 이동합니다. 05.29 59 0
483685 일반 갤주 신작까지 20일 ㄷㄷㄷㄷ [1] alphaca갤로그로 이동합니다. 05.29 130 1
483684 정보/ 모건스탠리 "AI PC, 2028년 64% 차지...클라우드 비중 감소" [1] ㅇㅇ갤로그로 이동합니다. 05.29 282 4
483683 일반 레커옹은 컴퓨터과학 전공이잖아 난난난갤로그로 이동합니다. 05.29 135 1
483682 정보/ xAI, 8조 투자 유치...오픈AI 이어 세계 2위 AI 기업으로 급상 [1] ㅇㅇ갤로그로 이동합니다. 05.29 305 6
483681 정보/ "생성 AI 퀄리티 아직 부족...크리에이터 사용 줄어들어" [3] ㅇㅇ갤로그로 이동합니다. 05.29 346 5
483680 일반 생각해보니 5는 아닌거 같은데 [6] ㅇㅇ(58.29) 05.29 213 0
483679 일반 줄기세포 당뇨 완치… [5] ㄴㄱ(58.141) 05.29 248 1
483678 일반 캐릭터ai가그렇게성능이안나쁘지않음? ㅇㅇ(135.125) 05.29 43 0
483677 일반 오늘 나온 숫자 논문이 이거 해결 가능한거냐? [1] ㅇㅇ(122.43) 05.29 50 0
483676 정보/ "AI 채팅이 외로움 완화에 도움 줄 수 있어" [1] ㅇㅇ갤로그로 이동합니다. 05.28 239 4
483675 일반 캐릭터ai는 개쓰레기인데 ㅇㅇ(175.201) 05.28 77 0
483674 정보/ 세계 최초 '바이오 프로세서' 플랫폼 등장...인간 뇌 오가노이드 사용 [2] ㅇㅇ갤로그로 이동합니다. 05.28 341 14
483673 일반 근데 합리적으로 생각해보면 새로 훈련시키는 모델은 5o거나 6아니냐? [4] ㅇㅇ(111.91) 05.28 127 0
483672 일반 Gpt5 올연말 각이냐? ㅇㅇ(58.29) 05.28 68 0
483670 정보/ "쏟아지는 AI 관련 발표...내년 초에는 어느 정도 정리될 것" [1] ㅇㅇ갤로그로 이동합니다. 05.28 321 2
483669 일반 엔드류양은 또뭐냐? ㅋㅋ [5] ㅇㅇ(59.11) 05.28 171 0
483668 일반 니들은 딱 2025년에 AGI 출시되면 [6] ㅇㅇ(112.158) 05.28 308 1
483666 일반 지금 재난문자 뭐냐 ㅅㅂ [6] ㅇㅇ(61.97) 05.28 388 0
483665 일반 와 세상 좋아졌네 일주일 걸리는 숙제를 5초컷 ㅋㅋㅋ [5] 직캠러(121.159) 05.28 465 1
483664 일반 GPT4o가 멀티모달임? [2] ㅇㅇ갤로그로 이동합니다. 05.28 96 0
483663 일반 Ai캐릭터챗봇이 해당캐릭터성격구현95프로할려면얼마나남음? [10] ㅇㅇ(135.125) 05.28 153 0
483662 AI창 gpt4o의 이미지 멀티모달이 거짓말인 이유 [5] ㅇㅇ갤로그로 이동합니다. 05.28 359 0
483661 일반 우리는 개씨발 좆쩌는것을 개발했고 세상이 뒤집어질 것 [1] ㅇㅇ(172.226) 05.28 139 1
483660 일반 90일 안전 점검 저거 gpt5 야? gpt6 야?? [2] ㅇㅇ갤로그로 이동합니다. 05.28 159 0
483659 정보/ 앤드류 양 "AI세금이 필요하며 GPU에 세금을 부과하는 게 가장 쉬워" [5] ㅇㅇ(125.191) 05.28 399 1
483658 일반 레이 커즈와일 '특이점이 온다' 예측 점검. (팩트체크) [17] ㅇㅇ갤로그로 이동합니다. 05.28 586 14
483657 일반 입문자인데 본인선형충임? 특슬람이나? [10] ㅇㅇ(135.125) 05.28 216 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2