디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 왜 영어에서 LLM의 성능이 가장 좋냐면

ㅇㅇ갤로그로 이동합니다. 2024.05.17 06:37:49
조회 362 추천 3 댓글 3
														

단순히 데이터가(그것도 *양질의*) 많아서 그렇다고 하면 안와닿을수도 있을텐데

이전에 유명했던 세종대왕 맥북 던짐 사건같을걸 예시로 들께


만약 세종대왕과 그와 연결된 조.선시대, 시대상, 한반도 역사 같은 텍스트를 촘촘하게 학습했다면


그 관련된 키워드 사이의 연관성에 대해 LLM이 알게돼 일종의 이해 비슷한걸 하는거지


아 한반도의 역사는 이렇고 조.선시대는 몇백년쯤 전이고 등등


학습된 데이터가 적다면 세종대왕은 알겠는데 어느시대 사람인지 모호하고 설사 연도로서 알더라도 정확한 시대에 대해 이해를 못하고 있다던가 하는거야


점묘화를 떠올려봐 점을 듬성듬성 찍으면 뭘 그리려고 하는지 이해할수 없지만 점을 많이 찍으면 많이 찍을수록 표현하고자 하는 대상이 명확해지는거지


영어와 한국어 학습 데이터양은 수십배가 차이가나


영어가 형성하는 월드모델이 8K 해상도라면 한국어는 기껏해야 HD 수준밖에 안된다는거지


바꿔말하면 지식의 양의 차이가 지혜의 차이와도 연결된다고 봐도 얼추 맞을거야


정확한 예시는 아니지만 대충 무슨말인지 이해할거라봐


물론 언어가 달라도 영어에서 학습했던 개념들이 한국어 생성에도 영향을 끼치기 때문에 어느정도 상향표준화가 되기는해


그러면 OAI에서 그냥 가장 좋은 영어로만 출력되게 번역 과정을 중간에 끼어넣으면 되는거 아니냐하면


뭐 최상의 성능을 위해서라면 그렇게해도돼.


그런데 한국어도 알고 일본어 아랍어 등등을 다 알고 학습한애한테 그러한 언어생성을 완전히 막아버리라고 말하는건 좀  이상하지?

자동등록방지

추천 비추천

3

고정닉 3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
487874 일반 틋붕이들 잘장 !!!! [4] ㅇㅇ갤로그로 이동합니다. 06.07 155 1
487873 일반 아 여기 새벽에도 글리젠 있는게 전부 봇이었음? [2] ㅇㅇ갤로그로 이동합니다. 06.07 132 1
487872 일반 특붕이는 빙고 얼마큼 나오냐? ㅇㅇ(223.38) 06.07 112 0
487871 일반 근데 특붕이들 말투가 다 비슷함 [9] ㅇㅇ갤로그로 이동합니다. 06.07 281 0
487870 일반 [오피셜] voice mode ㅇㅇ(122.34) 06.07 424 0
487869 일반 근데 너넨 직업이 뭐임? 궁금해서.. [11] ㅇㅇ갤로그로 이동합니다. 06.07 420 0
487868 일반 근들갑 ㅈ박으니까 그림떡밥가는거 보소 ㅇㅇ(223.38) 06.07 72 0
487867 일반 아직 특붕이들이 패배한게 아닌 이유 [1] ㅇㅇ갤로그로 이동합니다. 06.07 171 0
487866 일반 그림떡밥도는거보니 오늘 별거없네 [2] Jackey갤로그로 이동합니다. 06.07 154 0
487864 일반 야 우냐? ㅋ 우냐? ㅋ 우냐? ㅋ 우냐? ㅋ 우냐? ㅋ [3] ㅇㅇ(119.202) 06.07 187 0
487863 일반 특레발 레전드 ㅇㅇ(223.38) 06.07 194 0
487861 일반 환쌤들만 난리치는건 아님 저작권에 민감하거나 관련 직업이면 [2] ㅇㅇ(119.66) 06.07 161 0
487860 일반 그림쪽 전문가 있음? [1] ㅇㅇ(106.101) 06.07 81 0
487859 일반 좋은 모델 좋은 로라 갤럭시빠갤로그로 이동합니다. 06.07 65 0
487858 일반 ai로 벌레 만들어 보셈 개잘만듬 ㅇㅇ갤로그로 이동합니다. 06.07 112 0
487857 일반 Ai그림 실사는 좀 티가 나지 않음? [3] ㅇㅇ(106.101) 06.07 189 0
487856 일반 ai창작에 반대하는 이유 존나 다들 착각하는데 [2] ㅇㅇ(203.234) 06.07 129 0
487855 일반 카운트다운 기대햇는데 [2] Jackey갤로그로 이동합니다. 06.07 181 0
487854 일반 오 3시다 ! ㅇㅇ(116.44) 06.07 122 0
487851 일반 ai 쓰지마라 = 종이컵으로 전화해라 ㅋㅋ ㅇㅇ갤로그로 이동합니다. 06.07 61 1
487849 일반 AI그림 쓰면 안된다는 논리가 말이 안되는게 [5] ㅇㅇ(182.222) 06.07 240 0
487848 일반 근데 gpt-5 나오면 세상이 얼마나 바뀜? [4] ㅇㅇ갤로그로 이동합니다. 06.07 235 0
487847 일반 근데 국내에서 sora랑 gpt5 쓴느사람들 있지않음? [8] ㅇㅇ갤로그로 이동합니다. 06.07 184 0
487846 일반 아시발 이새끼들 엔비디아같네 갤럭시빠갤로그로 이동합니다. 06.07 88 0
487844 일반 oai가 공개 안해도 여유로운 이유 ㅎㅎ(61.82) 06.07 74 0
487842 일반 근데 진짜 아무것도 없으니까 ㅈ같노 ㅇㅇ(118.235) 06.07 58 0
487841 일반 나온게 도대체 뭐임? ㅇㅇ(223.38) 06.07 62 0
487840 일반 한국시각 06월 07일 03:00...NEW VOICE MODE .. ㅎㅎ(61.82) 06.07 111 0
487838 일반 20분 남았네 ㅋㅋ [2] Dall리신(121.157) 06.07 164 0
487837 일반 38분전 뉴스 ㅇㅇ(59.20) 06.07 92 1
487836 일반 난 소비자 입장에서 ai그림 왜 싫어하는지 모르겠다 [14] lightvector갤로그로 이동합니다. 06.07 335 1
487835 일반 3시다. 혁명 성공까지 아직 20분 남았다. 지혜원갤로그로 이동합니다. 06.07 80 0
487834 일반 솔직히 GPT-5 아직 배포 안 하는 건 이해하는데 ㅇㅇ(119.202) 06.07 106 0
487833 일반 걍 자러간다 [1] ㅇㅇ(223.39) 06.07 58 0
487832 일반 OAI한테 실망해도 이거보다 나은게 전세계에 없으니까 기대하게 된다 [2] ㅎㅎ(61.82) 06.07 152 0
487831 일반 오피셜) ㅇㅇ갤로그로 이동합니다. 06.07 179 1
487830 일반 항상 한국시간으로 3시에뜸? [1] Jackey갤로그로 이동합니다. 06.07 125 0
487829 일반 oai 벌써 한계점 도달했노 ㅇㅇ(180.66) 06.07 105 3
487828 일반 근데 미국은 아직 10시밖에 안됨 [4] ㅇㅇ갤로그로 이동합니다. 06.07 167 0
487827 일반 ai 쓴걸로 의심받는 웹툰작가 해명 ㅋㅋ [22] 갤럭시빠갤로그로 이동합니다. 06.07 536 2
487826 일반 특붕이의 마음을 가지고 논 리커 3명 [2] ㅇㅇ(112.144) 06.07 151 0
487825 일반 결국 새벽 3시였다 ㅎㅎ(61.82) 06.07 88 0
487823 일반 필독) 특붕이가 똑똑한 이유 ㅇㅇ갤로그로 이동합니다. 06.07 103 1
487822 일반 다 끝났네 [1] ㅇㅇ(182.222) 06.07 115 0
487821 일반 학습능력 없는 애들이 왜이리 많이 보일까 [5] ㅇㅇ(121.134) 06.07 232 1
487819 일반 진심 존나 화나네... 오랜만에 딥빡친다. [1] ㅇㅇ(203.234) 06.07 160 0
487818 일반 OpenAI연구원 스티븐 하이델 NEW 트윗 [4] ㅇㅇ(112.144) 06.07 370 1
487817 일반 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ갤로그로 이동합니다. 06.07 128 0
487816 일반 자러간다 [1] ㅇㅇ(221.157) 06.07 121 0
487815 일반 ㅅㅂ 좀 기다려라 애들아 [2] ㅇㅇ갤로그로 이동합니다. 06.07 249 4
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2