디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 왜 영어에서 LLM의 성능이 가장 좋냐면

ㅇㅇ갤로그로 이동합니다. 2024.05.17 06:37:49
조회 356 추천 3 댓글 3
														

단순히 데이터가(그것도 *양질의*) 많아서 그렇다고 하면 안와닿을수도 있을텐데

이전에 유명했던 세종대왕 맥북 던짐 사건같을걸 예시로 들께


만약 세종대왕과 그와 연결된 조.선시대, 시대상, 한반도 역사 같은 텍스트를 촘촘하게 학습했다면


그 관련된 키워드 사이의 연관성에 대해 LLM이 알게돼 일종의 이해 비슷한걸 하는거지


아 한반도의 역사는 이렇고 조.선시대는 몇백년쯤 전이고 등등


학습된 데이터가 적다면 세종대왕은 알겠는데 어느시대 사람인지 모호하고 설사 연도로서 알더라도 정확한 시대에 대해 이해를 못하고 있다던가 하는거야


점묘화를 떠올려봐 점을 듬성듬성 찍으면 뭘 그리려고 하는지 이해할수 없지만 점을 많이 찍으면 많이 찍을수록 표현하고자 하는 대상이 명확해지는거지


영어와 한국어 학습 데이터양은 수십배가 차이가나


영어가 형성하는 월드모델이 8K 해상도라면 한국어는 기껏해야 HD 수준밖에 안된다는거지


바꿔말하면 지식의 양의 차이가 지혜의 차이와도 연결된다고 봐도 얼추 맞을거야


정확한 예시는 아니지만 대충 무슨말인지 이해할거라봐


물론 언어가 달라도 영어에서 학습했던 개념들이 한국어 생성에도 영향을 끼치기 때문에 어느정도 상향표준화가 되기는해


그러면 OAI에서 그냥 가장 좋은 영어로만 출력되게 번역 과정을 중간에 끼어넣으면 되는거 아니냐하면


뭐 최상의 성능을 위해서라면 그렇게해도돼.


그런데 한국어도 알고 일본어 아랍어 등등을 다 알고 학습한애한테 그러한 언어생성을 완전히 막아버리라고 말하는건 좀  이상하지?

자동등록방지

추천 비추천

3

고정닉 3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3135] 특갤용갤로그로 이동합니다. 23.08.06 39928 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [2] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2711 2
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7426 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 13616 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 9088 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8607 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9320 30
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 8219 34
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22967 33
487845 일반 카운트 세던 씹새끼는 뭐냐? ㅇㅇ(112.171) 02:47 1 0
487844 일반 oai가 공개 안해도 여유로운 이유 ㅎㅎ(61.82) 02:46 14 0
487843 일반 국내에서 gpt5 쓰고있는사람 있냐?? [1] ㅇㅇ갤로그로 이동합니다. 02:46 15 0
487842 일반 근데 진짜 아무것도 없으니까 ㅈ같노 ㅇㅇ(118.235) 02:45 11 0
487841 일반 나온게 도대체 뭐임? ㅇㅇ(223.38) 02:45 9 0
487840 일반 한국시각 06월 07일 03:00...NEW VOICE MODE .. ㅎㅎ(61.82) 02:45 17 0
487839 일반 국내에도 소라 쓰는사람있음? [6] ㅇㅇ갤로그로 이동합니다. 02:45 38 0
487838 일반 20분 남았네 ㅋㅋ [2] Dall리신(121.157) 02:44 24 0
487837 일반 38분전 뉴스 ㅇㅇ(59.20) 02:43 40 1
487836 일반 난 소비자 입장에서 ai그림 왜 싫어하는지 모르겠다 [7] lightvector갤로그로 이동합니다. 02:42 81 0
487835 일반 3시다. 혁명 성공까지 아직 20분 남았다. 지혜원갤로그로 이동합니다. 02:41 37 0
487834 일반 솔직히 GPT-5 아직 배포 안 하는 건 이해하는데 ㅇㅇ(119.202) 02:40 47 0
487833 일반 걍 자러간다 [1] ㅇㅇ(223.39) 02:39 34 0
487832 일반 OAI한테 실망해도 이거보다 나은게 전세계에 없으니까 기대하게 된다 [2] ㅎㅎ(61.82) 02:36 82 0
487831 일반 오피셜) ㅇㅇ갤로그로 이동합니다. 02:36 100 0
487830 일반 항상 한국시간으로 3시에뜸? [1] Jackey갤로그로 이동합니다. 02:35 80 0
487829 일반 oai 벌써 한계점 도달했노 ㅇㅇ(180.66) 02:34 62 3
487828 일반 근데 미국은 아직 10시밖에 안됨 [4] ㅇㅇ갤로그로 이동합니다. 02:33 114 0
487827 일반 ai 쓴걸로 의심받는 웹툰작가 해명 ㅋㅋ [20] 갤럭시빠갤로그로 이동합니다. 02:30 287 2
487826 일반 특붕이의 마음을 가지고 논 리커 3명 [2] ㅇㅇ(112.144) 02:29 105 0
487825 일반 결국 새벽 3시였다 ㅎㅎ(61.82) 02:28 70 0
487824 일반 새벽3시라고!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! [3] ㅇㅇ갤로그로 이동합니다. 02:28 161 3
487823 일반 필독) 특붕이가 똑똑한 이유 ㅇㅇ갤로그로 이동합니다. 02:28 80 1
487822 일반 다 끝났네 [1] ㅇㅇ(182.222) 02:27 84 0
487821 일반 학습능력 없는 애들이 왜이리 많이 보일까 [5] ㅇㅇ(121.134) 02:25 169 1
487820 일반 와 큰거왔다 ㅇㅇ(59.6) 02:25 116 0
487819 일반 진심 존나 화나네... 오랜만에 딥빡친다. [1] ㅇㅇ(203.234) 02:23 120 0
487818 일반 OpenAI연구원 스티븐 하이델 NEW 트윗 [4] ㅇㅇ(112.144) 02:23 231 1
487817 일반 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ갤로그로 이동합니다. 02:21 109 0
487816 일반 자러간다 [1] ㅇㅇ(221.157) 02:21 105 0
487815 일반 ㅅㅂ 좀 기다려라 애들아 [2] ㅇㅇ갤로그로 이동합니다. 02:20 190 4
487814 일반 지금 알트만 예상 [1] 이세이미야케갤로그로 이동합니다. 02:20 159 5
487813 일반 다이내믹 로동 ㅇㅇ(59.6) 02:19 39 0
487812 일반 오늘자 블룸버그피셜 OAI/샘알트만 [1] ㅇㅇ(221.142) 02:16 219 2
487811 일반 이번엔 또 뭔 떡밥인데 ㅇㅇ(122.47) 02:16 90 0
487810 일반 GPT-4o New Voice Mode Alpha Release [1] ㅇㅇ(119.202) 02:16 199 0
487809 일반 이새끼들 추진력 얻으려고 한번 꿇었네 ㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 02:16 70 0
487808 일반 특슬람 멸망 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(118.235) 02:15 77 0
487807 일반 oai 슬슬 거품같노 ㅇㅇ [5] ㅇㅇ(14.53) 02:11 256 0
487806 일반 진짜 떴다!! ㅇㅇ(182.31) 02:11 117 0
487804 일반 진짜 개망했네 십련들 ㅇㅇ갤로그로 이동합니다. 02:10 106 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2