디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 오늘 올라온 클로드3의 미친 언어 능력 테스트

ㅇㅇ(115.138) 2024.03.06 10:07:11
조회 3920 추천 42 댓글 13
														

원글 링크: https://twitter.com/hahahahohohe/status/1765088860592394250



번역된거 올려봄 번역은 클로드가 해줌:


오늘 @AnthropicAI의 새로운 모델 Claude 3 Opus를 테스트하는 동안 너무나 놀라운 일을 목격했습니다. 마치 기적 같은 느낌이었습니다. 거짓말처럼 들릴 수 있지만, 정말 그렇게 느껴졌습니다.


중요한 배경 설명을 하자면, 저는 지난 2년 동안 제 모국어인 체르케스어에 대한 자연어 처리 작업을 해왔습니다. 체르케스어는 매우 자원이 부족하고 인터넷 상에서의 존재감도 미미합니다. 체르케스-압하즈 고립어군에 속하며, 관련 언어가 없습니다. 복잡한 형태론과 제한된 데이터로 인해 언어 모델에게 심각한 도전이 됩니다.


이 기간 동안 저는 부족한 자료에서 6만 4천 개의 번역 쌍을 손수 모으고, 전문화된 모델(T5, MLM-100, NLLB-200 등)을 훈련시켜 적절한 러시아어-카바르디아어 기계 번역을 달성했습니다. Claude Opus로 실험을 해보기로 했습니다.


새로운 채팅을 시작하고 단어/문장의 번역 쌍 5,700개를 무작위로 선택하여 첨부했습니다. 이는 6만 4천 개 데이터셋의 일부에 불과하며, 전체 어휘를 다루지도 않습니다. 이 예제를 바탕으로 새로운 문장을 번역할 수 있는지 확인하기 위함이었습니다. 


별 기대 없이 러시아어로 된 간단한 문장 "I am lying in the bed"를 체르케스어로 번역해 달라고 요청했습니다. Claude는 완벽한 번역을 제공했을 뿐만 아니라 문법과 형태론까지 분석했습니다. 


분명히 운이 좋았고 이 문장이 예제에 있었을 거라고 생각했습니다. 그러나 아니었습니다. 데이터에 절대 있을 수 없는 독특한 문장을 만들어 보았습니다. 다시 한번 완벽한 번역과 분석이 이루어졌습니다. 


적은 양의 데이터로 Claude는 기계 번역을 위해 특별히 훈련된 제 전문 모델의 성능에 근접했습니다. 믿기지 않았습니다. 문학작품의 복잡한 구절, 최신 뉴스 기사, 심지어 문법과 표기 체계가 상당히 다른 다른 체르케스 방언의 텍스트로 더 테스트한 결과, Claude는 지속적으로 언어 구조에 대한 깊은 이해를 보여주었습니다. 


알 수 없는 단어를 지능적으로 유추하고, 차용어를 적절히 사용하며, 그럴듯한 어원 분석을 제공하고, 번역에서 원문의 스타일을 유지하고, 심지어 요청 시 새로운 용어를 만들어냈습니다. 이 모든 것이 샘플 세트에는 없었고, 단지 몇 천 개의 번역 쌍만 있었습니다.


체르케스어는 복잡한 형태론과 문법을 가진 매우 어려운 교착어입니다. 이러한 작업을 완수하려면 언어에 대한 깊은 이해가 필요하며, 동일한 입력이 주어졌을 때 그 언어에 익숙하지 않은 언어학자라면 1년 정도 걸릴 것입니다. 그런데 Opus는 불과 5,700개의 무작위 번역 쌍으로 1분도 안 되어 이러한 미묘한 차이를 쉽게 파악했습니다.


비교를 위해 GPT-4에서도 동일한 테스트를 해보았는데, 완전히 실패했습니다. 가장 간단한 문장조차 번역을 거부했고, 문법적 복잡성은 말할 것도 없었습니다. 이전에 GPT-3.5를 비슷한 데이터셋으로 파인튜닝해 본 적이 있는데, 결과는 그저 잡음이었습니다. 


Anthropic이 이 모델로 무엇을 했는지 모르겠지만, 다른 어떤 것과도 완전히 다릅니다. 많은 사람들이 합성 벤치마크에서 선두를 달리는 것에 회의적이지만, 제가 목격한 것은 훈련 데이터셋에 0%의 가능성으로 포함되어 있을 새롭고 매우 도전적인 벤치마크에서의 눈부신 결과입니다.


오염 가능성을 테스트하기 위해 샘플 번역을 첨부하지 않고 동일한 프롬프트를 시도해 보았는데, Claude는 체르케스어에 익숙하지 않다고 말하며 실패하고 대답을 거부했습니다. 


이것의 의미는 심오합니다. 제가 2년간 전념해 온 작업을 Claude는 몇 천 개의 예제로 해냈습니다. 이는 자원이 부족한 언어와 많은 다른 분야에 있어 엄청난 도약입니다. 먼 미래에나 일어날 것으로 예상했던 일이 오늘 일어났습니다. 미래는 이미 여기 있고, 그것은 놀랍습니다.




7cf3da36e2f206a26d81f6e74787766f8d

7ff3da36e2f206a26d81f6e44e85706b16






클로드 쓰면서 언어 능력 참 좋다고 느끼긴 했는데 이정도였다니? 대단하네

추천 비추천

42

고정닉 14

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2853 설문 연인과 헤어지고 뒤끝 작렬할 것 같은 스타는? 운영자 24/04/22 - -
448095 정보 펌)DenseFormer: 레이어 수 적은 모델로 뛰어난 성능 달성 [12] ㅇㅇ­갤로그로 이동합니다. 03.25 1686 31
448043 AI창 특이점갤러리 새끼들아 [12] ㅇㅇ갤로그로 이동합니다. 03.24 2859 25
448042 일반 슬슬 '진짜로' 불안하면 개추... [30] ㅇㅇ갤로그로 이동합니다. 03.24 6029 42
447984 일반 스압)음악계 종사자들이 AI에 대해 생각보다 호의적일 수 있는 이유 [44] ㅇㅇ갤로그로 이동합니다. 03.24 3833 46
447983 일반 오픈ai 연구원 입털었다!! [26] ㅇㅇ갤로그로 이동합니다. 03.24 4047 33
447973 일반 2박 3일 동안 클로드3 오푸스로 폭딸 친후기.feat. 가격 [28] 얼리딸답터갤로그로 이동합니다. 03.24 3919 33
447959 일반 그림쟁이들이 ai한테 가장 피해본놈들이지 [17] ㅇㅇ(58.29) 03.24 2495 43
447952 정보 매우 간단하게 LLM 집컴으로 돌리는 방법 (LM Studio) [4] ㅇㅇ(121.151) 03.24 2317 23
447878 일반 와 ㅅㅂ 짱개 ai랑 노는데 재밌노ㅋㅋㅋㅋㅋㅋ [18] ㅇㅇ(175.125) 03.24 3512 34
447705 일반 사이버렉카 수준.. [14] ㅇㅇ(1.239) 03.24 1937 32
447656 일반 이제는 토큰이 아니라 바이트의 세상을 열어야함 [10] ㅇㅇ(125.134) 03.24 3265 29
447567 AI창 선형충의 승리 [15] ㅇㅇ(182.209) 03.24 4465 41
447490 일반 결국 미국정부에게 반독점소송 쳐맞는 애플 [14] ㅇㅇ(223.39) 03.24 2632 27
447467 정보 (근거있음) ai가 버블일 수 있는 합리적인 이유.txt [89] ㅇㅇ(106.102) 03.24 5586 51
447458 정보 AI챗봇 출시 첫날 1000여명 수천 회 상담 [16] ㅇㅇ갤로그로 이동합니다. 03.24 2492 26
447412 일반 비트넷 재현 실험 [21] oo(119.202) 03.24 3482 31
447365 일반 Stability AI CEO 추노한거 돈때문만은 아니네 [4] ㅇㅇ갤로그로 이동합니다. 03.24 1518 24
447282 정보 얼마나 다급하면…AI 경쟁 뒤처진 애플, 구글 이어 中 바이두에 SOS [22] 니지카엘갤로그로 이동합니다. 03.23 2594 27
447267 일반 밑에 올라온 haiper ai 로 만든 영상들 가져와봄 [8] 따뜨갤로그로 이동합니다. 03.23 1546 20
447232 일반 새삼스럽지만 인생 존나 재미없지 않냐? [9] ㅇㅇ(119.204) 03.23 336 10
447228 일반 무료로 2초분량의 영상을 제작해주는 Haiper AI [3] ㅇㅇ(211.226) 03.23 1664 20
447184 정보 뉴럴링크 새 영상 가져왔다.nintendo [26] ㅇㅇ(180.228) 03.23 4213 50
447154 AI창 NAI)극후방 멍멍이 아코 [16] Samus갤로그로 이동합니다. 03.23 797 12
447147 일반 인간 넘었네 드디어 ai가 [19] ㅇㅇ(124.5) 03.23 5374 56
447142 정보 엔비디아, GTC서 AI 가속 위한 '챗RTX' 등 선보여 [4] 니지카엘갤로그로 이동합니다. 03.23 1031 21
447113 일반 구글Ai 제미나이 근황 [36] ㅇㅇ갤로그로 이동합니다. 03.23 4775 104
447110 일반 NVIDIA 블랙웰 B200 GPU는 최대 1200 W 소비 [12] 은바다갤로그로 이동합니다. 03.23 873 17
447106 일반 Stability ai 망했다고..? 살짝 쎄한데 [7] ㅇㅇ갤로그로 이동합니다. 03.23 3140 31
447074 일반 Stability AI CEO 에마드 추노함 [15] ㅇㅇ(125.191) 03.23 3011 32
447027 일반 AI 커버곡.yoyak [8] 디시콘발사대갤로그로 이동합니다. 03.23 342 16
447025 정보 배터리 기술 근황.jpg [18] 007빵(175.194) 03.23 4294 30
446953 정보 가성비甲 전자의수 제작 기업 "만드로(Mand.ro)" [12] ROBERT갤로그로 이동합니다. 03.23 1989 28
446950 정보 中 스타트업 ‘문샷AI’ 돌풍 “챗 GPT-4의 10배 성능” [31] 니지카엘갤로그로 이동합니다. 03.23 3406 28
446936 AI창 후.. AI로 JRPG 음악 뽑아보고 충격 먹었다 [18] InfinityVas갤로그로 이동합니다. 03.23 5411 41
446918 일반 레딧 특갤은 ㄹㅇ 특갤이랑 소름돋게 똑같네 ㅋㅋㅋ [9] ㅇㅇ(59.9) 03.23 4059 48
446911 일반 레딧 이거 ㅈㄴ웃기네 ㅋㅋㅋㅋ [8] ㅇㅇ(59.9) 03.23 3144 36
446870 정보 엔비디아 ,간호사보다 뛰어난 AI 기반 의료 '에이전트'를 발표 [52] ㅇㅇ갤로그로 이동합니다. 03.23 3344 52
446819 정보 뉴럴링크 큰거 떳다!!!! [28] ㅇㅇ(125.183) 03.22 4027 41
446817 일반 [충격]얀르쿤이 일론 머스크 조롱하다 [22] xdxd333갤로그로 이동합니다. 03.22 2578 53
446775 일반 [일론] Open AI를 Closed AI로 바꾸면 고소 취하하겠다 [6] ㅇㅇ(218.50) 03.22 2393 37
446773 일반 이번달 나온거 대충정리 해봤는데 [30] ㅇㅇ(125.183) 03.22 2952 55
446766 일반 클로드 가스라이팅 개잘먹히네 ㅋㅋㅋㅋ [13] ㅇㅇ갤로그로 이동합니다. 03.22 2971 37
446761 일반 ;;; 레커 원본 영상 보고오니 저런 뉘앙스로 말한거 아니구만; [5] ㅇㅇ(112.162) 03.22 1337 27
446705 일반 "젠슨 황이 GTC서 입은 가죽 재킷은 1200만원짜리" [6] 니지카엘갤로그로 이동합니다. 03.22 2151 26
446699 일반 "국내 연구진 세계최초..", "국내 대기업 협력 ai스타트업 뜬다.." [5] ㅇㅇ(218.147) 03.22 375 12
446595 일반 진짜 역사적인 순간에 서있는거 같음 [10] ㅇㅇ(175.209) 03.22 1689 25
446576 일반 알트만, 재차 GPT4는 형편없는 수준이다 발언 [9] ㅇㅇ(218.147) 03.22 2254 28
446558 일반 뉴럴링크 현재 원숭이의 시력 복원 가능한 상태라 밝혀 [36] ㅇㅇ(125.142) 03.22 3427 74
446548 정보 OpenAI의 Sora 모델 작동 원리 [5] 니지카엘갤로그로 이동합니다. 03.22 1997 26
446545 일반 매스개로우 법칙 ㅅㅂㅋㅋㅋㅋ [11] ㅇㅇ갤로그로 이동합니다. 03.22 2433 41
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2