디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 공정한 MMLU 벤치마크 결과

ㅇㅇ(119.77) 2024.05.02 20:53:52
조회 642 추천 13 댓글 4
														


35a59e36ebd518986abce8954f8570684a

MMLU 벤치마크를 좀 더 공정하고 재현성 좋게 만들었다고함

클로드 GOD과 LLama-3가 눈에 띄노.


GPT4 Turbo가 기본 GPT4 대비 떡락한 것도 보이네.

물론 저 Turbo는 preview버전이고 지금꺼랑 다른거긴함.

자동등록방지

추천 비추천

13

고정닉 9

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
477762 일반 애초에 얀르쿤에 발작하는 이유가 [7] ㅇㅇ(115.138) 05.19 1146 22
477597 정보/ 제프리 힌튼 교수가 생각하는 GPT [8] 자연어프로그래밍(59.26) 05.19 2342 31
477570 정보/ 얀르쿤 "초지능 정렬? 꼴값떨지마셈 ㅇㅇ" [54] ㅇㅇ(59.17) 05.19 5691 46
477512 일반 얀 르쿤: 초정렬팀 해고에 드라마 같은 내막은 없다 [14] ㅇㅇ(112.144) 05.19 3280 32
477509 정보/ 알트만과 브록만, 일련의 사태에 대한 입장발표 [7] ㅇㅇ갤로그로 이동합니다. 05.19 567 14
477493 정보/ gpt4o 한국 문화, 한국어 지능 평가 [12] 특갤용갤로그로 이동합니다. 05.19 1526 18
477399 일반 오 GPT4 메모리 기능 어케 사용하는 지 알아냄. 버그였음 [16] ㅇㅇ(118.235) 05.18 708 13
477252 일반 gemini 1.5pro에 사과 문제 물었다 [11] ㅇㅇ(223.39) 05.18 3978 29
477207 일반 제미니 1.5 pro ㅂㅅ이네 사과 문제 틀림 [19] ㅇㅇ(125.240) 05.18 3559 38
476895 일반 최근 초정렬팀 퇴사에 대한 룬의 의견(지금은 삭제됨) [36] ㅇㅇ(58.123) 05.18 3551 29
476819 일반 제미니 1.5 pro 엄청난 성능 향상 [20] ㅇㅇ갤로그로 이동합니다. 05.18 4318 37
476750 정보/ ChatGPT는 말할 수 있지만, OAI 직원은 말을 못합니다. [7] ㅇㅇ(119.77) 05.18 2997 19
476678 일반 Jan트윗보니까 알트만 실체가 드러났네 ㄹㅇ 실망이다 [26] ㅇㅇ(211.179) 05.18 4659 57
476614 정보/ OAI 사임한 초정렬팀 Jan Leike, 장문의 입장문 발표 [42] ㅇㅇ(119.77) 05.18 4143 33
476235 정보/ 낸드플래시에 특이점이 왔다 [59] ㅇㅇ(118.39) 05.17 5056 53
476206 일반 데이터분석V2의 아다였네 [11] 도서관킬러갤로그로 이동합니다. 05.17 2318 24
476188 정보/ OpenAI 그렉 브록만 "모두 AI 초능력을 얻게 될 것" [35] 특술람갤로그로 이동합니다. 05.17 5079 27
476174 정보/ 알파모델 ADA V2 코딩 특화 미쳤다네 [24] 초존도초갤로그로 이동합니다. 05.17 3318 24
476164 정보/ 최신 AI 연구의 큰 두가지 흐름 정리 [56] 나일론마스크갤로그로 이동합니다. 05.17 4890 34
476145 정보/ 최근 OAI 안전, 정렬팀 해고 및 사임 총 정리 [7] ㅇㅇ(119.77) 05.17 766 14
476078 일반 GPT-4o 로 태양계 구현한 게시물을 나도 GPT-4o 웹으로 구현해봄 [8] 특스타갤로그로 이동합니다. 05.16 2550 32
475956 정보/ OAI 스프링 업데이트, 프론티어 모델 예고 ppt [23] ㅇㅇ(119.77) 05.16 4022 36
475764 정보/ 플라톤적 표현 가설 [23] 특술람갤로그로 이동합니다. 05.16 594 16
475750 일반 전독시 AI로 게임처럼 하니까 ㅈㄴ 재밌노 ㅋㅋㅋ [23] ㅇㅇ갤로그로 이동합니다. 05.16 4513 40
475735 AI창 거의 다 그린 그림 AI가 마지막 보정만 살짝 해줌 [48] ㅇㅇ(211.109) 05.16 7280 51
475603 일반 gpt4o 현재까지 공개된 벤치로 제미니, 클로드, 4t와 비교 [8] ㅇㅇ갤로그로 이동합니다. 05.16 4101 25
475377 정보/ 잠잘때 뇌 노폐물 청소? “딱히 그렇지 않아” [48] ㅇㅇ(182.230) 05.15 6074 28
475470 정보/ OpenAI 공동창립자 겸 과학자 "내 직업 대체? 5년정도 걸릴듯" [26] ㅇㅇ(59.17) 05.16 4791 28
475551 정보/ 돼지 뇌, 몸에서 분리된 채 5시간 동안 생존 [34] ㅇㅇ(182.230) 05.16 4869 35
475219 일반 챗GPT-4o 미친것같다 진심;;; [17] 불곰적위대갤로그로 이동합니다. 05.15 8258 45
475180 일반 gpt-4o 이년 진짜 미쳤네 [45] 도서관킬러갤로그로 이동합니다. 05.15 4519 26
475173 일반 GPT-4ㅇ한테 태양계 공전 시스템 코딩시켜봄 [47] ㅇㅇ(221.155) 05.15 5647 41
475023 일반 gpt4o으로 10분만에 만든 하노이탑 시뮬레이션 [14] et갤로그로 이동합니다. 05.15 4327 33
475017 일반 일리야와 초정렬팀이 근본인 이유...factos [15] ㅇㅇ(118.37) 05.15 3678 39
474896 일반 지금 특갤 상황보니까 완장들은 운영 이렇게해야할거같음 ㅇㅇ [25] ㅇㅇ(61.97) 05.15 2873 43
474882 일반 gpt-4o 개오져서 갤순위 높아지니까 유입 분탕충새끼들 개지랄을 하네 [9] ㅇㅇ(125.137) 05.15 2808 45
474787 정보/ Super Alignment 프로젝트 사실상 붕괴 [6] ㅇㅇ(119.77) 05.15 674 17
474775 일반 현재 특이점 갤러리 상황 요약.....jpg [15] ㅇㅇ(59.9) 05.15 5546 35
474618 정보/ 새로운 언어모델 벤치마크 MMLU-Pro [15] 특갤용갤로그로 이동합니다. 05.15 536 16
474562 일반 gpt4o 이거 코드 천줄 넘어가도 잘 인식 하는데 머임? [10] lightvector갤로그로 이동합니다. 05.15 4152 41
474535 정보/ Google I/O 2024에서 발표된 모든 것들 [6] 니지카엘갤로그로 이동합니다. 05.15 533 15
474343 일반 속보) 일리야 큰거온다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [8] ㅇㅇ(118.37) 05.15 5372 30
474294 일반 안전, 초정렬, 일리야 내치고도 점진적 발전 ㅇㅈㄹ ㅋㅋ [5] ㅇㅇ(115.22) 05.15 3509 37
474251 일반 Sam Altman 오늘자 인터뷰 요약 [42] ㅇㅇ(58.123) 05.15 5592 60
474137 정보/ OAI 안전 정렬 팀, 다수 퇴사 혹은 해고 [3] ㅇㅇ(119.77) 05.15 493 12
474088 정보/ 일리야, OAI와 결별 및 프로젝트 공개 예고 [12] ㅇㅇ(119.77) 05.15 3961 38
473930 일반 ??? : 흠.... [22] ㅇㅇ(211.200) 05.15 4602 50
473884 정보/ 오늘 공개된 '제미니 1.5 플래쉬'의 혁신성 [5] ㅇㅇ(119.77) 05.15 553 16
473681 일반 내가 느낀 openai와의 차이점 [24] ㅇㅇ(116.123) 05.15 4456 32
473461 일반 여기서 GPT-4o 메디컬 개 미친 성능 [18] Spark갤로그로 이동합니다. 05.15 5368 39
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2