디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 챗봇 아레나 점수보면 갤의 평가는 믿을 수 없음

ㅇㅇ(218.154) 2024.04.01 00:33:00
조회 123 추천 1 댓글 0
														

갤에서는 gpt4 초창기 버전이 좋다 하고 


아레나 점수는 초창기 버전이 점수가 낮아서 하는 말이 아님 

챗봇 아레나 점수 어떤식으로 계산되는가 보니까 

언어모델 2개 랜덤으로  뽑히는데 익명이 유지됨 

무슨 언어모델인지 알고 투표하면 결과에 반영 안됨 



근데 결과보면 이상한게 바드 제미니프로는 gpt4 급이고 

제미니 프로는 3.5급임 


초창기 gpt4는 오푸스가 아니라 하이쿠보다 점수 낮음 


 벤치마크 점수 보는게 제일 정확하다는말 


그냥 좆간은 못 믿는다. 



자동등록방지

추천 비추천

1

고정닉 0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
462649 일반 프롬 하나로 10분 이상 분량애니 뽑으려면 [5] ㅇㅇ(175.201) 05.04 185 0
462647 일반 문제풀이 [26] 지니갤로그로 이동합니다. 05.04 362 2
462646 일반 인간의 발명품 중 넘버 원은 역시 이거지 [16] ㅇㅇ(112.161) 05.04 480 1
462645 일반 리트 법규범 윤리규범 문제 클로드 제대로 풀어 맞히는데? [6] ㅇㅇ갤로그로 이동합니다. 05.04 169 0
462641 일반 이 글 도대체 무슨 말을 하고싶은거임? [4] ㅇㅇ(121.152) 05.04 401 0
462640 일반 AGI는 걍 니들보다 100조배 똑똑해 [8] ㅇㅇ갤로그로 이동합니다. 05.04 419 0
462639 일반 이건 agi와도 풀기 어렵다 [22] ㅇㅇ(117.20) 05.04 852 1
462638 일반 LLM 인공지능 주욱 써보니 [5] ㅇㅇ(115.138) 05.04 327 0
462637 정보/ OAI 새 블로그 글, [고급 AI를 위한 보안] [2] ㅇㅇ(119.77) 05.04 401 1
462636 정보/ 커맨드 R+ 가 상당히 좋다는 증언들 [5] ㅇㅇ(119.77) 05.04 418 1
462631 일반 유튜브 편집자들 3년뒤에도 건실함? [4] ㅇㅇ(14.36) 05.04 261 0
462630 일반 존버881일차 [2] alphaca갤로그로 이동합니다. 05.04 98 1
462628 일반 Vr하다보면 완몰가가 이런건가 싶음 [3] ㅇㅇ(110.46) 05.04 296 2
462627 역노화 "임플란트·틀니 안해도 돼"…日서 '치아 자라게 하는 약' 나왔다 [8] ㅇㅇ(175.209) 05.04 753 6
462626 일반 알트만이 phi-3를 gpt2라고 띄워줬다고? [10] ㅇㅇ(211.36) 05.04 798 11
462625 일반 AGI만이 내 희망이다 [3] ㅇㅇ(1.239) 05.04 226 0
462624 AI창 완전 판타지 느낌 Udio [5] ㅇㅇ(61.255) 05.04 238 4
462623 역노화 근데 역노화 성공해서 엄마아빠 젊어지면 [4] 카오루갤로그로 이동합니다. 05.04 696 0
462622 일반 sora 영상들 공통점이 카메라가 앞으로 이동하면서 [10] ㅇㅇ(14.58) 05.04 357 1
462621 일반 이번 소라 뮤직비디오 봤을 때 느낀점은 이세이미야케갤로그로 이동합니다. 05.04 158 1
462619 일반 phi-3 그거 망상아님? [2] ㅇㅇ(220.79) 05.04 381 1
462618 일반 념글 소라 뮤비 외국인들 반응은 별로 안좋네... [6] ㅇㅇ(61.97) 05.04 393 1
462617 일반 요새 메타 라마가 생각보다 잘하고 있따는게 사실임? ㅇㅇ(1.227) 05.04 93 0
462616 일반 hbm 주목 못받던게 엊그제 같은데 [1] ㅇㅇ(118.39) 05.04 120 0
462614 일반 특붕이 이거 읽고 감동받았다 [2] ㅇㅇ(1.229) 05.04 198 1
462613 일반 춥다 [2] ㅇㅇ(117.111) 05.04 90 1
462612 일반 클로드 토큰 많이먹는게 개좋은듯 [3] ㅇㅇ갤로그로 이동합니다. 05.04 343 2
462611 일반 AGI 와라 제발 AGI 개발 돼라 ㅇㅇ갤로그로 이동합니다. 05.04 84 0
462610 일반 이제 H200 시대다잇 [2] agi2024갤로그로 이동합니다. 05.04 311 1
462609 일반 일론 머스크 휴머노이드 로봇관련 트윗 Tqqqld갤로그로 이동합니다. 05.04 282 2
462608 일반 얀르쿤 뭐 결과물 보여준거 있음? [2] ㅇㅇ(61.75) 05.04 179 0
462606 일반 이번 소라 뮤직비디오에 대한 외국인들 반응 [4] ㅇㅇ(218.147) 05.04 392 2
462605 정보/ 수출 규제로 인해 미국 연구원들보다 5~10년 정도 뒤처진 중국 [4] ㅇㅇ(118.39) 05.04 422 2
462603 역노화 노화 관련 소식은 요즘 뭐 없냐? ㅇㅇ갤로그로 이동합니다. 05.04 204 0
462602 정보/ 마이크로소프트의 AI Copilot이 코딩 산업을 자동화하기 시작했습니다 [20] ㅇㅇ갤로그로 이동합니다. 05.04 552 4
462601 토의 근데 AGI 달성한다고 특이점 이거 올수있는거 맞냐? (진짜모름 분탕X) [19] ㅇㅇ갤로그로 이동합니다. 05.04 417 3
462600 일반 초지능님의 강아지가 되고싶다 월! [4] ㅇㅇ(14.50) 05.04 81 1
462599 일반 일론이 큐스타 믿는다니까불안해짐 [6] ㅇㅇ(218.50) 05.04 314 0
462598 일반 특이점 이즈 커밍 ㅇㅇ(1.239) 05.04 57 0
462597 일반 특이점 언제와..? [8] KURO갤로그로 이동합니다. 05.04 257 0
462596 정보/ 상압에서 만든 다이아몬드 정보 정리 [7] ㅇㅇ(118.39) 05.04 413 7
462595 일반 저는 동성애자는 아니지만 [2] ㅇㅇ(58.29) 05.04 307 3
462594 일반 클로버3 봐바 자이로 나옴 [3] ㅇㅇ(119.203) 05.04 148 0
462593 일반 LLM이 사파고 "뇌"관련된게 원래 정파임 ㅋㅋ [8] agi2024갤로그로 이동합니다. 05.04 335 3
462592 일반 개발 좀 빨리 해라 개자식들아 인간 몸 포기하게 [2] ㅇㅇ(114.207) 05.04 202 0
462591 일반 갤에 저능아 농도 존나 높네 ㄹㅇ [2] ㅇㅇ(218.155) 05.04 228 3
462590 일반 gpt4 아직 횟수있음? [3] Jackey갤로그로 이동합니다. 05.04 146 0
462589 일반 지피티 1년 구독 질렀는데 5 나오면 업글됨? [1] ㅇㅇ(175.119) 05.04 124 0
462588 일반 우리회사 디자이너 AI씹 극혐하던데;; [16] ㅇㅇ(58.29) 05.04 792 5
462587 일반 씹트만 좆같은게 말이 뭔가 모순됨 [6] ㅇㅇ(222.234) 05.04 333 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2