디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[사용후기] 얘들아 그록3 못 산 애들 보셈 (산 애들은 보지 마 절대!) (수정)

초존도초갤로그로 이동합니다. 2025.02.19 12:56:46
조회 8404 추천 69 댓글 56
														


내가 어제 새벽에 5시간 붙잡고, 그리고 혹시나 업뎃했나 해서 방금 좀 테스트한 모든 결과를 통틀어서 


그냥 가볍게 얘기해주는데


그록3 가격 오르기 전에 못샀으면... 앞으로도 사지 마라...



머스크 씹사기꾼임


벤치 개사기같어


베타고 자시고 일단 띵크(Think) 끄면 소넷보다도 못하고


띵크(Think) 키면 o1 pro랑 o3-mini-high보다도 못함



벤치랑 여태 광고 때린 모든 게 다 과장되어 있음



특히 결과물 복불복이 너무 심해서 원래도 못한데 더 거지같은 결과물 나올 때가 많고,



컨텍스트 윈도우도 구글이나 오픈AI에 한참 못 미쳐서


(지적해주면 그 정보를 찾아오는 건 잘하는데, 지적하지 않으면 잊고 지랄남)


마치 그냥 제품 자체가 급조된 거 같은 느낌밖에 못 받음




소설 작성하게 할 때는 아무리 지적해도 자연스러운 한국어가 아니라 일본식 말투나 영어 번역투로 인물들 대사 치고


마치 4o에서 종종 나타나는 문제점인 '어떠어떠한 것을 해라'라고 하면 그걸 깊이 생각해서 고차원으로 반영하는 게 아니라


그냥 무지성으로 작품 내에 '어떠어떠한 것을 하고 있다. 그는 어떠어떠한 모양이다.' 이런 식으로 작성 때가 많음



그리고 코딩은 어느 순간부터는 지가 뭘 작성하고 있는지도 모르고 있음


(소설 쓴 거 빼면 모두 영어로 테스트함)


수학은 뭔가... 딱 o3-mini-low 느낌...? 뭔가 무지성의 느낌이 있음 그 느낌 있잖아. 가뜩이나 출력속도 개빠른데 


막상 출력된 거 보면 깊이가 없음 띵크 키고 막 1분 넘게 생각하는 데도 결과물은 뭔가 베이스 모델이 내놓은 것 같은 가벼움



문과든 이과든 프롬프트에 대한 이해도가 부족한 거 같음 즉, o3-mini-high의 느낌을 닮아 있음. 내가 이전에


o3-mini-high로 하다가 자꾸 진빠 내고 멍청한 짓하고 이러는 거 답답해서 일주일에 50회인 o1으로 자주 대체해왔는데


그 느낌이 강함 근데 뭔가 그게 o3-mini-high가 아니라 low급으로 뭔가 멍청함




7cea837fbc816df33aeb98a518d6040382756c05053f7fb7e9



이 사람이 얘기한 거 거의 다 동감함.


특히 r1이나 o1 pro 같은 그 뭔가 묵직한 맛이 전혀 없음.


내가 또 o1 pro 지지난 달에 결제 해서 한달동안 pro만 오질라게 써왔잖음


pro도 종종 1분 30초짜리 생각하고 내뱉는 경우 있는데,


그록 이놈 띵크 키면 보통 1분 30초는 넘기고 응답하는데 비교해보면 그냥 가벼움의 극치임


생각 과정은 오질라게 막 이 생각 저 생각 많이 하고 멋진데


왜 출력물은 생각의 깊이가 반영이 안 되어 있는 듯한, 정제되어 있는 듯한 느낌이 전혀 안 드는지 모르겠음



아무튼 가격 오르기 전에 30만원에 1년 결제해놓고 있는 사람으로서....


1ebec223e0dc2bae61ab96e746837170bd0503a2396c1f024a597a3624565b4dbe360324f8e51c55da168b3091d804a83abc2ed526cd



해줄 수 있는 말은 "야 너 안 사기 잘했다" ㅎㅎ



2주만 존버하면 GPT4.5도 나오고 앤트로픽 다음 모델도 나온다고 생각하면 너네가 승자다



----



난 이전부터 계속 아레나에서 테스트해오면서 특갤에도 자주


(띵크가 없는 베이스모델) 초콜릿이 o3-mini-high보다 한참 넘사라는 걸 알렸는데


대체 왜 정식품이 이지랄인지 이해를 할 수 없음


대체 내부에서 뭐 하는 거지??


빅브레인은 그냥 추론 관련 아니야??



----



아! 벤치에서 하늘색 부분이 빅브레인이라는 사실을 알아냄


이거 꼭 보셈


https://gall.dcinside.com/thesingularity/648318


7cea837fbc8668f03aef98a518d6040316b128bcdf26a0c12e


7cea837fbc8668f03aef9be458c12a3a04c47af21c084101d2e923



밝은 색 파랑 부분 다 지우고 보면,


여태 우리가 테스트하고 있는 그록3 베타가 미니 모델이 아니라는 걸로 봐서


o3-mini-high는커녕 o1보다도 낮은 게 정확한 평가라는 사실을 벤치에서 알아낼 수 있음


그리고 안드레 카파시 말이 사실이면 그록3+추론은 o1 pro급이거나 더 나아야 하는데,


그렇다면 카파시는 빅브레인을 테스트했던 거고,


우리는 빅브레인만 기다리면 된다는 결론에 도달할 수 있음


근데 뭐이리 헷갈리게 내는 거야?

자동등록방지

추천 비추천

69

고정닉 43

댓글 영역

전체 댓글 0
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
3007 설문 실제 모습일지 궁금한 미담 제조기 스타는? 운영자 25/05/05 - -
571617 공지 뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250427) ㅇㅇ갤로그로 이동합니다. 24.11.23 33622 45
609935 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [1] ㅇㅇ갤로그로 이동합니다. 25.01.18 19299 30
571620 공지 본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다. ㅇㅇ갤로그로 이동합니다. 24.11.23 5632 15
572292 공지 직업 비하, 조롱 글 30일 차단됩니다. ㅇㅇ갤로그로 이동합니다. 24.11.24 4999 6
717506 정보/ 오픈AI "챗GPT 엔터프라이즈·에듀 데이터, 한국서 보관·관리" ㅇㅇ(58.237) 12:09 14 0
717505 정보/ 샘 알트만 "2026 레벨4 agi 될 것" [1] 특술람갤로그로 이동합니다. 12:09 20 1
717504 일반 AI가 코딩 해줘도 배우긴 해야할 거 같음 ㅇㅇ갤로그로 이동합니다. 12:08 12 0
717503 일반 0506 뭐가너프라는거지 [1] ㅇㅇ갤로그로 이동합니다. 12:06 32 0
717502 일반 코딩 잘하면서 창의력까지 좋을순 없지 [2] 먼데이갤로그로 이동합니다. 12:06 28 0
717501 일반 AGI 나와도 별 감흥없을듯 [2] 도치도치갤로그로 이동합니다. 12:05 41 2
717500 일반 역노화 기원 316일차 [2] ㅇㅇ갤로그로 이동합니다. 12:02 11 0
717499 일반 마소계정 계속 해킹시도 오는데 [3] ㅇㅇ갤로그로 이동합니다. 12:00 79 0
717498 일반 요즘 느끼는건데 특이점은 무조건 와야함 [2] ㅇㅇ갤로그로 이동합니다. 11:57 79 0
717497 일반 검열 안먹는 그록 야한 소살상황극 프롬 추천좀 MCmh860pt갤로그로 이동합니다. 11:57 16 0
717496 일반 로건 이미지 업데이트 한데 [1] ㅇㅇ(121.66) 11:53 60 0
717495 일반 나는 머스크말을 100%믿는 사람으로써 이번주에 AGI가 나오는거에 [3] ㅇㅇ갤로그로 이동합니다. 11:50 144 2
717494 일반 진짜 전기 낭비네 이건 [4] 4테라갤로그로 이동합니다. 11:49 209 4
717493 일반 제미나이는 0506이 아니라 코딩 전용으로 했어야할듯... [2] 갉달비갤로그로 이동합니다. 11:48 124 0
717492 일반 치타쉑 다시 우리 안으로 들어간 거임? ㅇㅇ(49.246) 11:48 32 0
717491 일반 구글은 걍 가장 돈을 잘 버는 기업중 하나고 2.5 프로가 그렇게 [1] ㅇㅇ갤로그로 이동합니다. 11:48 104 0
717490 일반 Aider 벤치마크 비용 정상화 이후 비교 [3] ㅇㅇ(220.79) 11:47 85 1
717489 일반 근데 gpt4o 요즘 또 더 좋아진것 같은데 나만 그렇게 느낌? [1] ㅇㅇ(126.254) 11:46 68 0
717488 정보/ 속보) Aider 벤치마크 제작자 : 제미니 돈 더들어간다 [2] ㅇㅇ(220.79) 11:44 203 5
717487 일반 근데 왜 보이스,tts 쪽은 발전이 별로 없음? [2] ㅇㅇ(126.254) 11:44 51 0
717486 정보/ IBM,ㅡ AI로 인력 재편... 전체 고용은 오히려 증가 [7] ㅇㅇ갤로그로 이동합니다. 11:43 118 3
717485 일반 트럼프 중대발표 테크쪽 얘기가 아니네 [10] ㅇㅇ갤로그로 이동합니다. 11:39 285 0
717484 일반 제미니 2.0에서 이미지 뽑는데 [8] ㅇㅇ(116.42) 11:39 118 0
717483 일반 아이큐 떡락이유는 이거지 ㅇㅇ갤로그로 이동합니다. 11:38 79 0
717482 일반 이자 원금 계산도 못하는 구글 AI [1] 무한탐구(218.234) 11:35 176 0
717481 일반 5월 잼황 아이큐 하락? [2] ㅇㅇ갤로그로 이동합니다. 11:31 179 2
717480 일반 구글 ai스튜디오 원래 좀 끊기나 [2] ㅇㅇ(121.142) 11:30 67 0
717479 일반 모솔인데 gpt한테 전반적인 헤어,패션, 화장품 같은 질문해도 되나? [3] ㅇㅇ(211.203) 11:30 62 0
717477 일반 갑자기 모든 중국인과 이슬람이 사라진 세상 [2] ㅇㅇ갤로그로 이동합니다. 11:26 89 0
717475 일반 요즘 라이브벤치는 그냥 쓰레기 된거 같네 [1] ㅇㅇ갤로그로 이동합니다. 11:25 86 0
717474 일반 ais가 뭐임? [2] ㅇㅇ갤로그로 이동합니다. 11:25 95 0
717473 정보/ 미국, 국가별 등급에 따른 AI반도체 수출통제 계획 폐기 방침 니지카엘갤로그로 이동합니다. 11:23 90 0
717472 일반 삼성전자, ‘AI 생산성 혁신 그룹’ 신설 [4] ㅇㅇ(112.185) 11:23 131 0
717471 일반 지피티 무료쓰는데 한도 얼마나 줄은거임? [2] 불신갤로그로 이동합니다. 11:22 74 0
717470 일반 제미나이 프로 0506 reddit 반응 모음 [1] ㅇㅇ갤로그로 이동합니다. 11:21 197 3
717469 일반 2.5 잼황 5월달 코딩 벤치 궁금한데 왜 안돌리지 ㅋㅋ ㅇㅇ갤로그로 이동합니다. 11:21 36 0
717468 일반 확률 계산하는거해봤는데 ㅇㅇ(14.42) 11:16 43 0
717467 일반 4o는 비추론모델 아니었나? [7] ㅇㅇ갤로그로 이동합니다. 11:13 168 1
717466 일반 지브리풍 그림 딸깍 미쳤네. [2] ㅇㅇ갤로그로 이동합니다. 11:09 155 0
717465 일반 계속 소설 성능 개판됐다길래 써봤는데 진짜 개판됐네ㅋㅋㅋㅋ [2] ㅇㅇ(121.144) 11:02 246 0
717464 일반 다음 중 가장 돈을 많이 벌 수 있는 기술은? [5] ㅇㅇ(125.190) 11:02 132 0
717463 일반 ais 0506 작문 능력 떨어졌음? [1] ㅇㅇ(126.158) 11:01 114 0
717462 일반 그래도 나중에 몸이 아프지 않는 시대가 온다면 [1] ㅇㅇ(211.189) 10:55 100 0
717461 일반 지금 코딩 기준 제미니 vs 클로드 누가 우위임? [3] ㅇㅇ(121.142) 10:54 126 0
717460 일반 커스텀 gpt 다들 쓰냐? [2] ㅇㅇ(183.96) 10:53 77 0
717459 일반 ais 딸숭이 질문좀 [6] ㅇㅇ(115.95) 10:51 142 0
717458 일반 카카오, AI 메이트 '카나나' 일부 이용자 대상 시범 서비스 [2] ㅇㅇ(112.185) 10:50 184 2
717457 일반 챗gpt 유료 구독이후 체중감소했음 [2] Rokos갤로그로 이동합니다. 10:45 201 0
717456 일반 원시시대부터 지금까지 인간생활은 바뀌지 않아 [3] ㅇㅇ(183.101) 10:43 148 1
717455 일반 겨울이네ㅋㅋ [1] 먼데이갤로그로 이동합니다. 10:42 67 0
뉴스 ‘하트페어링’ PD “‘러브캐처’ 출신 지민, 마지막까지 섭외 고민” [인터뷰①] 디시트렌드 05.07
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2