디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] [소신발언] 클로드가 GPT-4o보다 살짝 더 똑똑하다.

선갤러(61.73) 2024.05.16 21:43:46
조회 783 추천 6 댓글 17
														

1ebec223e0dc2bae61abe9e4419f343304ceabbacc57cc1455081d3a

본인은 OpenAI, Claude 둘 다 API로 쓰고 있음으로 한쪽 편을 들 생각이 추호도 없음.


위의 짤은 레딧 Claude갤이라 편향이 있을 수 있음. 그래도 글 내용에 둘 다 써본 사람만 대답해 달라는 요청이 있었고 20불이 껌값인 미국형들이 둘 다 써보지도 않고 클로드를 찍은 사람은 많지 않을듯함.


어제 4o가 틀린 퀴즈문제 클로드는 맞췄다고 했더니 벤치마크 들고와서 개같이 달려들어서 물어뜯던데


현대 아이오닉5가 안전성 테스트 AAA 받았고 10개국가 올해의 차에 선정 됐으니 우리 아빠 차가 젤 조앙~ 하는 것 밖에 안 됨...


다들 4o가 역대급으로 좋다고 하고 4보다는 실제로 꽤나 좋은 거 같아서 며칠동안 써봤음.


사람들이 자꾸 간과하는 게 4o는 가벼운 모델이라 OpenAI에서 Output을 널널하게 쓰라는 서버측 프롬프트가 돼있을 것임.


나도 전문가는 아니지만 작년에 GPT-4 사용자 몰려서 1초에 한 단어씩 내뱉을 때 OAI가 어떻게 했겠음?


Output 짧게 하라고 시켜야 서버부하가 그나마 줄어들 것이고 그때부터 GPT-4 게을러 터졌네 멍청해졌네가 나온 거임.


Output 길게 해주면 존나 똑똑하다는 착각을 하게 됨.


Output 짧게 리밋하면 LLM이 말해줘야 할 것도 짤라야 하니 멍청해 보임. 이게 왜 어떤 애들은 4o가 also보다 못하네 마네 하는 거임. lmsys는 투표점수를 받아야 하는데 OAI가 리밋 걸겠음?


GPT-4보다 4배나 싼 API 가격이니 내 생각엔 엄청난 경량화 모델일 것임. 아까 누가 인용한 글에 40B~80B 모델일 거 같다고 했는데 그럴 수도 있다고 생각함.


경량화라 컴퓨트 안 잡아 먹으니 Output 널널하게 해주면 됨.


그럼 OpenAI가 엄청난 폭리를 취하는 거 아니냐고 하는데 OAI가 자선사업하는 것도 아니고 사업적으로 만약 비용이 10배 줄었다고 판매가격을 10배 깍아주지 않음. 사용자가 이만큼 낼 수 있겠다. 경쟁사에서 이만큼 사용자들을 뺏어올 수 있겠다. 이런 생각하고 가격을 책정함.


며칠간 코딩을 해보니 4o와 클로드가 성능면에서 큰 차이가 있는지는 아직도 모르겠음. 좀 애매함.


근데 4o가 일단 빠르고 코드를 한 방에 더 많이 짜주니 그걸 쓸 수 밖에 없음. 이건 좀 더 지켜봐야 하겠지만 상대적으로 코딩은 우위인 것 같음. 디버깅 해야하긴 마찬가지지만.


오늘 업무상 데이터를 분석해서 MS Teams로 보내는 간단한 코드를 짰는데 간단한 분석이라 첨엔 무료인 groq llama 3 70B API로 분석하려다가 분석이 영 시원치 않아서 GPT-4o와 Claude 3 Opus를 비교해 봄.


내가 원하는 형태의 분석이 나와야 해서 그런 분석이 나올 수 있는 프롬프트를 양쪽에 짜달라고 6~7번 정도 해 봄.


미세하지만 클로드가 좀 더 좋은 프롬프트 엔지니어링을 해 줌.


그리고 동일 프롬을 가지고 실제 데이터 분석 몇 번 돌려봤는데. 미세하게 클로드가 좀 더 똑똑한 분석을 함. 4o는 놓치는 부분이 있었음.


4o가 월등히 빠르고 싸서 분석 결과가 비슷했더라면 무조건 4o 쓸거였는데 의외로 클로드 결과가 더 잘 나와서 이 건은 클로드 API를 쓰기로 함.


업무상 데이터라 내가 보여줄 순 없고. 여기는 완전 4o가 월등히 낫다는 분위기라 내 경험을 공유하는 마음에 써봄.


기존 GPT-4는 포지셔닝이 완전 이상해졌으니 5가 곧 나와야 하긴 할듯.

자동등록방지

추천 비추천

6

고정닉 1

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
487722 일반 노력충의 모순점이 마음에안듦 ㅇㅇ(14.36) 06.06 125 3
487721 일반 특린이 gpt5 오늘 나오는거 맞음? [3] 그돌뜬갤로그로 이동합니다. 06.06 210 0
487720 일반 Gpt-5 드가자드가자드가자~ ㅇㅇ(121.131) 06.06 131 0
487719 일반 엔비+애플+마소 > 중국 전체시장 [1] ㅇㅇ(211.187) 06.06 222 5
487718 일반 노동의 중요성과 가치를 뚜렷하게 정의하여 보자 ㅇㅇ(223.62) 06.06 49 0
487717 일반 ai시대가 오면 맑시즘은 부활한다 [4] ㅇㅇ갤로그로 이동합니다. 06.06 161 1
487716 일반 보편적 고소득이 실현될 정도면 [2] ㅇㅇ(211.184) 06.06 109 2
487715 일반 사실 지금 GPT는 이미 자아를 갖고 있음 [2] ㅇㅇ(211.55) 06.06 185 0
487714 일반 스타쉽 엔진 재점화랑 soft landing다 된거임?? [4] 기추는개추갤로그로 이동합니다. 06.06 163 0
487711 일반 진지하게 노동해방,완전자율주행 불가능하지않냐? [4] ㅇㅇ(211.204) 06.06 148 0
487710 일반 보편적 고소득 의문점 [7] 선샌니~갤로그로 이동합니다. 06.06 199 0
487709 일반 오늘 일정 알차노 ㅋㅋ [3] ㅇㅇ(118.235) 06.06 286 0
487708 일반 유튜브 이거 어떰? [2] aifilter갤로그로 이동합니다. 06.06 116 0
487707 일반 레오폴드는 gpt4가 똑똑한 고등학생 수준이라네 [3] ㅇㅇ(125.133) 06.06 351 0
487706 일반 우리나라도 빨리 달에라도 갈 수 있음 좋겠다 ㅇㅇ(210.178) 06.06 27 0
487705 일반 모하나묻자 인공지능 겅부하려면 [28] c(61.105) 06.06 336 0
487704 일반 특갤러 새끼들 gpt5 때문에 ㅇㅇ(58.29) 06.06 159 2
487702 일반 형들 문득 궁금해졌는데 천년뒤 인류모습은 [10] ㅇㅇ(220.84) 06.06 163 0
487701 일반 두시간 반 뒤 기다리는 놈들은 뭐임? ㅋㅋㅋㅋ [7] ㅇㅇ(118.235) 06.06 369 1
487700 일반 다음 중계까지 두시간 반 정도 남았네 헤헤 [1] ㅇㅇ(218.39) 06.06 83 0
487698 일반 만일 스페이스X가 우주정거징 짓고 자원을 캐기 시작하면 [1] ㅇㅇ(210.178) 06.06 128 0
487697 일반 양놈들 로켓하나는 기가막히게 만드네ㅋㅋㅋ [2] ㅇㅇ(222.103) 06.06 180 0
487695 일반 농인을 위한 AI 기술? 수어 자동번역 서비스 ㅇㅇ(1.239) 06.06 65 2
487694 일반 매번 느끼는 거지만 발사할 때마다 진전이 이루어지는 듯 [3] ㅇㅇ(210.178) 06.06 220 1
487693 일반 Space X 채널 라이브는 뭐냐? 빝코주라는디 15만명이나 보고있노 [4] ㅇㅇ갤로그로 이동합니다. 06.06 248 0
487692 일반 속보) 스타쉽 성공(진)으로 GPT5 반만 확정 ㅇㅇ갤로그로 이동합니다. 06.06 291 0
487691 일반 존나웃기노 ㅋㅋ ㅇㅇ(211.248) 06.06 114 0
487690 일반 재착륙 성공한거임? [1] ㅇㅇ(115.139) 06.06 271 0
487689 일반 랜딩번까지 했노 ㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 06.06 106 0
487688 일반 이게 성공이네 ㅇㅇ(118.32) 06.06 87 0
487687 일반 로켓 개잘만들었네 ㅅㅂㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 06.06 137 0
487686 일반 날개 저거 어케살아있노ㅋㅋㅋㅋㅋ ㅇㅇ(115.139) 06.06 68 0
487685 일반 카메라 소니꺼임? 개혁신당갤로그로 이동합니다. 06.06 47 0
487684 일반 카메라 저거 어케 살아있는거노 ㅇㅇ(115.139) 06.06 60 0
487682 일반 카메라 명줄 개질기노ㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ(121.131) 06.06 348 0
487681 일반 스타쉽 성공했으면 GPT5 나왔는데 [2] ㅇㅇ갤로그로 이동합니다. 06.06 290 0
487680 일반 Gpt5 안나올듯 [2] ㅇㅇ(58.29) 06.06 169 0
487679 일반 스타쉽 실패각인가 개혁신당갤로그로 이동합니다. 06.06 67 0
487678 일반 suno는 이제 그냥 존재 이유가 없네 ㅇㅇ(1.238) 06.06 229 0
487677 일반 속보)스타쉽 패널 불 남 [2] ㅇㅇ(115.139) 06.06 294 0
487676 일반 나라 개항했을때 어떤 느낌이였을까 [2] ㅇㅇ(182.230) 06.06 131 0
487675 일반 안될과학 ai한다면서 왜 스타쉽 중계하노 ㅇㅇ(115.139) 06.06 80 0
487674 일반 스타십 우째됐노 [2] ㅇㅇ(211.248) 06.06 194 0
487673 일반 사랑해 [12] ㅇㅇ갤로그로 이동합니다. 06.06 169 0
487671 일반 전유물에 대해 논리상 궁금한거 있음 [12] ㅇㅇ갤로그로 이동합니다. 06.06 161 0
487670 일반 Udio신기능 오디오 업로드 기능 개쩌네 [12] InfinityVas갤로그로 이동합니다. 06.06 331 7
487669 일반 오늘 뭐 발표한다하지않았냐 [3] ㅇㅇ갤로그로 이동합니다. 06.06 143 0
487668 일반 중국 보니까 달 착륙 성공했던데 [1] ㅇㅇ(106.101) 06.06 100 0
487667 일반 난 GPT-5가 나올지 안 나올지 보다 [6] ㅇㅇ(175.214) 06.06 231 0
487666 일반 중국놈들 폴댄스 로봇 뭐농 [5] ㅇㅇ(211.200) 06.06 266 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2