디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] [소신발언] 클로드가 GPT-4o보다 살짝 더 똑똑하다.

선갤러(61.73) 2024.05.16 21:43:46
조회 795 추천 6 댓글 17
														

1ebec223e0dc2bae61abe9e4419f343304ceabbacc57cc1455081d3a

본인은 OpenAI, Claude 둘 다 API로 쓰고 있음으로 한쪽 편을 들 생각이 추호도 없음.


위의 짤은 레딧 Claude갤이라 편향이 있을 수 있음. 그래도 글 내용에 둘 다 써본 사람만 대답해 달라는 요청이 있었고 20불이 껌값인 미국형들이 둘 다 써보지도 않고 클로드를 찍은 사람은 많지 않을듯함.


어제 4o가 틀린 퀴즈문제 클로드는 맞췄다고 했더니 벤치마크 들고와서 개같이 달려들어서 물어뜯던데


현대 아이오닉5가 안전성 테스트 AAA 받았고 10개국가 올해의 차에 선정 됐으니 우리 아빠 차가 젤 조앙~ 하는 것 밖에 안 됨...


다들 4o가 역대급으로 좋다고 하고 4보다는 실제로 꽤나 좋은 거 같아서 며칠동안 써봤음.


사람들이 자꾸 간과하는 게 4o는 가벼운 모델이라 OpenAI에서 Output을 널널하게 쓰라는 서버측 프롬프트가 돼있을 것임.


나도 전문가는 아니지만 작년에 GPT-4 사용자 몰려서 1초에 한 단어씩 내뱉을 때 OAI가 어떻게 했겠음?


Output 짧게 하라고 시켜야 서버부하가 그나마 줄어들 것이고 그때부터 GPT-4 게을러 터졌네 멍청해졌네가 나온 거임.


Output 길게 해주면 존나 똑똑하다는 착각을 하게 됨.


Output 짧게 리밋하면 LLM이 말해줘야 할 것도 짤라야 하니 멍청해 보임. 이게 왜 어떤 애들은 4o가 also보다 못하네 마네 하는 거임. lmsys는 투표점수를 받아야 하는데 OAI가 리밋 걸겠음?


GPT-4보다 4배나 싼 API 가격이니 내 생각엔 엄청난 경량화 모델일 것임. 아까 누가 인용한 글에 40B~80B 모델일 거 같다고 했는데 그럴 수도 있다고 생각함.


경량화라 컴퓨트 안 잡아 먹으니 Output 널널하게 해주면 됨.


그럼 OpenAI가 엄청난 폭리를 취하는 거 아니냐고 하는데 OAI가 자선사업하는 것도 아니고 사업적으로 만약 비용이 10배 줄었다고 판매가격을 10배 깍아주지 않음. 사용자가 이만큼 낼 수 있겠다. 경쟁사에서 이만큼 사용자들을 뺏어올 수 있겠다. 이런 생각하고 가격을 책정함.


며칠간 코딩을 해보니 4o와 클로드가 성능면에서 큰 차이가 있는지는 아직도 모르겠음. 좀 애매함.


근데 4o가 일단 빠르고 코드를 한 방에 더 많이 짜주니 그걸 쓸 수 밖에 없음. 이건 좀 더 지켜봐야 하겠지만 상대적으로 코딩은 우위인 것 같음. 디버깅 해야하긴 마찬가지지만.


오늘 업무상 데이터를 분석해서 MS Teams로 보내는 간단한 코드를 짰는데 간단한 분석이라 첨엔 무료인 groq llama 3 70B API로 분석하려다가 분석이 영 시원치 않아서 GPT-4o와 Claude 3 Opus를 비교해 봄.


내가 원하는 형태의 분석이 나와야 해서 그런 분석이 나올 수 있는 프롬프트를 양쪽에 짜달라고 6~7번 정도 해 봄.


미세하지만 클로드가 좀 더 좋은 프롬프트 엔지니어링을 해 줌.


그리고 동일 프롬을 가지고 실제 데이터 분석 몇 번 돌려봤는데. 미세하게 클로드가 좀 더 똑똑한 분석을 함. 4o는 놓치는 부분이 있었음.


4o가 월등히 빠르고 싸서 분석 결과가 비슷했더라면 무조건 4o 쓸거였는데 의외로 클로드 결과가 더 잘 나와서 이 건은 클로드 API를 쓰기로 함.


업무상 데이터라 내가 보여줄 순 없고. 여기는 완전 4o가 월등히 낫다는 분위기라 내 경험을 공유하는 마음에 써봄.


기존 GPT-4는 포지셔닝이 완전 이상해졌으니 5가 곧 나와야 하긴 할듯.

자동등록방지

추천 비추천

6

고정닉 1

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
487974 정보/ 오픈AI, 챗GPT ‘환각’ 이유 밝힌다…역설계로 오작동 원인 추적 [17] lightvector갤로그로 이동합니다. 06.07 3945 21
487973 역노화 역노화 나오는데까지 생각보다 오래 걸리겠지만... [1] ㅇㅇ갤로그로 이동합니다. 06.07 186 0
487972 정보/ 美 정부 칼 빼들었다…MS·엔비디아·오픈AI 반독점 조사 ㅇㅇ­갤로그로 이동합니다. 06.07 194 1
487971 일반 특이점 현실반영은 좀 걸리지 [3] 집단린치갤로그로 이동합니다. 06.07 189 1
487970 일반 개꿀잠자고 일어남 ㅇㅇ갤로그로 이동합니다. 06.07 147 0
487969 일반 뤼튼 << 이새끼들 도대체 뭐임? [7] ㅇㅇ(223.38) 06.07 722 2
487968 일반 아니 오늘 아침에 OAI가 메일은 왜보내는거냐 ㅋㅋ ㅇㅇ­갤로그로 이동합니다. 06.07 227 0
487967 일반 빅테크들이 빨리 agi를 개발했으면 좋겠는데 ㅇㅇ(1.221) 06.07 69 0
487966 일반 뤼튼이 해냈네요 ㅇㅇㅇ(61.73) 06.07 386 1
487965 일반 GPT 잘 아는 사람들에게 질문하나 함! [4] JDhwi갤로그로 이동합니다. 06.07 193 0
487964 일반 일반인이 쓴 글 무단으로 정치하는 대통령내외 [9] 김지원공범(117.111) 06.07 443 0
487963 일반 세상은 시뮬레이션이기 때문에 많은 npc들이 관심갖는 사항은 안 이뤄짐 [10] dd(175.120) 06.07 264 0
487962 일반 치매 확정유전자 치료제 [3] ㅇㅇ(211.234) 06.07 230 0
487961 일반 올해 미국에서 수십억 마리 매미떼 출현 예정 ㄷㄷ [5] ㅇㅇ(220.93) 06.07 226 1
487960 일반 레오폴드는 openai 연구소 폐쇄시키려 함 ㅇㅇ(125.191) 06.07 259 0
487956 일반 이번달 안에 5나온다 ㅇㅇ(112.165) 06.07 105 0
487955 일반 AGI 특이점 늦게와도 된다 [5] 선샌니~갤로그로 이동합니다. 06.07 341 0
487954 일반 근데 갑자기 궁금한건데 지구상 생명체는 다밝혔냐???????? [7] ㅇㅇ(117.110) 06.07 235 0
487953 일반 오늘은 별 타격이 없네 ㅇㅇ(14.53) 06.07 115 0
487952 일반 근시일내 gpt 후속모델 나올것 = 근시일내 완전자율주행 시행 ㅇㅇ갤로그로 이동합니다. 06.07 164 0
487951 일반 으이구 gpt-5는 wwdc 이후에 나오지 등신들아 [4] ㅇㅇ(106.102) 06.07 263 0
487950 일반 보이스모드 7~8월에 나올듯 ㅇㅇ갤로그로 이동합니다. 06.07 208 0
487949 일반 아무리 봐도 2027년에 agi 안될 거 같은데 [9] ㅇㅇ갤로그로 이동합니다. 06.07 494 3
487948 일반 이게 다 발사대가 구려서 그래 [6] ㅇㅇ갤로그로 이동합니다. 06.07 223 2
487947 일반 엔비디아 ms 오픈ai 반독점 조사받을 예정이네 [7] ㅇㅇ(210.106) 06.07 299 0
487945 일반 겨울이 별건가 [3] et갤로그로 이동합니다. 06.07 149 0
487944 일반 기다려봐 아직 모른다 ㅇㅇ(223.38) 06.07 165 3
487943 일반 이제 6월달에 5나올일은 없는거내 ㅇㅇ(223.38) 06.07 79 0
487942 일반 ChatGPT 4o 음성모델 왠지 WWDC에서 아이폰 독점공개 할듯 [1] 지옥2갤로그로 이동합니다. 06.07 353 0
487941 일반 올해는 gpt5 없는줄 알아라 ㅇㅇ(223.38) 06.07 159 1
487940 일반 애초에 기대를 하니까 배신을 당하는거다 ㅇㅇ(220.116) 06.07 89 1
487939 일반 OpenAI 새 트윗 ㅇㅇ(121.134) 06.07 491 1
487938 일반 챗 지피티 보이스 모드 지금 되는건가요? [7] ㅇㅇ(180.69) 06.07 304 0
487937 일반 gpt 유료구독 3시간 제한 다 쓰면 파일분석도 막히는 거임? [2] ㅇㅇ(118.217) 06.07 140 0
487936 일반 안나올 수 있긴한데 입은 왤케 많이 터는거냐 ㅇㅇ(112.161) 06.07 92 0
487935 일반 6일 은 아무 소스가 없었는데 왜 혼자 기대 했다가 실망 ㅋㅋ [4] ㅇㅇ(218.154) 06.07 234 1
487934 일반 걍 어찌됐건 oai는 약속 어긴거임 [31] ㅇㅇ(118.235) 06.07 3353 26
487933 일반 존버 915일차 [2] alphaca갤로그로 이동합니다. 06.07 59 1
487932 일반 qwen72b 벤치마크 엄청남데 ㅇㅇ(218.154) 06.07 118 0
487931 일반 애플 개발자회까지 사만다 기다려야되네 ㅇㅇ(223.38) 06.07 60 0
487930 일반 ㅂㅅ들 좀 진득하게 기다려라 oai뜻도 모르노 [1] ㅇㅇ(118.40) 06.07 268 0
487929 일반 와 미쳤다 6월6일 [6] ㅇㅇ갤로그로 이동합니다. 06.07 773 5
487928 일반 념글 다시 보니 웃기긴 하노 [1] ㅇㅇ(116.127) 06.07 232 0
487927 일반 야 그래서 여름에나오는건 맞냐?!!! ㅇㅇ(133.106) 06.07 49 0
487926 일반 6월6일 같은 소리 말고 12일이나 기다려 적절한김대기(114.202) 06.07 144 0
487925 일반 갤주는 봐라 댜댣(118.235) 06.07 47 0
487924 일반 oai 애들이 뭔가를 올리긴 했네 [1] ㅇㅇ(182.226) 06.07 448 0
487923 일반 그래서 뭐 나옴? ㅇㅇ갤로그로 이동합니다. 06.07 48 0
487922 일반 무라티 누나는 저번 발표때가 이뻣지... [1] ㅇㅇ갤로그로 이동합니다. 06.07 316 1
487921 일반 미국대선 끝나고도 안나오면 역대급 겨울 진입이냐 [2] ㅇㅇ(175.199) 06.07 178 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2