디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] [소신발언] 클로드가 GPT-4o보다 살짝 더 똑똑하다.

선갤러(61.73) 2024.05.16 21:43:46
조회 784 추천 6 댓글 17
														

1ebec223e0dc2bae61abe9e4419f343304ceabbacc57cc1455081d3a

본인은 OpenAI, Claude 둘 다 API로 쓰고 있음으로 한쪽 편을 들 생각이 추호도 없음.


위의 짤은 레딧 Claude갤이라 편향이 있을 수 있음. 그래도 글 내용에 둘 다 써본 사람만 대답해 달라는 요청이 있었고 20불이 껌값인 미국형들이 둘 다 써보지도 않고 클로드를 찍은 사람은 많지 않을듯함.


어제 4o가 틀린 퀴즈문제 클로드는 맞췄다고 했더니 벤치마크 들고와서 개같이 달려들어서 물어뜯던데


현대 아이오닉5가 안전성 테스트 AAA 받았고 10개국가 올해의 차에 선정 됐으니 우리 아빠 차가 젤 조앙~ 하는 것 밖에 안 됨...


다들 4o가 역대급으로 좋다고 하고 4보다는 실제로 꽤나 좋은 거 같아서 며칠동안 써봤음.


사람들이 자꾸 간과하는 게 4o는 가벼운 모델이라 OpenAI에서 Output을 널널하게 쓰라는 서버측 프롬프트가 돼있을 것임.


나도 전문가는 아니지만 작년에 GPT-4 사용자 몰려서 1초에 한 단어씩 내뱉을 때 OAI가 어떻게 했겠음?


Output 짧게 하라고 시켜야 서버부하가 그나마 줄어들 것이고 그때부터 GPT-4 게을러 터졌네 멍청해졌네가 나온 거임.


Output 길게 해주면 존나 똑똑하다는 착각을 하게 됨.


Output 짧게 리밋하면 LLM이 말해줘야 할 것도 짤라야 하니 멍청해 보임. 이게 왜 어떤 애들은 4o가 also보다 못하네 마네 하는 거임. lmsys는 투표점수를 받아야 하는데 OAI가 리밋 걸겠음?


GPT-4보다 4배나 싼 API 가격이니 내 생각엔 엄청난 경량화 모델일 것임. 아까 누가 인용한 글에 40B~80B 모델일 거 같다고 했는데 그럴 수도 있다고 생각함.


경량화라 컴퓨트 안 잡아 먹으니 Output 널널하게 해주면 됨.


그럼 OpenAI가 엄청난 폭리를 취하는 거 아니냐고 하는데 OAI가 자선사업하는 것도 아니고 사업적으로 만약 비용이 10배 줄었다고 판매가격을 10배 깍아주지 않음. 사용자가 이만큼 낼 수 있겠다. 경쟁사에서 이만큼 사용자들을 뺏어올 수 있겠다. 이런 생각하고 가격을 책정함.


며칠간 코딩을 해보니 4o와 클로드가 성능면에서 큰 차이가 있는지는 아직도 모르겠음. 좀 애매함.


근데 4o가 일단 빠르고 코드를 한 방에 더 많이 짜주니 그걸 쓸 수 밖에 없음. 이건 좀 더 지켜봐야 하겠지만 상대적으로 코딩은 우위인 것 같음. 디버깅 해야하긴 마찬가지지만.


오늘 업무상 데이터를 분석해서 MS Teams로 보내는 간단한 코드를 짰는데 간단한 분석이라 첨엔 무료인 groq llama 3 70B API로 분석하려다가 분석이 영 시원치 않아서 GPT-4o와 Claude 3 Opus를 비교해 봄.


내가 원하는 형태의 분석이 나와야 해서 그런 분석이 나올 수 있는 프롬프트를 양쪽에 짜달라고 6~7번 정도 해 봄.


미세하지만 클로드가 좀 더 좋은 프롬프트 엔지니어링을 해 줌.


그리고 동일 프롬을 가지고 실제 데이터 분석 몇 번 돌려봤는데. 미세하게 클로드가 좀 더 똑똑한 분석을 함. 4o는 놓치는 부분이 있었음.


4o가 월등히 빠르고 싸서 분석 결과가 비슷했더라면 무조건 4o 쓸거였는데 의외로 클로드 결과가 더 잘 나와서 이 건은 클로드 API를 쓰기로 함.


업무상 데이터라 내가 보여줄 순 없고. 여기는 완전 4o가 월등히 낫다는 분위기라 내 경험을 공유하는 마음에 써봄.


기존 GPT-4는 포지셔닝이 완전 이상해졌으니 5가 곧 나와야 하긴 할듯.

자동등록방지

추천 비추천

6

고정닉 1

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
487794 일반 카운트다운 제로 됐네 [11] MoonChild갤로그로 이동합니다. 06.07 523 0
487793 일반 OAI 소식 떴다 [1] ㅇㅇ갤로그로 이동합니다. 06.07 338 0
487792 일반 이 씨발련들아 아무것도없잖아 ㅇㅇ(106.101) 06.07 107 0
487791 일반 다시 59뷴 특탁(112.160) 06.07 56 0
487790 일반 근데너네 어디서 기다리고 있는거 ㅇㅇ(211.192) 06.07 75 0
487789 일반 자 1분 드가자 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] ㅇㅇ(211.46) 06.07 126 0
487788 일반 와 남의 노래에 내 목소리 입히니까 쥑이네 [5] ㅇㅇ(39.7) 06.07 193 0
487786 일반 근들갑에 긁히는 건 진짜 뭐 ㅇㅇ(121.161) 06.07 55 0
487785 일반 팩트)fff는 오늘 gpt5가 나온다고 한 적 없다 [16] ㅇㅇ(211.214) 06.07 273 0
487784 일반 아니 근데 요 며칠 아무 소스도 딱히 없었는데 [1] ㅇㅇ(218.154) 06.07 98 0
487783 일반 fff 씹련 말이 없노 ㅇㅇ(121.161) 06.07 65 0
487781 일반 중국 신형 모델 한국어 잘하네 ㅇㅇ갤로그로 이동합니다. 06.07 116 0
487780 일반 카운트다운 GPT 좆되기까지 10분 ㅋㅋ ㅇㅇ갤로그로 이동합니다. 06.07 78 0
487779 일반 다들 안자고 깨어있지? ㅇㅇ갤로그로 이동합니다. 06.07 90 0
487778 일반 오늘 사만다 발표하고 10일에 사만다가 아이폰에 [1] 지혜원갤로그로 이동합니다. 06.07 127 0
487776 일반 짱개들 결과가 망해서 그렇지 국가 차원에서 AI, 반도체 존나 밀어줬잖음 [1] TS망상갤로그로 이동합니다. 06.07 127 0
487775 일반 gpt5고 나발이고 [1] ㅇㅇ(118.223) 06.07 147 0
487774 일반 폭풍전야 ㅇㅇ(121.161) 06.07 51 0
487773 일반 소설) 저들은 고기로 이루어져있다 [2] ㅇㅇ(59.6) 06.07 146 3
487772 일반 근데 오늘 뭐 행사 예정된거라도 있었음? [6] ㅇㅇ(118.223) 06.07 223 0
487771 일반 제미나이 답안 1 같은거는 갑자기 왜 튀어나오는거냐 ㅇㅇ(121.133) 06.07 74 0
487770 일반 특이점 도래까지 27분 ㅇㅇ갤로그로 이동합니다. 06.07 54 0
487769 일반 앞으로 스마트 안경이 대세가 될꺼같다 [4] ㅇㅇ(121.181) 06.07 142 0
487768 일반 AMD AI300 NPU가 50Tops라는데 이정도면 어느정도 [4] TS망상갤로그로 이동합니다. 06.07 150 0
487767 일반 agi 에이전트 인터넷 장악 2시간 전 [3] ㅇㅇ(59.6) 06.07 160 0
487766 일반 능동형 ai만나와도 사무직 사라진다 ㅇㅇ(121.181) 06.07 78 1
487765 일반 짱깨 SORA 좀 심상치 않은데? [3] ㅇㅇ갤로그로 이동합니다. 06.07 518 0
487764 일반 세상이 격변하기까지 2시간 남짓 남았노 [2] Dall리신(121.157) 06.07 225 0
487762 정보/ qwen 2 현존 최강 오픈소스 출시 [6] ㅇㅇ갤로그로 이동합니다. 06.07 363 4
487761 일반 그냥 잘게 [1] ㅇㅇ갤로그로 이동합니다. 06.07 103 1
487760 일반 너네 짱깨 SORA 봤냐 [5] ㅇㅇ(119.202) 06.07 392 0
487759 일반 모두들 수고했다... 게임오바다 [3] ㅇㅇ(124.28) 06.07 420 0
487758 일반 인류 역사를 보면 한 분야에서 뛰어난 인재는 간혹 있었지만 [4] ㅇㅇ(112.161) 06.07 198 0
487757 일반 인공지능이 아무리 영리해도 한계는 있을거같은데 [7] ㅇㅇ(61.77) 06.07 226 0
487756 일반 1시간 후 아니다 2시간 후다 보통 3시에 발표한다 [1] ㅎㅎ(61.82) 06.07 203 0
487755 일반 영화 HER 봤는데 사만다 뭔가 불쾌하네 [2] ㅇㅇ갤로그로 이동합니다. 06.07 213 0
487754 일반 다들 축하한다. 우리들의 승리야! 1시간뒤 오는거 맞지? 지혜원갤로그로 이동합니다. 06.07 143 0
487753 일반 GPT4한테 무슨 유두가 좋냐고 물어봤다.... jpg [6] ㅇㅇ(211.179) 06.07 501 6
487752 일반 겨울이네 ㅋㅋㅋ 네달뒤에 온다 ㅇㅇ(118.235) 06.07 64 0
487751 일반 제미나이 클로드가 비슷하게 따라왔따 해도 경쟁이 안된다 [1] ㅎㅎ(61.82) 06.07 115 0
487750 일반 홀로그램 우주설이 맞다면 지금 인류가 처한 난제들은 풀릴거임 ㅇㅇ(112.161) 06.07 107 0
487749 일반 뉴 보이스 이번달에 적용 안되도 우린 할수 잇는게 없음. [1] ㅎㅎ(61.82) 06.07 102 0
487748 일반 5도 안나오고 소라도 안나오고 보이스도 안나오고 ㅇㅇ(124.49) 06.07 82 0
487747 일반 제발 좀 특이점 오라고!!! 123(1.255) 06.07 63 0
487746 일반 추론능력 쩌는 모델보다 반응속도 빠른 보이스가 더 현실에서 와닿을지도 ㅎㅎ(61.82) 06.07 75 0
487745 일반 나와봤자 보이스겠지 ㅇㅇ갤로그로 이동합니다. 06.07 48 0
487744 일반 제발 오늘 뭐라도 나와다오.. 이세이미야케갤로그로 이동합니다. 06.07 103 0
487743 일반 뭔가 역노화는 못해도 50년이상은 걸릴거같음 [8] ㅇㅇ(221.143) 06.07 253 0
487742 일반 오늘 보이스 기대했는데 튼 거 같다 ㅇㅇ(163.152) 06.07 105 0
487741 일반 과학적 발견은 유레카인데 사회경제학적 발견은 개짜릿함 [10] ㅇㅇ(112.161) 06.07 183 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2