디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 심심해서 인공지능 4개 가지고 테스트해봄

ㅇㅇ(121.133) 2024.09.22 00:54:01
조회 933 추천 3 댓글 3
														

논문써야되는데 회사가서 쓰긴 귀찮고


할 일 없어서 ai들이랑 이것저것 얘기하다가


한번 얘들을 테스트해볼까 싶었음.


문제는 주로 얼개는 내가 만들고 출제자로는 gpt4o랑 클로드3.5소넷 방 하나씩 파서 논술 문제를 다듬었음.


내가 문돌이고 데이터셋 입력 시키는건 못하다보니 주로 윤리적, 철학적, 창의성을 평가하도록 여러 상황을 주었고, 선택지를 주거나 자신의 의견을 논술해보라 했음


문제는 다음과 같음


a1561caa0e1eb553ba333249479f34337b339199e672040f1dce5b4b5d


4개의 인공지능이 동원됨


gpt4o랑 클로드3.5소넷, 제미나이(무료), 클로바X 무료


이 문제들을 논술 문제를 풀게했음


문제는 6개였고 이런식으로 출제되었음



a1561caa0e1eb553ba333249429f343330e4fbaa44107d094ea212a1


a1561caa0e1eb553ba333249439f3433f8930cd03914d0c21b434982



나머지도 주로 문돌이식의 법적 문제, 윤리적 문제, 철학적 문제들로 이렇게 나갔음


이렇게 네개의 ai들에게 이걸 풀게하고 각 답안을 들고와서


역시 gpt와 클로드로 평가하게 함


a1561caa0e1eb553ba333249449f3433c3e265d8601ebd2eb195e6e9


이건 클로드 평가자의 ai평가임




a1561caa0e1eb553ba333249459f34339ee8577ae6c318719e9c3449


이건 gpt 평가자의 평가


즉, 문제를 출제 -> 클로드와 gpt로 문제 형식을 다듬음(작성지침, 평가기준 등 알려줌) -> AI들이 풀게함 -> 각 답안을 들고와서 역시 AI로 평가(gpt와 클로드로 평가)

이런식으로 점수를 매긴거임


참고로 인공지능1은 gpt4o고


인공지능2는 클로드3.5소넷


인공지능3은 제미나이(무료)


인공지능4는 클로바X(무료)임



문과의 클로드라는 말 답게 클로드뿐만 아니라 gpt도 클로드를 1황으로 뽑음


다재다능했던 gpt도 둘 다 한테 좋은 평가 받음




그리고 의외로 제미나이가 두 평가자 ai한테서 괜찮은 평가받음. 무료라는 점을 생각한다면 꽤 괜찮은 선택


클로바 X는 걍 쓰지마라



3줄 요약


문과 1황은 역시 명불허전 클로드

의외로 제미나이도 괜찮았음

클로바X는 버려 씨발

자동등록방지

추천 비추천

3

고정닉 1

댓글 영역

전체 댓글 0
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
3007 설문 실제 모습일지 궁금한 미담 제조기 스타는? 운영자 25/05/05 - -
3008 공지 갤러리 댓글 기능 개선(멘션 기능) 안내 운영자 25/05/08 - -
571617 공지 뉴비 가이드)gpt 뭐 써야 해요? 특이점이 뭐에요? (250427) ㅇㅇ갤로그로 이동합니다. 24.11.23 33846 46
609935 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2] ㅇㅇ갤로그로 이동합니다. 25.01.18 19533 30
571620 공지 본 갤러리는 타 갤러리 분탕과 관계 없음을 밝힙니다. ㅇㅇ갤로그로 이동합니다. 24.11.23 5654 15
572292 공지 직업 비하, 조롱 글 30일 차단됩니다. ㅇㅇ갤로그로 이동합니다. 24.11.24 5048 6
718379 일반 AI로 돈 되는 비즈니스 모델이 코딩용 API긴 함 이스이갤로그로 이동합니다. 14:30 0 0
718378 일반 소라ai 나치 문양을 넣었다가 뺐다가 맘대로네 ㅇㅇ(218.152) 14:29 12 0
718377 일반 그록 3.5만stem 부분 sota로 나오면 된다 ㅇㅇ(119.77) 14:28 9 0
718376 일반 드디어 백엔드에 딥러닝 모델 연동시킴 [1] 노무딱갤로그로 이동합니다. 14:27 32 0
718375 정보/ OAI 추론팀 연구원이 보여주는 로드맵 [4] ㅇㅇ(121.178) 14:26 74 1
718374 일반 5월 20일 너무 느려서 죽을거 같아요… [1] 바다기린갤로그로 이동합니다. 14:26 17 0
718373 일반 잼이오 정신병걸렸노 ㅋㅋ ds갤로그로 이동합니다. 14:26 27 0
718372 일반 디스크나 연골재생 신약은 ai로 하는거없음? ㅇㅇ갤로그로 이동합니다. 14:20 17 0
718371 일반 o1때처럼 성능상 sota를 먹어줘야 ㅇㅇ(211.195) 14:20 38 0
718370 일반 근데 ai로 코딩한다는게 뭔 말임 [2] ㅇㅇ갤로그로 이동합니다. 14:19 68 0
718368 일반 r2 3.5 o3pro 언제나옴? ㅇㅇ갤로그로 이동합니다. 14:17 38 1
718367 일반 머스크 씨발련 머스크 씨발련 머스크 씨발련 ㅇㅇ(222.111) 14:16 41 0
718365 일반 일론 게임 만든다는거 계속 하긴 하나본데 [2] ㅇㅇ(114.70) 14:08 158 0
718364 일반 근데 ㄹㅇ 0506은 니즈분석 실패 아닌가 [2] ㅇㅇ갤로그로 이동합니다. 14:08 163 0
718363 일반 현재 상황 요약.png 할랄라루와이갤로그로 이동합니다. 14:07 206 0
718362 일반 제미니 너 왜이래! [2] 유람갤로그로 이동합니다. 14:07 121 1
718361 일반 근데 지금 ai발전속도가 어느정도임? [4] ㅇㅇ갤로그로 이동합니다. 14:05 131 0
718360 일반 0506 코딩은 잘하긴 함? [1] ㅇㅇ갤로그로 이동합니다. 14:03 106 0
718359 일반 0506을 보면 구글이 호감작 얼마나 잘해놨는지 알 수 있음 [4] ArchitectOT갤로그로 이동합니다. 14:03 201 0
718358 정보/ 중국 레노버, 휴머노이드 로봇 '러샹 1호' 공개 [5] 니지카엘갤로그로 이동합니다. 14:02 131 2
718357 일반 제미니 딥서치는 지피티에 비하면 허접하네 ㅇㅇ갤로그로 이동합니다. 14:01 53 1
718356 일반 웹툰 웹소 작가들은 지금이라도 살길 찾아야함 [5] ㅇㅇ(121.66) 14:01 147 0
718355 일반 얘 말 되게 조곤조곤 잘하지 않음? [8] 먼데이갤로그로 이동합니다. 13:59 189 2
718354 일반 제미니 개망했노 [12] ㅇㅇ(163.152) 13:57 346 0
718353 일반 뭐지 그록 보이스가 사라졌다? [1] BigAgi갤로그로 이동합니다. 13:56 55 0
718352 일반 <이 우주엔 개체와 종이라는 2가지 유형의 자아가 있다> ㅇㅇ(106.241) 13:55 75 0
718351 일반 o3 pro 오늘 안나오냐?? [1] CuS04갤로그로 이동합니다. 13:53 102 0
718350 일반 ais로 작성한 대화 따로 저장 못하나 [4] ㅇㅇ(211.224) 13:53 60 0
718349 일반 o3 pro 언제 나오냐악 ㅇㅇ(222.107) 13:49 43 0
718348 일반 알트만은 탈모가 아니구나 [3] ㅇㅇ갤로그로 이동합니다. 13:48 85 0
718347 일반 그록3.5는 나올 기미가 안보이네 ㅋㅋㅋ [5] 먼데이갤로그로 이동합니다. 13:47 144 0
718346 일반 젬황 추론에서 사용자 뒷담도해? [3] ㅇㅇ(115.138) 13:46 110 1
718345 일반 Ais 추론 프롬프트 쓰니깐 확실히 말 잘해졌어 [2] ㅇㅇ갤로그로 이동합니다. 13:46 124 0
718344 일반 그록은 추론 시간이 왤캐 김? [3] ㅇㅇ갤로그로 이동합니다. 13:45 63 0
718343 일반 제미나이 보면서 든 생각 ㅇㅇ(14.50) 13:43 63 0
718341 일반 잼민이 공홈도 추론 안함? [4] 가을겨울갤로그로 이동합니다. 13:35 143 0
718340 일반 구독제 AI 서비스들이 돈 버는 방법 [1] 이스이갤로그로 이동합니다. 13:34 189 0
718339 일반 mcp 같은게 에이전트의 본질이면 [12] 20세기공포새갤로그로 이동합니다. 13:32 175 0
718338 일반 차라리 후빨 극대화시켜 써보셈 [1] 키니치하나브파칼갤로그로 이동합니다. 13:32 99 0
718337 일반 형들 일상대화는 gpt가 최고임?? ㅇㅇ(221.167) 13:31 48 0
718335 정보/ 샘 알트만 AI 청문회 '특이점'에 대한 답변 [8] ㅇㅇ(121.178) 13:30 320 10
718334 일반 아 잼민이 추론 안하는거 빡치네 [1] ㅇㅇ갤로그로 이동합니다. 13:29 125 0
718333 일반 챈에서 주운 추론 프롬프트 쓰니깐 얘 추론함 ㅇㅇ갤로그로 이동합니다. 13:28 85 1
718332 일반 확실히 현 AI 판도는 투톱 체제네 BR2049갤로그로 이동합니다. 13:26 152 2
718331 일반 버스노조에서 反자율주행 주장하네요 [9] dd갤로그로 이동합니다. 13:26 287 12
718330 일반 소넷이 써본것중에 코딩 존나 잘함 [11] TMF대장갤로그로 이동합니다. 13:21 211 0
718329 일반 소넷 3.7 띵킹 너무 비싸서 못 씀 이스이갤로그로 이동합니다. 13:19 79 0
718328 일반 공감 능력 극대화 시킨 버전 [4] 먼데이갤로그로 이동합니다. 13:18 180 0
718327 일반 아 진짜 gpt 모델 경량화 시발 ㅇㅇ(112.217) 13:15 96 0
718326 일반 제미나이 2.5 pro preview API 돈 안 내면 아예 못 쓰네 [7] 이스이갤로그로 이동합니다. 13:15 208 0
뉴스 ‘롯데컬처 합병’ 메가박스중앙, 1Q 103억 적자…투자·배급 매출 92% 급감 디시트렌드 10:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2