디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

GPT-4, 사진 알아보고 변호사·대입 시험 성적도 우수

IT동아갤로그로 이동합니다. 2023.03.16 11:09:20
조회 2039 추천 6 댓글 11
[IT동아 차주경 기자] 인공지능 기술 개발사 오픈AI(OpenAI)는 3월 14일(이하 현지시각), 언어 모델 기반 인공지능 GPT(Generative Pre-trained Transformer)의 최신판 GPT-4를 공개했다.

오픈AI가 2022년 11월 선보인 GPT-3.5는 사람과의 대화와 글 짓기, 웹 코딩까지 할 정도로 우수한 능력을 발휘해 세계인으로부터 주목 받았다. 오픈AI는 GPT-3.5의 버그(오동작)를 수정하고 더욱 다양한 작업을 하도록 GPT-4를 개량했다고 밝혔다.

오픈AI GPT-4는 문장뿐만 아니라 사진도 보고 분석한다. 오픈AI가 공개한 예시를 보면, GPT-4는 옛날 PC 모니터를 연결하는 규격 ‘VGA’ 커넥터 모양으로 만든 ‘라이트닝(애플 스마트폰 데이터 전송·충전 규격)’ 커넥터의 상품 사진을 알아봤다. 이어 ‘크기가 작은 첨단 라이트닝 커넥터를, 구식에다 크기도 큰 VGA 커넥터로 만들다니 재미있네요’라는 분석도 내놨다.


오픈AI GPT-4를 활용해 온라인 가정교사



오픈AI는 일반 작업이나 대화에서는 GPT-3.5와 GPT-4의 차이가 두드러지지 않는다고 말한다. 하지만, 작업이나 대화가 복잡해지면 GPT-4가 더 안정감 있게 창의적인 답변을 한다고 밝혔다.

질문과 답변의 수준을 제어하는 능력도 좋아졌다. 답변이나 정보를 바로 말하는 것이 아니라 조금씩 추리하면서 접근하고 이 과정을 잘 소개한다. 오픈AI GPT-4를 가정 교사처럼 쓸 가능성도 증명한 셈이다. 실제로 GPT-4를 활용해 온라인 가정교사 서비스를 만든 스타트업도 있다. 언어 호환성과 번역 능력도 좋아졌다. GPT-4는 26개 언어 가운데 24개 언어에서 GPT-3.5를 능가하는 성능을 나타냈다.

오픈AI는 GPT-4를 마이크로소프트의 클라우드 ‘애저(Azure)’에서 운용한 결과 안정적으로 움직였고, 학습의 성과도 사전에 정확하게 예상했다고 밝혔다. 덕분에 앞으로의 GPT가 어떤 능력을 가질지 예측하는 방법론 연구도 쉬워졌다고 말했다.

오픈AI는 GPT-4의 능력을 검증하려고 사람이 응시하는 각종 시험 문제를 제시했다. GPT-4는 미국 모의 변호사 시험에서 상위 10%에 들 정도로 우수한 성적을 낸 것으로 알려졌다. 앞서 GPT-3.5는 같은 시험에서 하위 10%의 성적을 냈을 뿐이었다.


사람이 응시하는 각종 시험을 GPT-3.5와 GPT-4가 각각 본 결과. 출처 = 오픈AI



오픈AI GPT-4는 사람이 미국 대학교에 입학할 때 응시하는 ‘SAT 시험’도 봤다. 읽고 쓰기 부문에서 800점 만점에 710점, 수학 부문에서 800점 만점에 700점을 각각 받았다. 앞서 GPT-3.5는 각각 670점, 590점을 받았는데, 점수가 많이 올랐다.

전문 영역을 다루는 객관식 질문을 여러 개 제시하는 ‘MMLU’, 상식과 추론 능력을 검증하는 ‘헬라스웩(HellaSwag)’, 파이썬 코딩 실력을 보는 ‘휴먼이벌(HumanEval)’, 독해와 산술 능력을 시험하는 드롭(DROP)등 기계 학습과 인공지능의 성능을 시험하는 각종 벤치마크가 있다. 이 벤치마크 테스트에서도 오픈AI GPT-4는 GPT-3.5를 포함해 기존의 언어 모델 기반 인공지능의 실력을 웃도는 성적을 냈다. 오픈AI는 GPT-4를 도입해 서비스를 고도화한 기업의 사례도 공개했다.

오픈AI는 그럼에도 GPT-4를 완전히 신뢰하면 안된다고 당부했다. GPT-4가 아직 추론 방법을 배우는 중이며, 2021년 9월 이전까지의 데이터만 활용했기에 그 이후 만들어진 지식이나 사건은 제대로 답변하지 못할 가능성이 있다고 말했다. 이어 GPT-4의 버그와 취약점을 개선하고 유해한 정보(폭탄 제조법, 불법 약물 구입처)를 말하지 않도록, 업계 전문가와 함께 성능을 고도화한다고도 언급했다.

글 / IT동아 차주경(racingcar@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 챗GPT 열풍에 AI 활용 서비스·앱 쏟아진다▶ [스타트업-ing] 드랩 “쇼핑몰 상품 사진, AI로 순식간에 만들 수 있습니다”▶ 빙 챗봇에게 세 가지 자아가 생겼다…어떻게 다를까?



추천 비추천

6

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 연인과 헤어지고 뒤끝 작렬할 것 같은 스타는? 운영자 24/04/22 - -
3745 [생성 AI 길라잡이] ‘정부용 생성 AI’ 활용 방안 살펴보니 IT동아갤로그로 이동합니다. 04.26 27 0
3744 [리뷰] 10G SFP+ 지원 비관리형 이더넷 스위치, 넷기어 GS108X IT동아갤로그로 이동합니다. 04.26 30 0
3743 [농업이 IT(잇)다] “농가와 기업, 구성원과 함께 성장하고 싶어” 강경훈 키움바이오 대표 [1] IT동아갤로그로 이동합니다. 04.26 815 0
3742 서울과기대 창업지원단, 예창패·초창패 기업 지원 '선순환' 만든다 IT동아갤로그로 이동합니다. 04.26 39 0
3741 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 8 IT동아갤로그로 이동합니다. 04.25 62 0
3740 써드웍스, 신규 수입 상품 소싱 위한 ‘수입상품 소싱 플랫폼’ 선보여 IT동아갤로그로 이동합니다. 04.25 70 0
3739 [리뷰] 미국/영국 청소기 시장 1등 '샤크'의 무선 진공청소기 '클린 센스 IQ+' [2] IT동아갤로그로 이동합니다. 04.25 896 0
3738 퀄컴, '스냅드래곤 X 플러스'로 라인업 확장··· AI PC 시장 정조준 IT동아갤로그로 이동합니다. 04.25 77 0
3737 [KESIA 시드팁스] 디써클, AI 기반 R&D 플랫폼 ‘알앤디써클’로 전 세계 기업과 연구간 가교 꿈꾼다 IT동아갤로그로 이동합니다. 04.24 93 0
3736 TG삼보, 인포플라와 AI 분야 MOU 체결 IT동아갤로그로 이동합니다. 04.24 95 0
3735 메타, 라마 3 LLM도 오픈소스로 공개··· '시장 장악력 더 높아질 듯' IT동아갤로그로 이동합니다. 04.24 87 0
3734 더길, 상위 10% 프리미엄 셀러 위한 지원 솔루션 선보인다 IT동아갤로그로 이동합니다. 04.24 4302 0
3733 카파바이오사이언스, 신소재 ‘Vita-SPMD’ 글로벌 시장 공급 발판 마련 IT동아갤로그로 이동합니다. 04.24 81 0
3732 플러스닷, NIPA 호치민IT지원센터 2024년 입주기업에 선정 IT동아갤로그로 이동합니다. 04.24 88 0
3731 교수창업기업 ‘럭스바이옴’, 마이크로바이옴 기반 신제품 출시 임박 IT동아갤로그로 이동합니다. 04.24 87 0
3730 ‘체계적인 e스포츠 대면 강의 제공할 것’ 게임프로, e스포츠 오프라인 강의실 5월 말 개소 [8] IT동아갤로그로 이동합니다. 04.24 1967 1
3729 삼성전자, 업계 최초 '9세대 V낸드' 양산 IT동아갤로그로 이동합니다. 04.23 177 0
3728 [스타트업-ing] 더길 “e커머스 초보자도 ‘상생’하며 함께 성장하는 플랫폼” IT동아갤로그로 이동합니다. 04.23 87 0
3727 세일즈포스, '데이터, AI, CRM, 신뢰가 디지털 혁신의 열쇠' IT동아갤로그로 이동합니다. 04.23 88 0
3726 윌리엄앤코, 영유아 영어교육 키트 ‘텔리’ 조달청 등록 추진 IT동아갤로그로 이동합니다. 04.23 85 0
3725 시향 플랫폼 기업 ‘퍼퓸투데이’…BM 확장 및 투자 유치 나서 [1] IT동아갤로그로 이동합니다. 04.23 1654 0
3724 [IT신상공개] 실시간 온체인 데이터 분석·시각화로 업무 효율 높인다, 쟁글ERP IT동아갤로그로 이동합니다. 04.23 4408 0
3723 안창욱 GIST AI연구소장 “이노디테크 AI 시스템, 합성형 AI로 구축했습니다” IT동아갤로그로 이동합니다. 04.23 97 0
3722 CRT게임즈, 서울과기대 초기창업패키지 최우수 기업 선정 IT동아갤로그로 이동합니다. 04.23 102 0
3721 [리뷰] 애플 M3로 실성능 끌어올린 '애플 맥북에어 13' IT동아갤로그로 이동합니다. 04.22 320 0
3720 [시승기] 브랜드 첫 쿠페형 SUV…’제네시스 GV80 쿠페’ IT동아갤로그로 이동합니다. 04.22 101 0
3719 IBM “ESG 솔루션으로 지속가능성·비즈니스 성과 높인다” IT동아갤로그로 이동합니다. 04.22 246 0
3718 [리뷰] ‘AI 시대’가 낳은 차세대 TV, 2024 LG 올레드 evo G4 [3] IT동아갤로그로 이동합니다. 04.22 1307 1
3717 오렌지바이오메드, 품질경영시스템 ISO 9001 인증 획득 IT동아갤로그로 이동합니다. 04.22 94 0
3716 [주간투자동향] 비즈플레이, 30억 원 규모 전략적 투자 유치 IT동아갤로그로 이동합니다. 04.22 90 0
3715 레몬사운드, 콘테스트 기반 음악 제작∙제공 서비스로 게임 업계 ‘성과’ IT동아갤로그로 이동합니다. 04.22 96 1
3714 AI 품은 LG전자 에어컨, 판매량 청신호 IT동아갤로그로 이동합니다. 04.19 265 0
3713 [생성 AI 길라잡이] 전문 지식 없어도 음원 제작 거뜬 ‘AI 작곡’ [8] IT동아갤로그로 이동합니다. 04.19 7798 7
3712 god의 길·촛불하나 M/V, 영국서 리메이크로 재탄생 [1] IT동아갤로그로 이동합니다. 04.19 270 1
3711 나띵프로젝트, 캐릭터로 더 친근해진 '플랍플랍 버블바스' 입욕제 출시 IT동아갤로그로 이동합니다. 04.19 133 0
3710 [KESIA 시드팁스] 메이커런스 “아이와 부모, ‘반차’로 함께 힐링하세요” [1] IT동아갤로그로 이동합니다. 04.19 904 0
3709 디지포레 “대기업 위주 디지털트윈 생태계, 중소기업 확산 위한 교두보 마련” IT동아갤로그로 이동합니다. 04.19 849 0
3708 아웃도어 플랫폼 '데얼스', 2024 스포츠산업 창업 도약 기업 선정 IT동아갤로그로 이동합니다. 04.19 120 0
3707 클랫폼, 스마트팜 활용 도농 융복합단지 조성 추진 IT동아갤로그로 이동합니다. 04.19 117 0
3706 박스테이션, 주차 요금 핸즈프리결제 솔루션 상용화에 박차 IT동아갤로그로 이동합니다. 04.19 113 0
3705 제이쓰리씨, 해양 시뮬레이터 개발로 ‘대한민국 우수기업’ R&D 대상 수상 IT동아갤로그로 이동합니다. 04.19 117 0
3704 단독질주 엔비디아, 추격나선 인텔·AMD... '변수는 1nm 파운드리' IT동아갤로그로 이동합니다. 04.19 431 0
3703 [농업이 IT(잇)다] 팜비오스 “LED 조명·인도어팜 솔루션으로 기후·인력난 문제 해결” IT동아갤로그로 이동합니다. 04.19 102 0
3702 AI가 이끄는 설계·엔지니어링 혁신…’카티아 유저데이’ 현장 IT동아갤로그로 이동합니다. 04.18 128 0
3701 블록체인 산업 트렌드·발전 방향 확인하는 자리, 2024 BCMC IT동아갤로그로 이동합니다. 04.18 118 0
3700 핀카(FINCA), 3D 초개인화 서비스 '마리테'로 침구 시장 공략 IT동아갤로그로 이동합니다. 04.18 749 1
3699 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 7 IT동아갤로그로 이동합니다. 04.17 146 0
3698 [뉴스줌인] LPDDR5X 시장, 삼성전자 신제품 개발로 경쟁 ‘후끈’ IT동아갤로그로 이동합니다. 04.17 212 0
3697 모니터암·전동식 책상·의자가 사무실 '필수'로 떠오르는 이유는? [1] IT동아갤로그로 이동합니다. 04.17 1603 1
3696 [스타트업-ing] 씨지인사이드 “법률·규제 인공지능 도우미 전파” IT동아갤로그로 이동합니다. 04.17 157 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2