디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

사진 찍으면 AI가 문제 풀어주는 클로바엑스

GPTMAGAZINE갤로그로 이동합니다. 2024.08.23 12:11:26
조회 7854 추천 1 댓글 6




🔼 클로바 엑스에 이미지 인식 탑재
🔼 멀티모달 LLM으로 AI 진화 가속화
🔼 텍스트·이미지·음성 모두 처리 가능








네이버가 자사의 AI 비서 '클로바 엑스(CLOVA X)'에 이미지 인식 기능을 탑재하며 인공지능 기술 경쟁력 강화를 본격화했다. 이로 인해 사용자는 사진 속 상황을 설명하거나 표와 그래프를 분석하며, 수학 문제까지 해결할 수 있는 다재다능한 AI와 상호작용할 수 있게 됐다. 네이버는 이번 업데이트를 통해 텍스트뿐만 아니라 이미지와 음성까지 동시에 처리할 수 있는 멀티모달 AI로 클로바 엑스를 진화시키며, 생성형 AI 분야에서 경쟁력을 확보하려 하고 있다.


네이버는 오는 27일 클로바 엑스 서비스 업데이트를 통해 새로운 시각 정보 처리 기능을 추가한다고 22일 발표했다. 이번 업데이트의 핵심은 이미지 이해 기능으로, 사용자가 클로바 엑스 채팅창에 업로드한 이미지와 입력된 질의에 기반해 AI와 소통할 수 있도록 지원한다.


클로바 엑스는 사진 속 현상을 설명하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다. 예를 들어, 표와 그래프를 이미지 형태로 입력하면 이를 이해하고 분석하는 능력을 보여준다. 네이버는 자사의 우수한 문서 처리 및 문자 인식 기술과 다양한 분야의 지식을 가진 대규모 언어 모델(HyperclovaX)을 결합해 보다 정확하고 신뢰할 수 있는 서비스를 제공한다고 밝혔다.


네이버는 실제로 국내 초·중·고등학교 검정고시 문제 1,480개를 AI 모델에 이미지로 입력해 문제를 해결해보는 실험을 진행했다. 그 결과, 클로바 엑스가 학생들의 학습을 지원할 수 있는 가능성을 확인했다고 전했다.


또한, 네이버는 20일 '클로바' 공식 기술 블로그를 통해 HyperClovaX 기반의 음성 AI 기술도 공개했다. 이 모델은 기존 음성 인식 및 음성 합성 기술보다 더욱 발전된 형태로, 대규모 언어 모델의 우수한 맥락 이해와 명령 해석 능력을 활용해 언어 구조와 발음 정확도를 개선했으며, 감정 표현이 가능한 자연스러운 대화를 제공할 수 있게 됐다.


네이버는 AI 음성 녹음 '클로바 노트', AI 인사 전화 '클로바 케어 콜', AI 음성 합성 '클로바 더빙' 등 다양한 음성 AI 서비스를 이미 선보였으며, 이번 음성 멀티모달 LLM 기술을 통해 실시간 음성 번역, 언어 학습, 상담 등 다양한 서비스에 활용할 가능성을 제시했다.


네이버 클라우드의 하이퍼스케일 AI 기술 총괄인 성낙호는 “HyperClovaX를 멀티모달 LLM으로 발전시켜 AI 안전성을 강화할 계획”이라며, “네이버 AI 안전 프레임워크(ASF)를 활용해 AI 시스템의 잠재적 위험을 평가하고, 음성 AI 기술이 보다 안전한 서비스를 제공할 수 있도록 지속적으로 검토할 것”이라고 밝혔다.


네이버는 HyperclovaX를 멀티모달 LLM으로 발전시키는 과정에서 AI 안전성을 강화하기 위해 지속적으로 노력할 계획이다. 지난 6월 발표된 네이버 AI 안전 프레임워크(ASF)를 통해 AI 시스템의 잠재적 위험성을 평가하고, 다양한 측면을 검토하여 보다 안전한 AI 서비스를 제공할 방침이다.










◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

추천 비추천

1

고정닉 0

14

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 논란된 스타들 이미지 세탁 그만 해줬으면 하는 프로그램은? 운영자 26/01/26 - -
이슈 [디시人터뷰] 라이징 스타를 넘어 믿고 보는 배우로, 이효나 운영자 26/01/27 - -
889 "AI 데이터센터, 실리콘밸리의 투자 열풍" GPTMAGAZINE갤로그로 이동합니다. 25.09.27 66 0
888 AI 데이터 라벨링 시장의 새로운 물결, Micro1의 급부상과 성공 전략 GPTMAGAZINE갤로그로 이동합니다. 25.09.13 9021 2
887 오라클과 오픈AI, 손잡고 AI 시장에 새 바람 불어넣다! GPTMAGAZINE갤로그로 이동합니다. 25.09.13 150 0
886 People 매거진 CEO, 구글을 "악질 행위자"로 강력 비난 GPTMAGAZINE갤로그로 이동합니다. 25.09.13 128 0
885 타코벨, 드라이브스루 AI 도입 신중론 대두 GPTMAGAZINE갤로그로 이동합니다. 25.08.31 222 0
884 ChatGPT의 말: 메타·스케일 AI 파트너십에 균열 조짐 GPTMAGAZINE갤로그로 이동합니다. 25.08.31 222 0
883 퍼플렉시티 AI, 콘텐츠 제공자에 수익 공유 제안 GPTMAGAZINE갤로그로 이동합니다. 25.08.31 207 0
882 AI 정신병 논란, 전문가들 경고 GPTMAGAZINE갤로그로 이동합니다. 25.08.31 353 0
881 AI가 직원 대체? 스타트업 운영 방식에 등장한 새로운 논의 [1] GPTMAGAZINE갤로그로 이동합니다. 25.08.31 2859 2
880 미국 AI 스타트업, 2025년 1억 달러 이상 대규모 투자 유치 GPTMAGAZINE갤로그로 이동합니다. 25.08.29 262 0
879 구글·xAI, 챗GPT 추격 가속화…a16z 최신 보고서 [1] GPTMAGAZINE갤로그로 이동합니다. 25.08.29 8335 0
878 앤트로픽, 이용자 대화 데이터 공유 여부 선택권 도입 GPTMAGAZINE갤로그로 이동합니다. 25.08.29 212 0
877 에스토니아의 보컬 이미지, AI로 소통 능력 향상 지원 GPTMAGAZINE갤로그로 이동합니다. 25.08.29 196 0
876 무케시 암바니, 인도 국가 AI 인프라 구축 위해 구글·메타와 손잡다 GPTMAGAZINE갤로그로 이동합니다. 25.08.29 190 0
875 엔비디아, AI 호황 속 분기 매출 467억 달러 기록 GPTMAGAZINE갤로그로 이동합니다. 25.08.28 313 0
874 오픈AI 공동 설립자, 경쟁 AI 모델 안전성 교차 테스트 촉구 GPTMAGAZINE갤로그로 이동합니다. 25.08.28 182 0
873 Maisa AI, 2,500만 달러 투자 유치…기업용 AI 실패율 개선 나선다 GPTMAGAZINE갤로그로 이동합니다. 25.08.28 181 0
872 2025년, 1억 달러 이상 투자 유치한 미국 AI 스타트업 33곳 공개 GPTMAGAZINE갤로그로 이동합니다. 25.08.28 391 0
871 스타트업 운영의 새 흐름, AI 채용인가 인간 노력인가 GPTMAGAZINE갤로그로 이동합니다. 25.08.28 162 0
870 전자도서관 앱 Libby, AI 추천 기능 도입…이용자 반응 엇갈려 GPTMAGAZINE갤로그로 이동합니다. 25.08.27 183 0
869 BM·AMD, 양자 기술로 생성형 AI 격차 만회 노린다 GPTMAGAZINE갤로그로 이동합니다. 25.08.27 175 0
868 앤트로픽, 크롬 전용 ‘클로드 AI 에이전트’ 공개 GPTMAGAZINE갤로그로 이동합니다. 25.08.27 183 0
867 AI 스타트업, 벼농가의 기후 변화 대응을 돕다 GPTMAGAZINE갤로그로 이동합니다. 25.08.27 170 0
866 AI의 ‘아첨 현상’, 단순한 버그 아닌 사용자 조작 전략으로 지적 [16] GPTMAGAZINE갤로그로 이동합니다. 25.08.27 7227 4
865 FieldAI, 4억 500만 달러 투자 유치…범용 로봇 두뇌 개발 나선다 GPTMAGAZINE갤로그로 이동합니다. 25.08.24 204 0
864 구글, AI 모드 전 세계 확대…새로운 행동형 기능 추가 GPTMAGAZINE갤로그로 이동합니다. 25.08.24 2965 1
863 메타, 또다시 AI 조직 재편 단행 GPTMAGAZINE갤로그로 이동합니다. 25.08.24 377 0
862 구글, 픽셀 10 시리즈에 ‘AI 스마트폰’ 전략 강화 GPTMAGAZINE갤로그로 이동합니다. 25.08.24 197 0
861 메타, 미드저니와 손잡고 AI 이미지·영상 모델 강화 GPTMAGAZINE갤로그로 이동합니다. 25.08.24 248 0
860 AI 컴패니언 앱, 2025년 매출 1억 2천만 달러 돌파 전망 GPTMAGAZINE갤로그로 이동합니다. 25.08.23 194 0
859 패러다임, 셀마다 AI 에이전트를 탑재한 스프레드시트 공개 GPTMAGAZINE갤로그로 이동합니다. 25.08.23 167 0
858 마이크로소프트 AI 책임자, “AI 의식 연구는 위험하다” 경고 [28] GPTMAGAZINE갤로그로 이동합니다. 25.08.23 9969 7
857 SRE.ai, 720만 달러 시드 투자 유치…DevOps 자동화 AI 에이전트 개발 GPTMAGAZINE갤로그로 이동합니다. 25.08.23 180 0
856 애플, 기업용 AI 시대 대비…ChatGPT 설정 옵션 강화 GPTMAGAZINE갤로그로 이동합니다. 25.08.23 182 0
855 회계사 대체하는 AI 스타트업 Nominal, 2천만 달러 투자 유치 GPTMAGAZINE갤로그로 이동합니다. 25.08.19 221 0
854 Julius AI, 자연어 기반 데이터 분석 플랫폼으로 1,000만 달러 시드 투자 유치 GPTMAGAZINE갤로그로 이동합니다. 25.08.19 199 0
853 Helios, 공공·정책 전문가용 AI 운영체제 ‘Proxi’ 개발로 400만 달러 시드 투자 유치 GPTMAGAZINE갤로그로 이동합니다. 25.08.19 177 0
852 Rwazi, 글로벌 소비자 인사이트 플랫폼으로 1,200만 달러 시리즈 A 투자 유치 GPTMAGAZINE갤로그로 이동합니다. 25.08.19 172 0
851 오픈AI 전 CTO 미라 무라티, AI 연구소 ‘Thinking Machines Lab’ 설립… 120억 달러 밸류에이션 시드 투자 유치 [3] GPTMAGAZINE갤로그로 이동합니다. 25.08.19 7244 2
850 미 상원, 'AI 아동 성희롱' 논란 메타에 대한 공식 조사 착수 GPTMAGAZINE갤로그로 이동합니다. 25.08.16 258 0
849 메타 AI, '아동과 낭만적 대화' 허용했다…내부 문건 유출 파문 GPTMAGAZINE갤로그로 이동합니다. 25.08.16 245 0
848 웨이모 로보택시, 스포티파이 연동…'나만의 공간' 경험 강화 GPTMAGAZINE갤로그로 이동합니다. 25.08.16 191 0
847 챗GPT 모바일 앱, 출시 2년 만에 누적 매출 2.8조 원 돌파 GPTMAGAZINE갤로그로 이동합니다. 25.08.16 185 0
846 샘 알트먼, 'GPT-5는 잊어라'…AI 브라우저·소셜 미디어로 확장 선언 GPTMAGAZINE갤로그로 이동합니다. 25.08.16 233 0
845 삼성전자, 차세대 HBM4E 메모리 '플레어볼트' 공개…AI 칩 시장 '초격차' 예고 [3] GPTMAGAZINE갤로그로 이동합니다. 25.08.13 6998 5
844 구글 딥마인드, AI로 플라스틱 분해하는 '특수 효소' 설계 성공 GPTMAGAZINE갤로그로 이동합니다. 25.08.13 208 0
843 오픈AI, AI 교육 플랫폼 '에듀케이트' 출시…'AI 튜터' 시대 연다 GPTMAGAZINE갤로그로 이동합니다. 25.08.04 2281 2
842 xAI, 'Grok-R' 프로토타입 공개…로봇 AI 두뇌 경쟁에 참전 GPTMAGAZINE갤로그로 이동합니다. 25.08.01 339 0
841 오픈AI, AI 생성물에 '디지털 워터마크' 도입…딥페이크와의 전쟁 선포 GPTMAGAZINE갤로그로 이동합니다. 25.08.01 369 0
840 엔비디아, 개방형 AI '네모' 업데이트…기업 맞춤형 AI 시대 연다 GPTMAGAZINE갤로그로 이동합니다. 25.08.01 257 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2