디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

ㅇㅇ(182.230) 2024.04.30 19:01:03
조회 156 추천 2 댓글 1
														

https://www.aitimes.com/news/articleView.html?idxno=159241

 



7ce88974b18307f739ee82ed4fee756adfcc9064d4ae6b84e22ff3843e30605cb5ff



구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.


벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.


연구진은 "지금은 텍스트에서 이미지로 생성하는 모델이 널리 사용되고 있지만, 이 모델들이 반드시 주어진 프롬프트와 일치하는 이미지를 생성하지는 않는다"라고 지적했다. 이어 “현재 달리나 미드저니, 스테이블 디퓨전과 같은 모델의 능력을 평가하기 위해 주로 사용되는 데이터셋이나 자동 측정법도 제한적이고 중요한 점을 놓칠 수 있으며 인간 평가와도 다를 수 있다”라고 주장했다.


이를 해결하기 위해 개발한 젝코는 텍스트-이미지 생성 모델에 대한 벤치마크 기준을 높인다. 다양한 기술과 복잡성을 테스트하는 2000개의 텍스트 프롬프트를 제공한다. 이런 프롬프트를 특정 하위 기술로 분류, 모델의 이미지 생성 퀄리티를 떨어 뜨리는 정확한 약점을 찾아낸다.



7ce88974b18307f739ee82ec46ee7564a2b493dc5132652790d9e55e0f33a2ac59e5



연구진은 "이 기술 중심의 벤치마크는 프롬프트를 하위 기술로 분류해 사용자가 어떤 기술이 어려운지뿐만 아니라, 어떤 수준의 복잡성에서 기술이 어려워지는지를 정확히 파악할 수 있도록 한다"라고 설명했다.


젝코 프레임워크는 텍스트에서 이미지로 변환하는 AI 모델의 평가에서의 단점을 해결하기 위해 🔼포괄적인 기술 중심의 벤치마크 데이터셋 🔼다양한 템플릿에 걸친 폭넓은 인간 주석 🔼개선된 자동 평가 메트릭 🔼다양한 기준에서 모델 성능에 대한 통찰력을 제공한다. 



7ce88974b18307f739ee82ec47ee7564a016b3f5740829cf9862e06986d978c5e7



또 요즘 유행하는 인간 선호도 평가도 추가했다.


젝코 프롬프트에 대한 여러 주요 모델들이 생성한 이미지에 대해 10만건 이상의 인간 평가를 수집했다. 이를 통해 이 벤치마크는 모델의 한계, 모호한 프롬프트, 일관되지 않은 평가 방법으로 인해 성능 차이가 나타는지를 구분해 낼 수 있다는 설명이다.


마지막으로 젝코는 질문 응답을 기반으로 한 자동 평가 측정을 특징으로 하고 있으며, 이 측정법은 기존보다 인간의 판단과 더 일치한다는 설명이다. 최신 모델을 비교할 경우, 이전에 감지되지 않았던 각 모델의 장점과 약점을 파악할 수 있었다고 밝혔다.



7ce88974b18307f739ee82ec44ee766d206b6f29456a51f5115de568bdce8d1dea



젝코 벤치마크 테스트를 수행한 결과, 딥마인드의 '뮤즈(Muse)' 모델이 구글의 '이마젠(Imagen)', 스태빌리티 AI의 '스테이블 디퓨전 XL' 및 '스테이블 디퓨전 1.5' 보다 전반적으로 높은 점수를 기록한 것으로 나타났다.


딥마인드는 젝코 코드와 데이터를 무료로 사용할 수 있도록 할 방침이다.


자동등록방지

추천 비추천

2

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
479292 일반 뜨기쩜 와도 한국은 수혜못누림 [6] ㅇㅇ(223.62) 05.21 201 0
479291 일반 만약 여자면 AI남자 로봇이랑 결혼할거임? [5] ㅇㅇ(211.109) 05.21 143 0
479290 일반 내가 목소리 주인입니다 하고 올라왔는데 [2] ㅇㅇ(125.134) 05.21 157 1
479289 일반 차라리 나도 ai로 태어날 걸 그랬어... [2] ㅇㅇ갤로그로 이동합니다. 05.21 109 0
479288 일반 4o는 진짜 좋긴하네 ㅇㅇ(211.109) 05.21 123 0
479287 일반 지금 진행속도 꼬라지 보면 이분 말이 맞는듯 [1] 위스덤갤로그로 이동합니다. 05.21 295 4
479286 일반 환쌤들 그만하자노 시전하는게 ㄹㅇ 웃음벨임 [9] ㅇㅇ(125.240) 05.21 267 3
479284 일반 근데 이러면 애플 wwdc 일정에도 차질 생기는건가? [3] ㅇㅇ갤로그로 이동합니다. 05.21 173 0
479283 일반 일vs러레 레전드...jpg [7] ㅇㅇ갤로그로 이동합니다. 05.21 428 2
479281 일반 번역가가 꿈이던 바보멍청이 였습니다 [15] 특붕이(182.213) 05.21 304 1
479280 일반 핵융합 근황 살펴봤는데 결국 여기도 AI네 [4] ㅇㅇ(211.235) 05.21 251 0
479278 일반 아무리봐도 허공 헛손질 하는 방식은 별로다 [4] ㅇㅇ(117.20) 05.21 195 1
479277 일반 워터마크 별 관심도 안 생기네 ㅇㅇ(121.128) 05.21 53 0
479276 일반 AI 워터마크는 필요하다고 본다 ㅇㅇ갤로그로 이동합니다. 05.21 87 1
479275 일반 솔직히 워터마크 실효성 없음 [7] ㅇㅇ(39.124) 05.21 211 4
479274 일반 워터마크 달아서 뭐함 [3] Ad_Astra갤로그로 이동합니다. 05.21 159 3
479273 일반 규제때문에 블록체인이 아니더라도 탈중앙화 시스템이 필요하다 ㅇㅇ갤로그로 이동합니다. 05.21 26 0
479272 일반 워터마크는 쉰떡밥인데 머노 [1] ㅇㅇ(121.140) 05.21 74 0
479271 일반 워터마크같은 규제는 고분고분하게 따르는 착한 사람만 걸러냄 [1] 디시콘발사대갤로그로 이동합니다. 05.21 105 0
479270 일반 AI 저작물에 다 워터마크 달리면 기술 실업 매우 늦춰짐 ㅋㅋㅋㅋ [9] ㅇㅇ(112.161) 05.21 174 0
479269 일반 워터마크 떡밥 왜 굴러가냐 ㅋㅋㅋ [2] ㅇㅇ갤로그로 이동합니다. 05.21 164 0
479268 일반 선형적 발전은 없다 [1] et갤로그로 이동합니다. 05.21 57 0
479267 일반 알트만 게이야 이제 똑똑히 알았겠지? ㅇㅇ갤로그로 이동합니다. 05.21 99 2
479265 일반 나같은 백수 있냐? [8] ㅇㅇ(218.158) 05.21 150 0
479264 일반 ai 생성물에 무슨 수로 워터마크를 달건데?ㅋㅋ [2] ㅇㅇ(223.38) 05.21 145 0
479263 일반 AI생성물에 워터마크 다는거 뭔 소리임? [5] ㅇㅇ(112.161) 05.21 160 1
479262 일반 미국도 인셀남 많은거 보니까 괜히 기분 좋네 [4] ㅇㅇ갤로그로 이동합니다. 05.21 182 0
479261 일반 한국은 이래나 저래나 미래먹거리도 반도체임 [5] ㅇㅇ(112.161) 05.21 118 0
479260 일반 근데 나만 슬슬불안해지냐 ㅇㅇ갤로그로 이동합니다. 05.21 123 0
479259 일반 'AI 생성물' 워터마크 표시 의무화···딥페이크 가짜뉴스 막는다 [6] Varian■Wrynn갤로그로 이동합니다. 05.21 317 0
479258 일반 딥러닝으로 고대어 해석하는 원리 이거맞냐? [1] ㅇㅇ(125.143) 05.21 96 0
479257 일반 인공지능 3대장 문제 설명해준다 [11] ㅇㅇ갤로그로 이동합니다. 05.21 189 0
479256 일반 우리나라는 소프트웨어쪽으로는 승산이 없다 ㅇㅇ(211.36) 05.21 66 0
479255 일반 실베딱지 어케없애는지 아시는분? [7] ㅇㅇ갤로그로 이동합니다. 05.21 144 0
479254 일반 "엄" dd갤로그로 이동합니다. 05.21 100 0
479253 일반 오늘 gpt-4 파일 업로드 에러 생기나요? [2] oo(59.7) 05.21 96 0
479252 일반 근데 뭔 증거로 저게 스칼렛 요한슨 목소리라는 거 [1] ㅇㅇ(118.235) 05.21 121 1
479251 일반 제미니 켜라 ㅇㅇ갤로그로 이동합니다. 05.21 73 0
479250 일반 한국 20대 아다 비율 42% 이거 진짜임? [9] ㅇㅇ갤로그로 이동합니다. 05.21 306 0
479249 일반 예전에 잘나갔던 아줌마가 발작한다 이유가 뭐겠냐 [1] 1229(1.229) 05.21 96 1
479248 일반 지금 그럼 LLM 은 1등이 없고 다 비슷비슷한거지????? [3] ㅇㅇ(117.110) 05.21 66 0
479247 일반 LLM의 고도화로 지능이 무료가 되면 뭐함 [13] ㅇㅇ(112.161) 05.21 131 0
479246 일반 제미니 독도 누구땅이라고 물으면 [1] ㅇㅇ(222.97) 05.21 87 0
479245 일반 초지능이 어떤 철학적질문들을 해결해줄거같음?? [3] ㅇㅇ(220.65) 05.21 75 0
479243 일반 아니 뭐 본인이 싫다고 했고 [3] ㅇㅇ(119.64) 05.21 113 0
479242 일반 아이폰 쓰는데 챗gpt 로그인할때 ㅇㅇ(121.154) 05.21 38 0
479241 일반 제미니가 너무 똑똑해졌어.... ㅇㅇ(222.114) 05.21 91 0
479240 일반 초지능이 해결해줄것들 알려주셈 [2] ㅇㅇ(220.65) 05.21 80 0
479239 일반 솔리테어 체스도 못 푸는 병신gptㅋㅋㅋㅋㅋ [7] ㅇㅇ갤로그로 이동합니다. 05.21 170 0
479238 일반 튜링기계의 halting problem 이해하는게 [5] ㅇㅇ(165.132) 05.21 100 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2