디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

ㅇㅇ(182.230) 2024.04.30 19:01:03
조회 162 추천 2 댓글 1
														

https://www.aitimes.com/news/articleView.html?idxno=159241

 



7ce88974b18307f739ee82ed4fee756adfcc9064d4ae6b84e22ff3843e30605cb5ff



구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.


벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.


연구진은 "지금은 텍스트에서 이미지로 생성하는 모델이 널리 사용되고 있지만, 이 모델들이 반드시 주어진 프롬프트와 일치하는 이미지를 생성하지는 않는다"라고 지적했다. 이어 “현재 달리나 미드저니, 스테이블 디퓨전과 같은 모델의 능력을 평가하기 위해 주로 사용되는 데이터셋이나 자동 측정법도 제한적이고 중요한 점을 놓칠 수 있으며 인간 평가와도 다를 수 있다”라고 주장했다.


이를 해결하기 위해 개발한 젝코는 텍스트-이미지 생성 모델에 대한 벤치마크 기준을 높인다. 다양한 기술과 복잡성을 테스트하는 2000개의 텍스트 프롬프트를 제공한다. 이런 프롬프트를 특정 하위 기술로 분류, 모델의 이미지 생성 퀄리티를 떨어 뜨리는 정확한 약점을 찾아낸다.



7ce88974b18307f739ee82ec46ee7564a2b493dc5132652790d9e55e0f33a2ac59e5



연구진은 "이 기술 중심의 벤치마크는 프롬프트를 하위 기술로 분류해 사용자가 어떤 기술이 어려운지뿐만 아니라, 어떤 수준의 복잡성에서 기술이 어려워지는지를 정확히 파악할 수 있도록 한다"라고 설명했다.


젝코 프레임워크는 텍스트에서 이미지로 변환하는 AI 모델의 평가에서의 단점을 해결하기 위해 🔼포괄적인 기술 중심의 벤치마크 데이터셋 🔼다양한 템플릿에 걸친 폭넓은 인간 주석 🔼개선된 자동 평가 메트릭 🔼다양한 기준에서 모델 성능에 대한 통찰력을 제공한다. 



7ce88974b18307f739ee82ec47ee7564a016b3f5740829cf9862e06986d978c5e7



또 요즘 유행하는 인간 선호도 평가도 추가했다.


젝코 프롬프트에 대한 여러 주요 모델들이 생성한 이미지에 대해 10만건 이상의 인간 평가를 수집했다. 이를 통해 이 벤치마크는 모델의 한계, 모호한 프롬프트, 일관되지 않은 평가 방법으로 인해 성능 차이가 나타는지를 구분해 낼 수 있다는 설명이다.


마지막으로 젝코는 질문 응답을 기반으로 한 자동 평가 측정을 특징으로 하고 있으며, 이 측정법은 기존보다 인간의 판단과 더 일치한다는 설명이다. 최신 모델을 비교할 경우, 이전에 감지되지 않았던 각 모델의 장점과 약점을 파악할 수 있었다고 밝혔다.



7ce88974b18307f739ee82ec44ee766d206b6f29456a51f5115de568bdce8d1dea



젝코 벤치마크 테스트를 수행한 결과, 딥마인드의 '뮤즈(Muse)' 모델이 구글의 '이마젠(Imagen)', 스태빌리티 AI의 '스테이블 디퓨전 XL' 및 '스테이블 디퓨전 1.5' 보다 전반적으로 높은 점수를 기록한 것으로 나타났다.


딥마인드는 젝코 코드와 데이터를 무료로 사용할 수 있도록 할 방침이다.


자동등록방지

추천 비추천

2

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
472404 일반 gpts에서 심심풀이용으로 놀만한거 없냐 ㅇㅇ(175.206) 05.14 34 0
472403 일반 그래서 허스키 후타보이스 언제넣어줌 솔.이☆갤로그로 이동합니다. 05.14 51 0
472402 일반 4o 영어 개잘하네 [1] ㅇㅇ(120.142) 05.14 189 0
472401 일반 (GPT-4O를 출시하며) GPT-5보다 쿨할것 ㅇㅇ(218.158) 05.14 87 1
472400 일반 그 오픈아이 거 봣는디 별거 업더만.걍 구글이 다시 짱.묵을기다. ㅇㅇ(223.175) 05.14 48 0
472399 일반 형은 누누히 말한다 [1] ㅇㅇ(115.88) 05.14 95 1
472398 일반 긴 분량이나 글이 길어지면 오류 나는 건 여전하네 ㅇㅇ갤로그로 이동합니다. 05.14 32 0
472397 일반 결국 gpt5 나와도 통역가는 대체 못하는 이유.jpg [10] ㅇㅇ(59.14) 05.14 404 0
472396 일반 추론도 올라간거 같은데 ㅇㅇ(58.29) 05.14 36 0
472394 일반 이거 진짜 oai 직원맞음? 존나 실망스러운데 이러면 [1] ㅇㅇ(121.162) 05.14 247 1
472392 일반 개발용으로 뭐가좋음? [4] ㅇㅇ(118.176) 05.14 112 0
472391 일반 8배라는게 5X8=4o 였음? [2] ㅇㅇ(122.45) 05.14 141 1
472390 일반 4o 실시간 비전 원리가 뭐임 [6] Ad_Astra갤로그로 이동합니다. 05.14 183 0
472389 일반 아니 그냥 성능에 전혀 의심할 필요가 없다니까 ㅋㅋ [2] ㅇㅇ(221.158) 05.14 205 0
472388 일반 돌고래가 여기 분탕충들보다 지능 높을 텐데 ㅇㅇ갤로그로 이동합니다. 05.14 38 0
472387 일반 통번역가는 아닌데 무역오파상이거든? 존나 후달린다 [8] 고양이망나니갤로그로 이동합니다. 05.14 170 0
472386 일반 오픈AI 연구원 오피셜 "이번 제품은 GPT5보다 괜찮을것" [3] ㅇㅇ(112.223) 05.14 399 1
472385 일반 20년뒤면 동물과 인간은 동등한 권리를 가질꺼다 [4] ㅇㅇ(58.29) 05.14 98 0
472384 일반 gpt5는 실시간 비전까지 가냐? ㅇㅇ갤로그로 이동합니다. 05.14 42 0
472383 일반 4o가 쓴 소설 보고가라 ㄸㄷ [4] ㅇㅇ(59.18) 05.14 285 0
472382 일반 다음버전에 사과문제 던졌는데 이 답변 나오면 [2] ㅇㅇ(121.186) 05.14 78 0
472381 일반 실망하는 이유가 뭐임??(반박환영) [39] 부패하는유전자!갤로그로 이동합니다. 05.14 380 1
472380 일반 기존 키오스크는 싹 대체되겠네 [1] ㅇㅇ(122.45) 05.14 103 0
472378 일반 번역쪽은 ai대체 그냥 체념하고 받아들이더라 [7] lightvector갤로그로 이동합니다. 05.14 357 1
472379 일반 수학은 증명만 괜찮지 계산들어가면 좀.. ㅇㅇ(222.109) 05.14 73 0
472377 일반 팩트한접시) 아무도 내려치기 안했다 ㅋ ㅇㅇ(121.184) 05.14 82 4
472376 일반 지금 딱 이거임 [1] Bqbq갤로그로 이동합니다. 05.14 109 1
472374 일반 근데 분탕들도 점점 근거가 하나씩 줄어드는게 웃김 [3] ㅇㅇ(211.200) 05.14 125 0
472373 일반 왜 내가 상상한 게 다 실현되는 거냐 안 빨래야 안 빨 수가 없어 [5] ㅇㅇ갤로그로 이동합니다. 05.14 118 0
472372 일반 팩트) LLM은 출시이후 계속 성능 너프되는중 [1] ㅇㅇ(125.141) 05.14 137 2
472371 일반 작문, 통번역쪽에선 AGI 달성했다고 선언해도 된다고 본다 [4] ㅇㅇ(120.142) 05.14 263 1
472370 일반 4o도 존나 대단한거 맞아. 근데 더 대단한걸 원해... [1] 고양이망나니갤로그로 이동합니다. 05.14 137 0
472369 일반 Gpt-5 좆 박으면 볼 만하겠네 [1] ㅇㅇ(222.116) 05.14 124 1
472367 일반 노동대체는 인공지능+로봇을 일자리에 쓴다는거지? ㅇㅇ(182.219) 05.14 50 0
472366 일반 결국 남자 목소리는 전유물이네.. [4] ㅇㅇ(210.205) 05.14 336 0
472365 일반 근데 open ai 마케팅 기가 맥히긴 하네 ㅋ ㅇㅇ(103.237) 05.14 155 1
472364 일반 그래도 난 지금 상황이 많이 행복하다 [3] lightvector갤로그로 이동합니다. 05.14 154 0
472363 일반 지금 4o 는 질문 제한 없음? [1] ㅇㅇ(49.142) 05.14 94 0
472362 정보/ 오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다 [42] rtOS갤로그로 이동합니다. 05.14 7109 53
472361 일반 GPT-5 나오면 사용량 조금 주고 웬만하면 4o 사용하게 유도할 듯 ㅇㅇ(120.142) 05.14 74 0
472359 일반 빠르든 느리든 알빠니까 걍 혁신을 보여달라고~~ ㅇㅇ(121.184) 05.14 42 0
472358 일반 근데 gpt-4o 보이스 임마는 컨텍스트 얼마나 큼? [2] ㅇㅇ갤로그로 이동합니다. 05.14 76 0
472356 일반 애초에 발표할때부터 gpt4레벨의 무료모델을 강조했는데 [1] ㅇㅇ(49.142) 05.14 146 0
472355 일반 챗gpt4o는 내가 지금까지 한말을 전부 평가하고 있었음 [1] ㅇㅇ(59.18) 05.14 156 0
472354 일반 그래서 단단묵직 형냐 보이스는 어딨노? [2] ㅇㅇ(163.152) 05.14 67 0
472353 일반 4o <<<<<< also ㅇㅇ(210.106) 05.14 96 1
472352 일반 찐따/솔로들이 확실히 4O한테 데이터 많이 바칠듯 [14] ㅇㅇ갤로그로 이동합니다. 05.14 292 1
472351 일반 애플 시리에 openai들어가면 무료임? [2] ㅇㅇ(112.220) 05.14 263 0
472349 일반 병신들 ㅋ 니들 수준이 뭘알겠노 ㅋ [1] ㅇㅇ(121.184) 05.14 111 1
472348 일반 gpt-4o한테 얼굴 비추고 평가해보라고 하지 마라 [4] ㅇㅇ갤로그로 이동합니다. 05.14 228 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2