디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

ㅇㅇ(182.230) 2024.04.30 19:01:03
조회 161 추천 2 댓글 1
														

https://www.aitimes.com/news/articleView.html?idxno=159241

 



7ce88974b18307f739ee82ed4fee756adfcc9064d4ae6b84e22ff3843e30605cb5ff



구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.


벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.


연구진은 "지금은 텍스트에서 이미지로 생성하는 모델이 널리 사용되고 있지만, 이 모델들이 반드시 주어진 프롬프트와 일치하는 이미지를 생성하지는 않는다"라고 지적했다. 이어 “현재 달리나 미드저니, 스테이블 디퓨전과 같은 모델의 능력을 평가하기 위해 주로 사용되는 데이터셋이나 자동 측정법도 제한적이고 중요한 점을 놓칠 수 있으며 인간 평가와도 다를 수 있다”라고 주장했다.


이를 해결하기 위해 개발한 젝코는 텍스트-이미지 생성 모델에 대한 벤치마크 기준을 높인다. 다양한 기술과 복잡성을 테스트하는 2000개의 텍스트 프롬프트를 제공한다. 이런 프롬프트를 특정 하위 기술로 분류, 모델의 이미지 생성 퀄리티를 떨어 뜨리는 정확한 약점을 찾아낸다.



7ce88974b18307f739ee82ec46ee7564a2b493dc5132652790d9e55e0f33a2ac59e5



연구진은 "이 기술 중심의 벤치마크는 프롬프트를 하위 기술로 분류해 사용자가 어떤 기술이 어려운지뿐만 아니라, 어떤 수준의 복잡성에서 기술이 어려워지는지를 정확히 파악할 수 있도록 한다"라고 설명했다.


젝코 프레임워크는 텍스트에서 이미지로 변환하는 AI 모델의 평가에서의 단점을 해결하기 위해 🔼포괄적인 기술 중심의 벤치마크 데이터셋 🔼다양한 템플릿에 걸친 폭넓은 인간 주석 🔼개선된 자동 평가 메트릭 🔼다양한 기준에서 모델 성능에 대한 통찰력을 제공한다. 



7ce88974b18307f739ee82ec47ee7564a016b3f5740829cf9862e06986d978c5e7



또 요즘 유행하는 인간 선호도 평가도 추가했다.


젝코 프롬프트에 대한 여러 주요 모델들이 생성한 이미지에 대해 10만건 이상의 인간 평가를 수집했다. 이를 통해 이 벤치마크는 모델의 한계, 모호한 프롬프트, 일관되지 않은 평가 방법으로 인해 성능 차이가 나타는지를 구분해 낼 수 있다는 설명이다.


마지막으로 젝코는 질문 응답을 기반으로 한 자동 평가 측정을 특징으로 하고 있으며, 이 측정법은 기존보다 인간의 판단과 더 일치한다는 설명이다. 최신 모델을 비교할 경우, 이전에 감지되지 않았던 각 모델의 장점과 약점을 파악할 수 있었다고 밝혔다.



7ce88974b18307f739ee82ec44ee766d206b6f29456a51f5115de568bdce8d1dea



젝코 벤치마크 테스트를 수행한 결과, 딥마인드의 '뮤즈(Muse)' 모델이 구글의 '이마젠(Imagen)', 스태빌리티 AI의 '스테이블 디퓨전 XL' 및 '스테이블 디퓨전 1.5' 보다 전반적으로 높은 점수를 기록한 것으로 나타났다.


딥마인드는 젝코 코드와 데이터를 무료로 사용할 수 있도록 할 방침이다.


자동등록방지

추천 비추천

2

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
472142 일반 AGI (초등학생도 하는 사칙연산 찐빠 일어남) [3] ㅇㅇ(118.37) 05.14 141 0
472141 일반 GPT-5는 그냥 야부리 털기 & 코딩 특화 모델일 듯 ㅇㅇ(120.142) 05.14 62 0
472140 일반 gpt4o 챗봇아레나에 뜨는데? ㅇㅇ(121.159) 05.14 130 0
472139 일반 근데 gpt-4o도 별로 달라진건 없는데? ㅇㅇ(221.164) 05.14 52 0
472138 일반 귀랑 입 막고 손으로 글만 쓰게 하는데 ㅇㅇ갤로그로 이동합니다. 05.14 39 0
472137 일반 gpt 보이스 발표를 너무 대충했음 이렇게 해야함 ㅇㅇ(210.90) 05.14 84 1
472136 일반 also gpt2 이건 어디서 사용함? [1] 이런내가특특갤로그로 이동합니다. 05.14 116 0
472135 일반 국내 AI 전문가는 어느정도 수준임 [1] ㅇㅇ(106.102) 05.14 88 0
472134 일반 아직 택도 없어 보이는데 [3] ㅇㅇ(110.34) 05.14 144 0
472133 일반 chat gpt 4o 그래서 결론이 뭐야? ㅇㅇ(211.168) 05.14 81 0
472132 일반 그냥 4가 붙어있는 이상 뭘 하든 한계가 있는 듯 [1] ㅇㅇ(49.142) 05.14 47 0
472131 일반 특이점 오면 이거 검증가능함? [3] ㅇㅇ(220.118) 05.14 105 0
472130 일반 GPT5가 계획을 세우고 쪼개서 처리할 수 있다고 했나? ㅇㅇ갤로그로 이동합니다. 05.14 45 0
472129 일반 6시간 정도 써봤는데... 딱 gpt 4.2 아니냐? [8] 버거왕갤로그로 이동합니다. 05.14 226 0
472128 일반 AGI는 정해져 있는것이 아님 ㅇㅇ(121.159) 05.14 29 0
472127 일반 왜 자꾸 한계점을 보였다는 말을 쳐하지 [4] ㅇㅇ갤로그로 이동합니다. 05.14 106 0
472126 일반 근데 챗지피티 지역 변경해서 구독하면 세금 안내냐? [5] ㅇㅇ(39.113) 05.14 97 0
472125 일반 gpt4o 나와도 결국 also 쓰고있네ㅋㅋ ㅇㅇ(218.48) 05.14 117 0
472124 일반 제일 중요한 지능이 4랑 큰차이가 없어서 아쉽네 [1] 이런내가특특갤로그로 이동합니다. 05.14 96 0
472122 일반 키보드배틀 발려서 바보같아질때는 어떡함 [9] 해축러(121.146) 05.14 97 0
472121 일반 예전보다 살짝 똑똑해진거 같다 [1] ㅇㅇ(221.148) 05.14 40 0
472120 일반 확실히 AI가 인간 보다 글을 더 잘 쓰는건 맞음 ㅇㅇ갤로그로 이동합니다. 05.14 35 0
472119 일반 gpt4o는 시간 끌기다. [2] ㅇㅇ갤로그로 이동합니다. 05.14 131 1
472117 일반 근데 20년대 안에 agi가능한거임?? [2] ㅇㅇ(121.142) 05.14 92 0
472116 일반 서로에게 화내지마라 ㅇㅇ(223.38) 05.14 54 0
472115 일반 그래서 좆지랄 마케팅의 결과는 뭐냐? ㅇㅇ(58.234) 05.14 45 0
472114 일반 api로 날리면 야설 가능? [2] ㅇㅇ(114.206) 05.14 146 0
472113 일반 선형충들 발작 존나 심하긴 하네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.14 96 5
472112 일반 수학도 결국 언어 아닌가 [6] ㅇㅇ갤로그로 이동합니다. 05.14 90 0
472111 일반 장소 추론은 꽤 정확한거같네 [5] ㅇㅇ(121.129) 05.14 87 0
472110 일반 그냥 퍼플렉시티 써라 [7] ㅇㅇ(106.101) 05.14 144 0
472109 일반 음성이란 통신 방법 자체가 너무나 느려서 짜증나지 않음? [8] 버거왕갤로그로 이동합니다. 05.14 85 0
472108 일반 선형충들 발작하는거 보니까 [1] ㅇㅇ(125.191) 05.14 90 2
472105 일반 아직 오픈AI에도 내부 AGI 없다는 말이 맞는 듯 [1] ㅇㅇ(120.142) 05.14 115 0
472104 일반 반도체 개발자 중 잘 나가는 사람 누구누구 있음 [6] ㅇㅇ(106.101) 05.14 85 0
472103 일반 마케팅 차원에서 중요한 발표였음 [3] ㅇㅇ(121.131) 05.14 287 7
472102 일반 진정한 이해란 뭘까 [1] ㅇㅇ갤로그로 이동합니다. 05.14 32 0
472101 일반 오픈에이아이 레이턴시 주작이 짜치는 이유 [7] ㅇㅇ갤로그로 이동합니다. 05.14 144 0
472100 일반 4o 어디서 사용함? [1] 이런내가특특갤로그로 이동합니다. 05.14 118 0
472099 일반 수학이랑 추론은 아직 AGI 발끝도 못 왔다 ㅇㅇ(120.142) 05.14 45 0
472096 일반 특갤러 개놈새끼들아 [6] ㅇㅇ(121.142) 05.14 106 0
472095 일반 오늘 새벽은 구글I/O지? ㅇㅇ(119.207) 05.14 39 0
472094 일반 gpt-4o 는 PDF도 잘읽네 ㅋㅋㅋ [1] ㅇㅇ(112.170) 05.14 182 0
472093 일반 LLM으로 AGI 가능한 거 맞네 [7] ㅇㅇ갤로그로 이동합니다. 05.14 208 2
472091 일반 능지 상승 없어서 실망한 특붕이들 gpt5 까지만 기다려보자 [1] ㅇㅇ갤로그로 이동합니다. 05.14 75 0
472090 일반 몰랐는데 특갤에 푸씨가 ㅈㄴ 많네 [8] ㅇㅇ갤로그로 이동합니다. 05.14 206 3
472089 일반 치타는 달리고 있다 ㅇㅇ갤로그로 이동합니다. 05.14 26 0
472088 일반 기업은 생산성은 늘어나는데 소비 안하면 망함 ㅏㅗㅓㅏㅗㅓㅏㅗㅓㅏ(121.178) 05.14 40 0
472087 일반 이제 gpt5만 나오면 완벽하다... ㅇㅇ(103.237) 05.14 36 0
472086 일반 gpt-4o끼리 대화하고 노래하고 미쳤네 ㅇㅇ(110.145) 05.14 71 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2