구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] 구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

ㅇㅇ(182.230) 2024.04.30 19:01:03

조회 161 추천 2 댓글 1

https://www.aitimes.com/news/articleView.html?idxno=159241

구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개...

구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.연구진은

www.aitimes.com

7ce88974b18307f739ee82ed4fee756adfcc9064d4ae6b84e22ff3843e30605cb5ff

구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.

벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.

연구진은 "지금은 텍스트에서 이미지로 생성하는 모델이 널리 사용되고 있지만, 이 모델들이 반드시 주어진 프롬프트와 일치하는 이미지를 생성하지는 않는다"라고 지적했다. 이어 “현재 달리나 미드저니, 스테이블 디퓨전과 같은 모델의 능력을 평가하기 위해 주로 사용되는 데이터셋이나 자동 측정법도 제한적이고 중요한 점을 놓칠 수 있으며 인간 평가와도 다를 수 있다”라고 주장했다.

이를 해결하기 위해 개발한 젝코는 텍스트-이미지 생성 모델에 대한 벤치마크 기준을 높인다. 다양한 기술과 복잡성을 테스트하는 2000개의 텍스트 프롬프트를 제공한다. 이런 프롬프트를 특정 하위 기술로 분류, 모델의 이미지 생성 퀄리티를 떨어 뜨리는 정확한 약점을 찾아낸다.

7ce88974b18307f739ee82ec46ee7564a2b493dc5132652790d9e55e0f33a2ac59e5

연구진은 "이 기술 중심의 벤치마크는 프롬프트를 하위 기술로 분류해 사용자가 어떤 기술이 어려운지뿐만 아니라, 어떤 수준의 복잡성에서 기술이 어려워지는지를 정확히 파악할 수 있도록 한다"라고 설명했다.

젝코 프레임워크는 텍스트에서 이미지로 변환하는 AI 모델의 평가에서의 단점을 해결하기 위해 🔼포괄적인 기술 중심의 벤치마크 데이터셋 🔼다양한 템플릿에 걸친 폭넓은 인간 주석 🔼개선된 자동 평가 메트릭 🔼다양한 기준에서 모델 성능에 대한 통찰력을 제공한다.

7ce88974b18307f739ee82ec47ee7564a016b3f5740829cf9862e06986d978c5e7

또 요즘 유행하는 인간 선호도 평가도 추가했다.

젝코 프롬프트에 대한 여러 주요 모델들이 생성한 이미지에 대해 10만건 이상의 인간 평가를 수집했다. 이를 통해 이 벤치마크는 모델의 한계, 모호한 프롬프트, 일관되지 않은 평가 방법으로 인해 성능 차이가 나타는지를 구분해 낼 수 있다는 설명이다.

마지막으로 젝코는 질문 응답을 기반으로 한 자동 평가 측정을 특징으로 하고 있으며, 이 측정법은 기존보다 인간의 판단과 더 일치한다는 설명이다. 최신 모델을 비교할 경우, 이전에 감지되지 않았던 각 모델의 장점과 약점을 파악할 수 있었다고 밝혔다.

7ce88974b18307f739ee82ec44ee766d206b6f29456a51f5115de568bdce8d1dea

젝코 벤치마크 테스트를 수행한 결과, 딥마인드의 '뮤즈(Muse)' 모델이 구글의 '이마젠(Imagen)', 스태빌리티 AI의 '스테이블 디퓨전 XL' 및 '스테이블 디퓨전 1.5' 보다 전반적으로 높은 점수를 기록한 것으로 나타났다.

딥마인드는 젝코 코드와 데이터를 무료로 사용할 수 있도록 할 방침이다.

고정닉 1

원본 첨부파일 4본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2864	설문	비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는?	운영자	24/06/03	-	-
472142	일반	AGI (초등학생도 하는 사칙연산 찐빠 일어남) [3]	ㅇㅇ(118.37)	05.14	141	0
472141	일반	GPT-5는 그냥 야부리 털기 & 코딩 특화 모델일 듯	ㅇㅇ(120.142)	05.14	62	0
472140	일반	gpt4o 챗봇아레나에 뜨는데?	ㅇㅇ(121.159)	05.14	130	0
472139	일반	근데 gpt-4o도 별로 달라진건 없는데?	ㅇㅇ(221.164)	05.14	52	0
472138	일반	귀랑 입 막고 손으로 글만 쓰게 하는데	ㅇㅇ	05.14	39	0
472137	일반	gpt 보이스 발표를 너무 대충했음 이렇게 해야함	ㅇㅇ(210.90)	05.14	84	1
472136	일반	also gpt2 이건 어디서 사용함? [1]	이런내가특특	05.14	116	0
472135	일반	국내 AI 전문가는 어느정도 수준임 [1]	ㅇㅇ(106.102)	05.14	88	0
472134	일반	아직 택도 없어 보이는데 [3]	ㅇㅇ(110.34)	05.14	144	0
472133	일반	chat gpt 4o 그래서 결론이 뭐야?	ㅇㅇ(211.168)	05.14	81	0
472132	일반	그냥 4가 붙어있는 이상 뭘 하든 한계가 있는 듯 [1]	ㅇㅇ(49.142)	05.14	47	0
472131	일반	특이점 오면 이거 검증가능함? [3]	ㅇㅇ(220.118)	05.14	105	0
472130	일반	GPT5가 계획을 세우고 쪼개서 처리할 수 있다고 했나?	ㅇㅇ	05.14	45	0
472129	일반	6시간 정도 써봤는데... 딱 gpt 4.2 아니냐? [8]	버거왕	05.14	226	0
472128	일반	AGI는 정해져 있는것이 아님	ㅇㅇ(121.159)	05.14	29	0
472127	일반	왜 자꾸 한계점을 보였다는 말을 쳐하지 [4]	ㅇㅇ	05.14	106	0
472126	일반	근데 챗지피티 지역 변경해서 구독하면 세금 안내냐? [5]	ㅇㅇ(39.113)	05.14	97	0
472125	일반	gpt4o 나와도 결국 also 쓰고있네ㅋㅋ	ㅇㅇ(218.48)	05.14	117	0
472124	일반	제일 중요한 지능이 4랑 큰차이가 없어서 아쉽네 [1]	이런내가특특	05.14	96	0
472122	일반	키보드배틀 발려서 바보같아질때는 어떡함 [9]	해축러(121.146)	05.14	97	0
472121	일반	예전보다 살짝 똑똑해진거 같다 [1]	ㅇㅇ(221.148)	05.14	40	0
472120	일반	확실히 AI가 인간 보다 글을 더 잘 쓰는건 맞음	ㅇㅇ	05.14	35	0
472119	일반	gpt4o는 시간 끌기다. [2]	ㅇㅇ	05.14	131	1
472117	일반	근데 20년대 안에 agi가능한거임?? [2]	ㅇㅇ(121.142)	05.14	92	0
472116	일반	서로에게 화내지마라	ㅇㅇ(223.38)	05.14	54	0
472115	일반	그래서 좆지랄 마케팅의 결과는 뭐냐?	ㅇㅇ(58.234)	05.14	45	0
472114	일반	api로 날리면 야설 가능? [2]	ㅇㅇ(114.206)	05.14	146	0
472113	일반	선형충들 발작 존나 심하긴 하네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ	05.14	96	5
472112	일반	수학도 결국 언어 아닌가 [6]	ㅇㅇ	05.14	90	0
472111	일반	장소 추론은 꽤 정확한거같네 [5]	ㅇㅇ(121.129)	05.14	87	0
472110	일반	그냥 퍼플렉시티 써라 [7]	ㅇㅇ(106.101)	05.14	144	0
472109	일반	음성이란 통신 방법 자체가 너무나 느려서 짜증나지 않음? [8]	버거왕	05.14	85	0
472108	일반	선형충들 발작하는거 보니까 [1]	ㅇㅇ(125.191)	05.14	90	2
472105	일반	아직 오픈AI에도 내부 AGI 없다는 말이 맞는 듯 [1]	ㅇㅇ(120.142)	05.14	115	0
472104	일반	반도체 개발자 중 잘 나가는 사람 누구누구 있음 [6]	ㅇㅇ(106.101)	05.14	85	0
472103	일반	마케팅 차원에서 중요한 발표였음 [3]	ㅇㅇ(121.131)	05.14	287	7
472102	일반	진정한 이해란 뭘까 [1]	ㅇㅇ	05.14	32	0
472101	일반	오픈에이아이 레이턴시 주작이 짜치는 이유 [7]	ㅇㅇ	05.14	144	0
472100	일반	4o 어디서 사용함? [1]	이런내가특특	05.14	118	0
472099	일반	수학이랑 추론은 아직 AGI 발끝도 못 왔다	ㅇㅇ(120.142)	05.14	45	0
472096	일반	특갤러 개놈새끼들아 [6]	ㅇㅇ(121.142)	05.14	106	0
472095	일반	오늘 새벽은 구글I/O지?	ㅇㅇ(119.207)	05.14	39	0
472094	일반	gpt-4o 는 PDF도 잘읽네 ㅋㅋㅋ [1]	ㅇㅇ(112.170)	05.14	182	0
472093	일반	LLM으로 AGI 가능한 거 맞네 [7]	ㅇㅇ	05.14	208	2
472091	일반	능지 상승 없어서 실망한 특붕이들 gpt5 까지만 기다려보자 [1]	ㅇㅇ	05.14	75	0
472090	일반	몰랐는데 특갤에 푸씨가 ㅈㄴ 많네 [8]	ㅇㅇ	05.14	206	3
472089	일반	치타는 달리고 있다	ㅇㅇ	05.14	26	0
472088	일반	기업은 생산성은 늘어나는데 소비 안하면 망함	ㅏㅗㅓㅏㅗㅓㅏㅗㅓㅏ(121.178)	05.14	40	0
472087	일반	이제 gpt5만 나오면 완벽하다...	ㅇㅇ(103.237)	05.14	36	0
472086	일반	gpt-4o끼리 대화하고 노래하고 미쳤네	ㅇㅇ(110.145)	05.14	71	0