구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] 구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

ㅇㅇ(182.230) 2024.04.30 19:01:03

조회 162 추천 2 댓글 1

https://www.aitimes.com/news/articleView.html?idxno=159241

구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개...

구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.연구진은

www.aitimes.com

7ce88974b18307f739ee82ed4fee756adfcc9064d4ae6b84e22ff3843e30605cb5ff

구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.

벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.

연구진은 "지금은 텍스트에서 이미지로 생성하는 모델이 널리 사용되고 있지만, 이 모델들이 반드시 주어진 프롬프트와 일치하는 이미지를 생성하지는 않는다"라고 지적했다. 이어 “현재 달리나 미드저니, 스테이블 디퓨전과 같은 모델의 능력을 평가하기 위해 주로 사용되는 데이터셋이나 자동 측정법도 제한적이고 중요한 점을 놓칠 수 있으며 인간 평가와도 다를 수 있다”라고 주장했다.

이를 해결하기 위해 개발한 젝코는 텍스트-이미지 생성 모델에 대한 벤치마크 기준을 높인다. 다양한 기술과 복잡성을 테스트하는 2000개의 텍스트 프롬프트를 제공한다. 이런 프롬프트를 특정 하위 기술로 분류, 모델의 이미지 생성 퀄리티를 떨어 뜨리는 정확한 약점을 찾아낸다.

7ce88974b18307f739ee82ec46ee7564a2b493dc5132652790d9e55e0f33a2ac59e5

연구진은 "이 기술 중심의 벤치마크는 프롬프트를 하위 기술로 분류해 사용자가 어떤 기술이 어려운지뿐만 아니라, 어떤 수준의 복잡성에서 기술이 어려워지는지를 정확히 파악할 수 있도록 한다"라고 설명했다.

젝코 프레임워크는 텍스트에서 이미지로 변환하는 AI 모델의 평가에서의 단점을 해결하기 위해 🔼포괄적인 기술 중심의 벤치마크 데이터셋 🔼다양한 템플릿에 걸친 폭넓은 인간 주석 🔼개선된 자동 평가 메트릭 🔼다양한 기준에서 모델 성능에 대한 통찰력을 제공한다.

7ce88974b18307f739ee82ec47ee7564a016b3f5740829cf9862e06986d978c5e7

또 요즘 유행하는 인간 선호도 평가도 추가했다.

젝코 프롬프트에 대한 여러 주요 모델들이 생성한 이미지에 대해 10만건 이상의 인간 평가를 수집했다. 이를 통해 이 벤치마크는 모델의 한계, 모호한 프롬프트, 일관되지 않은 평가 방법으로 인해 성능 차이가 나타는지를 구분해 낼 수 있다는 설명이다.

마지막으로 젝코는 질문 응답을 기반으로 한 자동 평가 측정을 특징으로 하고 있으며, 이 측정법은 기존보다 인간의 판단과 더 일치한다는 설명이다. 최신 모델을 비교할 경우, 이전에 감지되지 않았던 각 모델의 장점과 약점을 파악할 수 있었다고 밝혔다.

7ce88974b18307f739ee82ec44ee766d206b6f29456a51f5115de568bdce8d1dea

젝코 벤치마크 테스트를 수행한 결과, 딥마인드의 '뮤즈(Muse)' 모델이 구글의 '이마젠(Imagen)', 스태빌리티 AI의 '스테이블 디퓨전 XL' 및 '스테이블 디퓨전 1.5' 보다 전반적으로 높은 점수를 기록한 것으로 나타났다.

딥마인드는 젝코 코드와 데이터를 무료로 사용할 수 있도록 할 방침이다.

고정닉 1

원본 첨부파일 4본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2864	설문	비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는?	운영자	24/06/03	-	-
472404	일반	gpts에서 심심풀이용으로 놀만한거 없냐	ㅇㅇ(175.206)	05.14	34	0
472403	일반	그래서 허스키 후타보이스 언제넣어줌	솔.이☆	05.14	51	0
472402	일반	4o 영어 개잘하네 [1]	ㅇㅇ(120.142)	05.14	189	0
472401	일반	(GPT-4O를 출시하며) GPT-5보다 쿨할것	ㅇㅇ(218.158)	05.14	87	1
472400	일반	그 오픈아이 거 봣는디 별거 업더만.걍 구글이 다시 짱.묵을기다.	ㅇㅇ(223.175)	05.14	48	0
472399	일반	형은 누누히 말한다 [1]	ㅇㅇ(115.88)	05.14	95	1
472398	일반	긴 분량이나 글이 길어지면 오류 나는 건 여전하네	ㅇㅇ	05.14	32	0
472397	일반	결국 gpt5 나와도 통역가는 대체 못하는 이유.jpg [10]	ㅇㅇ(59.14)	05.14	404	0
472396	일반	추론도 올라간거 같은데	ㅇㅇ(58.29)	05.14	36	0
472394	일반	이거 진짜 oai 직원맞음? 존나 실망스러운데 이러면 [1]	ㅇㅇ(121.162)	05.14	247	1
472392	일반	개발용으로 뭐가좋음? [4]	ㅇㅇ(118.176)	05.14	112	0
472391	일반	8배라는게 5X8=4o 였음? [2]	ㅇㅇ(122.45)	05.14	141	1
472390	일반	4o 실시간 비전 원리가 뭐임 [6]	Ad_Astra	05.14	183	0
472389	일반	아니 그냥 성능에 전혀 의심할 필요가 없다니까 ㅋㅋ [2]	ㅇㅇ(221.158)	05.14	205	0
472388	일반	돌고래가 여기 분탕충들보다 지능 높을 텐데	ㅇㅇ	05.14	38	0
472387	일반	통번역가는 아닌데 무역오파상이거든? 존나 후달린다 [8]	고양이망나니	05.14	170	0
472386	일반	오픈AI 연구원 오피셜 "이번 제품은 GPT5보다 괜찮을것" [3]	ㅇㅇ(112.223)	05.14	399	1
472385	일반	20년뒤면 동물과 인간은 동등한 권리를 가질꺼다 [4]	ㅇㅇ(58.29)	05.14	98	0
472384	일반	gpt5는 실시간 비전까지 가냐?	ㅇㅇ	05.14	42	0
472383	일반	4o가 쓴 소설 보고가라 ㄸㄷ [4]	ㅇㅇ(59.18)	05.14	285	0
472382	일반	다음버전에 사과문제 던졌는데 이 답변 나오면 [2]	ㅇㅇ(121.186)	05.14	78	0
472381	일반	실망하는 이유가 뭐임??(반박환영) [39]	부패하는유전자!	05.14	380	1
472380	일반	기존 키오스크는 싹 대체되겠네 [1]	ㅇㅇ(122.45)	05.14	103	0
472378	일반	번역쪽은 ai대체 그냥 체념하고 받아들이더라 [7]	lightvector	05.14	357	1
472379	일반	수학은 증명만 괜찮지 계산들어가면 좀..	ㅇㅇ(222.109)	05.14	73	0
472377	일반	팩트한접시) 아무도 내려치기 안했다 ㅋ	ㅇㅇ(121.184)	05.14	82	4
472376	일반	지금 딱 이거임 [1]	Bqbq	05.14	109	1
472374	일반	근데 분탕들도 점점 근거가 하나씩 줄어드는게 웃김 [3]	ㅇㅇ(211.200)	05.14	125	0
472373	일반	왜 내가 상상한 게 다 실현되는 거냐 안 빨래야 안 빨 수가 없어 [5]	ㅇㅇ	05.14	118	0
472372	일반	팩트) LLM은 출시이후 계속 성능 너프되는중 [1]	ㅇㅇ(125.141)	05.14	137	2
472371	일반	작문, 통번역쪽에선 AGI 달성했다고 선언해도 된다고 본다 [4]	ㅇㅇ(120.142)	05.14	263	1
472370	일반	4o도 존나 대단한거 맞아. 근데 더 대단한걸 원해... [1]	고양이망나니	05.14	137	0
472369	일반	Gpt-5 좆 박으면 볼 만하겠네 [1]	ㅇㅇ(222.116)	05.14	124	1
472367	일반	노동대체는 인공지능+로봇을 일자리에 쓴다는거지?	ㅇㅇ(182.219)	05.14	50	0
472366	일반	결국 남자 목소리는 전유물이네.. [4]	ㅇㅇ(210.205)	05.14	336	0
472365	일반	근데 open ai 마케팅 기가 맥히긴 하네 ㅋ	ㅇㅇ(103.237)	05.14	155	1
472364	일반	그래도 난 지금 상황이 많이 행복하다 [3]	lightvector	05.14	154	0
472363	일반	지금 4o 는 질문 제한 없음? [1]	ㅇㅇ(49.142)	05.14	94	0
472362	정보/ 정보/뉴스	오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다 [42]	rtOS	05.14	7109	53
472361	일반	GPT-5 나오면 사용량 조금 주고 웬만하면 4o 사용하게 유도할 듯	ㅇㅇ(120.142)	05.14	74	0
472359	일반	빠르든 느리든 알빠니까 걍 혁신을 보여달라고~~	ㅇㅇ(121.184)	05.14	42	0
472358	일반	근데 gpt-4o 보이스 임마는 컨텍스트 얼마나 큼? [2]	ㅇㅇ	05.14	76	0
472356	일반	애초에 발표할때부터 gpt4레벨의 무료모델을 강조했는데 [1]	ㅇㅇ(49.142)	05.14	146	0
472355	일반	챗gpt4o는 내가 지금까지 한말을 전부 평가하고 있었음 [1]	ㅇㅇ(59.18)	05.14	156	0
472354	일반	그래서 단단묵직 형냐 보이스는 어딨노? [2]	ㅇㅇ(163.152)	05.14	67	0
472353	일반	4o <<<<<< also	ㅇㅇ(210.106)	05.14	96	1
472352	일반	찐따/솔로들이 확실히 4O한테 데이터 많이 바칠듯 [14]	ㅇㅇ	05.14	292	1
472351	일반	애플 시리에 openai들어가면 무료임? [2]	ㅇㅇ(112.220)	05.14	263	0
472349	일반	병신들 ㅋ 니들 수준이 뭘알겠노 ㅋ [1]	ㅇㅇ(121.184)	05.14	111	1
472348	일반	gpt-4o한테 얼굴 비추고 평가해보라고 하지 마라 [4]	ㅇㅇ	05.14	228	0