디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 구글 딥마인드, 이미지 생성 AI 벤치마크 '젝코' 공개

ㅇㅇ(182.230) 2024.04.30 19:01:03
조회 167 추천 2 댓글 1
														

https://www.aitimes.com/news/articleView.html?idxno=159241

 



7ce88974b18307f739ee82ed4fee756adfcc9064d4ae6b84e22ff3843e30605cb5ff



구글 딥마인드가 이미지 생성 인공지능(AI) 모델의 성능을 평가하기 위한 벤치마크를 공개했다. 프롬프트에 맞는 정확한 이미지 생성이 중요한 텍스트-이미지 생성 AI 모델에 대한 평가 도구로 자리매김할 것이라는 전망이다.


벤처비트는 29일(현지시간) 구글 딥마인드 연구진이 텍스트-이미지 AI 모델의 성능을 평가하는 벤치마크 ‘젝코(Gecko)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.


연구진은 "지금은 텍스트에서 이미지로 생성하는 모델이 널리 사용되고 있지만, 이 모델들이 반드시 주어진 프롬프트와 일치하는 이미지를 생성하지는 않는다"라고 지적했다. 이어 “현재 달리나 미드저니, 스테이블 디퓨전과 같은 모델의 능력을 평가하기 위해 주로 사용되는 데이터셋이나 자동 측정법도 제한적이고 중요한 점을 놓칠 수 있으며 인간 평가와도 다를 수 있다”라고 주장했다.


이를 해결하기 위해 개발한 젝코는 텍스트-이미지 생성 모델에 대한 벤치마크 기준을 높인다. 다양한 기술과 복잡성을 테스트하는 2000개의 텍스트 프롬프트를 제공한다. 이런 프롬프트를 특정 하위 기술로 분류, 모델의 이미지 생성 퀄리티를 떨어 뜨리는 정확한 약점을 찾아낸다.



7ce88974b18307f739ee82ec46ee7564a2b493dc5132652790d9e55e0f33a2ac59e5



연구진은 "이 기술 중심의 벤치마크는 프롬프트를 하위 기술로 분류해 사용자가 어떤 기술이 어려운지뿐만 아니라, 어떤 수준의 복잡성에서 기술이 어려워지는지를 정확히 파악할 수 있도록 한다"라고 설명했다.


젝코 프레임워크는 텍스트에서 이미지로 변환하는 AI 모델의 평가에서의 단점을 해결하기 위해 🔼포괄적인 기술 중심의 벤치마크 데이터셋 🔼다양한 템플릿에 걸친 폭넓은 인간 주석 🔼개선된 자동 평가 메트릭 🔼다양한 기준에서 모델 성능에 대한 통찰력을 제공한다. 



7ce88974b18307f739ee82ec47ee7564a016b3f5740829cf9862e06986d978c5e7



또 요즘 유행하는 인간 선호도 평가도 추가했다.


젝코 프롬프트에 대한 여러 주요 모델들이 생성한 이미지에 대해 10만건 이상의 인간 평가를 수집했다. 이를 통해 이 벤치마크는 모델의 한계, 모호한 프롬프트, 일관되지 않은 평가 방법으로 인해 성능 차이가 나타는지를 구분해 낼 수 있다는 설명이다.


마지막으로 젝코는 질문 응답을 기반으로 한 자동 평가 측정을 특징으로 하고 있으며, 이 측정법은 기존보다 인간의 판단과 더 일치한다는 설명이다. 최신 모델을 비교할 경우, 이전에 감지되지 않았던 각 모델의 장점과 약점을 파악할 수 있었다고 밝혔다.



7ce88974b18307f739ee82ec44ee766d206b6f29456a51f5115de568bdce8d1dea



젝코 벤치마크 테스트를 수행한 결과, 딥마인드의 '뮤즈(Muse)' 모델이 구글의 '이마젠(Imagen)', 스태빌리티 AI의 '스테이블 디퓨전 XL' 및 '스테이블 디퓨전 1.5' 보다 전반적으로 높은 점수를 기록한 것으로 나타났다.


딥마인드는 젝코 코드와 데이터를 무료로 사용할 수 있도록 할 방침이다.


자동등록방지

추천 비추천

2

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
474997 일반 OpenAI 누가봐도 엔씨 소프트 꼬라지 나고있구만 씨발 ㅋㅋㅋ ㅇㅇ(125.133) 05.15 142 0
474996 일반 자각몽 안정화만 되도 세미완몰가일 텐데 [4] ㅇㅇ(110.46) 05.15 171 0
474995 일반 알트만은 사업가지 개발자가 아님 그냥 일론머스크 같은건데 ㅇㅇ(49.170) 05.15 71 0
474994 일반 확실한건 일리야는 AGI를 봤고, 알트만은 어림도 없다고 생각한거임. ㅇㅇ(125.136) 05.15 165 2
474992 일반 결국 늘 하던대로 5나 기다리는 수밖에 없네 ㅇㅇ갤로그로 이동합니다. 05.15 39 0
474991 일반 자기 맘에 안들게 발언 해석하면 다 저지능 선형충이노 ㅋㅋㅋ ㅇㅇ(221.155) 05.15 69 0
474990 일반 Gpt4o나왔으면 [3] ㅇㄴ(211.222) 05.15 104 0
474988 일반 불확실성에 대한 불안이 강한 갤러리네 [2] ㅇㅇ(220.119) 05.15 91 1
474985 일반 gpt4o 등장 호재임 악재임? [25] ㅇㅇ갤로그로 이동합니다. 05.15 260 0
474984 일반 이새기들 미루는게 일상이라 음성 업뎃 2달은 봐야됨 도서관킬러갤로그로 이동합니다. 05.15 34 0
474983 일반 지금 착각하는게 선형충 vs 특슬람 구도가 아님 ㅋㅋㅋ [6] ㅇㅇ(222.120) 05.15 209 1
474982 일반 인공지능이 발달할수록 지역 커뮤니티가 더 중요해질듯 [5] ㅇㅇ(211.184) 05.15 103 0
474981 일반 나 디시중독인데 ai가 디시를 구현하려면 얼마나 걸림? [2] ㅇㅇ(110.46) 05.15 96 1
474980 일반 100명만있어도 한달에 한명은 퇴사하겠다 [1] ㅇㅇ(39.124) 05.15 121 0
474979 일반 특갤 왜이리 죽을상이냐? 뭔일있음? [2] 123123갤로그로 이동합니다. 05.15 159 0
474978 일반 근데 선형발전 vs 가속발전 워딩 자체가 이상하다고 생각드는게 ㅇㅇ갤로그로 이동합니다. 05.15 43 1
474976 일반 빨리 음성 업뎃해라 트만아 도서관킬러갤로그로 이동합니다. 05.15 35 0
474974 일반 이거 웃기네 빙냥이ㄱㅇㅇ갤로그로 이동합니다. 05.15 66 0
474973 일반 솔직히 현장직도 개빡세질거같은데 ㅇㅇ(121.142) 05.15 104 1
474972 일반 나 어제 분명 챗GPT 앱으로 말로 대화했는데 [3] ㅇㅇ(222.101) 05.15 186 0
474971 일반 미래꽃이나 그만가져와 ㅇㅇ(122.34) 05.15 63 0
474970 일반 솔직히 일론머스크 낭만 쩔음 [1] ㅇㅇ(110.46) 05.15 111 0
474969 일반 OAI 핵심개발자 한명 더 나갔노 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [13] ㅇㅇ(118.37) 05.15 584 0
474968 일반 이거 소리내서 읽기 목소리 여자로 어케바꿈? [1] ㅇㅇ(211.235) 05.15 104 0
474966 일반 ai가 아무리 발전해도 커뮤 못끊는 이유 ㅇㅇ(61.84) 05.15 70 0
474963 일반 클로드 Api 받아서 가지고 놀자니 개귀찮다 ㅇㅇ(121.144) 05.15 69 0
474962 일반 알트만 이새끼 자기모순이 넘 심한데 ㅇㅇ갤로그로 이동합니다. 05.15 81 0
474961 일반 순다르 피차이 언제 짤리노 [1] 떠깅갤로그로 이동합니다. 05.15 54 0
474960 일반 챗GPT에 야짤 올리고 분석해달라고한애있음? [7] ㅇㅇ갤로그로 이동합니다. 05.15 529 0
474958 일반 같이 친구가 될 기회가 있다면 누구 고를 거임 [5] ㅇㅇ(110.46) 05.15 129 1
474957 일반 외국 트위터리안의 google io 2024 소감 [4] 빙냥이ㄱㅇㅇ갤로그로 이동합니다. 05.15 318 0
474956 일반 솔직히 인공지능이 편한데 커뮤를 왜 하고 있지 나는 [3] ㅇㅇ(110.46) 05.15 165 0
474955 일반 너네 솔직히 알트만 현실에서 만나면 오줌지리잖아 ㅇㅈ? [5] ㅇㅇ(211.179) 05.15 170 0
474954 일반 알트먼 스탠스는 항상 똑같음 ㅇㅇ(218.148) 05.15 107 2
474953 일반 근데 일단 로봇노동자 공장투입은 근미래에 가능할 듯 ㅇㅇ갤로그로 이동합니다. 05.15 68 0
474952 일반 내 예상으론 애플이 독점할 oai의 ai는 [1] ㅇㅇ(218.150) 05.15 147 0
474951 일반 Ai 로 생계가 끊겨 자살한작가 [5] ㅇㅇ(112.186) 05.15 281 0
474949 일반 아가리 집어 뜯어야겠지...? [2] ㅇㅇ(222.120) 05.15 120 0
474948 일반 100페이지 넘는 정부 연구과제 보고서는 오푸스가 gpt-4o 보다 우위 [9] ㅇㅇ(180.68) 05.15 218 1
474945 일반 이번 발표 호재다 악재다 [1] ㅇㅇ(14.53) 05.15 130 0
474944 일반 샘알트만 좃같은점 jpg [1] ㅇㅇ(211.179) 05.15 193 2
474943 일반 미국 응디를 믿어라 ㅇㅇ(110.46) 05.15 38 0
474942 일반 특이점이, 온다. ㅇㅇ(1.239) 05.15 33 0
474941 일반 근데 알트만 바람이랑은 다르게 ai쪽은 [2] ㅇㅇ(211.184) 05.15 147 0
474940 일반 자연지능들 환각현상 ㅈㄴ 심한거봐라 [5] ㅇㅇ(14.53) 05.15 202 1
474939 일반 알트먼이 1명이 1천개 직업 담당한다는데 [2] ㅇㅇ(121.142) 05.15 142 0
474937 일반 삼성 온 디바이스 ai 선택은 아주 절묘했다고 생각됨. [3] 걸갤러(125.187) 05.15 313 0
474936 일반 4o정도면 agi라고 불러도되는이유 [1] ㅇㅇ(14.53) 05.15 145 0
474935 일반 텍스트 완몰가 =zeta [1] ㅇㅇ(110.46) 05.15 94 0
474934 일반 오픈ai는 왜 윈도우 앱이 아닌 맥 앱을 선보였을까? [3] ㅇㅇ(112.161) 05.15 111 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2