구글, '트랜스포머' 보완할 기술 잇달아 공개…”메모리·시간 축소”

ㅇㅇ · 2024.04.16 07:06:41

https://www.aitimes.com/news/articleView.html?idxno=158799

구글, '트랜스포머' 보완할 기술 잇달아 공개…”메모리·시간 축소”

구글이 입력 데이터가 커질수록 추론이 느려지고 메모리 공간이 많이 필요한 '트랜스포머' 아키텍처의 약점을 보완하기 위한 새로운 기술을 잇달아 공개했다. 어텐션 메커니즘 발표 7년 만에 이를 뛰어넘을 시도가 본격화되고 있다.벤처비트는 12일(현지시간) 구글이 대형언어모델(LLM)의 컨텍스트 창의 길이를 무한 확장할 수 있는 ‘인피니-어텐션(Infini-attention)’ 기술에 관한 논문을 온라인 아카이브에 게재했다고 전했다.'챗GPT'나 '제미나이' 등 LLM에 사용되는 트랜스포머 아키텍처는 컨텍스트 창이 커짐에 따라 필요한 메모

www.aitimes.com

7ce88871bc8b07f739ef8fe447ee71698f6162c8dede71116d776737af8c81ed6f0f

구글이 입력 데이터가 커질수록 추론이 느려지고 메모리 공간이 많이 필요한 '트랜스포머' 아키텍처의 약점을 보완하기 위한 새로운 기술을 잇달아 공개했다. 어텐션 메커니즘 발표 7년 만에 이를 뛰어넘을 시도가 본격화되고 있다.

벤처비트는 12일(현지시간) 구글이 대형언어모델(LLM)의 컨텍스트 창의 길이를 무한 확장할 수 있는 ‘인피니-어텐션(Infini-attention)’ 기술에 관한 논문을 온라인 아카이브에 게재했다고 전했다.

'챗GPT'나 '제미나이' 등 LLM에 사용되는 트랜스포머 아키텍처는 컨텍스트 창이 커짐에 따라 필요한 메모리와 계산 시간이 기하급수적으로 증가하는 단점이 있다.

예를 들어, 입력 크기를 토큰 1000개에서 2000개로 확장하면 입력을 처리하는 데 필요한 메모리와 계산 시간이 두배가 아닌 네배로 늘어나게 된다. 이는 텍스트 내 토큰들의 상관관계를 밝혀내기 위해 입력 정보를 병렬로 처리하는 '어텐션 메커니즘' 때문이다.

이 문제를 해결하기 위해 구글은 메모리 및 컴퓨팅 요구 사항을 일정하게 유지하면서 LLM이 무한 길이의 텍스트를 처리할 수 있도록 인피니-어텐션 기술을 도입했다.

인피니-어텐션은 일반적인 어텐션 메커니즘에 ‘압축 메모리’를 통합, 입력이 컨텍스트 길이를 초과하면 모델은 계산 효율성을 위해 압축 메모리에 이전 어텐션 상태를 저장한다. 전체 컨텍스트 기록을 유지하기 위해 다음 컨텍스 길이를 처리할 때 이전 컨텍스트의 어텐션 상태를 버리지 않고 압축 메모리에 저장한다는 설명이다.

구글에 따르면 인피니-어텐션을 적용한 LLM은 메모리 추가없이도 100만개 이상의 토큰 품질을 유지할 수 있다.

연구진은 "트랜스포머 아키텍처의 어텐션 메커니즘에 대한 미묘하지만 중요한 수정을 통해 기존 LLM을 무한히 긴 컨텍스트로 자연스럽게 확장할 수 있다"라고 설명했다.

또 인피니 어텐션이 매우 긴 컨텍스트에 대한 모델의 일관성을 측정하는 퍼플렉시티(Perplexity) 벤치마크에서 114배 더 적은 메모리를 사용하고도 다른 긴 컨텍스트 트랜스포머 기반 LLM을 능가하는 성능을 기록했다고 주장했다.

비밀번호 대신 사용하는 패스키 검색 테스트에서 인피니-어텐션은 최대 100만개의 토큰으로 구성된 긴 텍스트에 삽입된 난수를 정확하게 반환할 수 있었으며, 최대 50만개 토큰의 텍스트를 요약하는 테스트에서 다른 긴 컨텍스트 모델보다 성능이 뛰어났다.

무한한 컨텍스트 길이를 지원하는 LLM을 사용하면 이론적으로 모든 문서를 프롬프트에 삽입하고 모델이 각 쿼리에 대해 가장 관련성이 높은 답변을 선택하도록 할 수 있다. 또 특정 작업에 대한 성능을 향상하기 위해 모델을 세부적으로 조정할 필요 없이 긴 예제를 제공해 모델을 사용자 정의할 수도 있다.

7ce88871bc8b07f739ef8fe444ee71686eacf90e9048eb8afbbbbd91c010d03bf3

더불어 구글은 엣지 장치용 오픈 소스 소형언어모델(sLM) ‘리커런트젬마(RecurrentGemma)’에 관한 논문을 온라인 아카이브에 게재했다.

이 또한 트랜스포머 아키텍처의 어텐션 메커니즘을 보완한 LLM과 동등한 수준의 성능을 유지하면서 메모리 및 처리 요구 사항을 대폭 축소한다는 내용이다.

상기한 대로 트랜스포머는 입력 데이터를 모두 병렬로 처리하는 어텐션 메커니즘 때문에 데이터 볼륨이 증가함에 따라 메모리와 처리량이 크게 증가하는 약점이 있다.

이 때문에 LLM은 스마트폰이나 사물인터넷(IoT), 개인용 컴퓨터와 같이 리소스가 제한된 장치에 배포하기 어렵다. 또 데이터센터 내의 원격 서버에서 실행되기 때문에 실시간 응답을 요구하는 AI 애플리케이션에 적합하지 않다.

반면 이번에 공개한 리커런트젬마는 트랜스포머 기반 모델처럼 모든 정보를 병렬로 처리하는 대신, 주어진 시간에 입력 데이터에 집중하여 처리하는 '로컬 어텐션 메커니즘'을 도입했다.

이로 인해 성능을 크게 저하시키지 않으면서 계산 부하를 줄이고 처리 속도를 높인다. 리소스가 제한된 엣지 장치에 배포하는 데 적합하고 원격 서버에서 실행할 필요가 없어 실시간 엣지 어플리케이션에 적합하다는 설명이다.

리커런트젬마는 새로운 입력 데이터가 처리될 때 업데이트되는 '히든 스테이트(hidden state)'를 유지함으로써 이전 정보를 순차적으로 기억하는 순환 신경망(RNN)의 기본 구성 요소인 선형 반복(linear recurrence)을 어텐션과 결합, 입력 데이터에 관계없이 일정한 수준의 리소스 사용량을 유지함으로써 메모리 및 계산 요구 사항을 확인하면서 확장된 텍스트를 처리할 수 있다.

특히 리커런트젬마는 처리 범위를 줄임으로써 대용량 데이터를 지속적으로 재처리하기 위한 GPU 필요성을 최소화한다.

하드웨어 요구 사항의 낮아짐에 따라 리커런트젬마와 같은 모델은 일반적으로 초대형 클라우드를 위해 설계된 서버보다 컴퓨팅 전력이 적은 엣지 컴퓨팅 응용 프로그램에 더 적합하다. 이는 클라우드 연결에 의존하지 않고 스마트폰, IoT 장치 또는 임베디드 시스템과 같은 엣지 장치에 직접 언어모델을 실행할 수 있게 한다.

번호	말머리	제목	글쓴이	작성일	조회	추천
2861	설문	어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는?	운영자	24/05/20	-	-
473172	일반	갤붕이는 폰 갈기전까진 제미니 써야한다고 아 ㅋㅋㅋ	ㅇㅇ(121.128)	05.15	42	0
473170	일반	난 자러 갈랜다... [1]	ramune	05.15	75	0
473168	일반	병신 1.5 프로 컨텍스트 어필 입갤 ㅋㅋㅋㅋㅋㅋ [2]	ㅇㅇ	05.15	117	0
473167	일반	뭐 나온다	ㅇㅇ	05.15	34	0
473166	일반	진지하게 구글 발표 먼저보고 oai 발표봤으면 [2]	비닌	05.15	203	0
473165	일반	근데저새낀왜 코주부안경끼고잇음?	ㅇㅇ	05.15	32	0
473164	일반	제미니 멀티모달 개씹뒤집어질것	ㅇㅇ	05.15	44	0
473163	일반	그래도신모델나오면 좋은거지	ㅇㅇ(14.53)	05.15	40	0
473162	일반	그래도 역경을 이기고 미국의 대기업에서 일하는 인도인들	나미부	05.15	47	1
473161	일반	우와! 마침 사진을 못 찾고 있었어요!	ㅇㅇ(218.39)	05.15	51	0
473159	일반	루시 수영 존나 잘하는 거 같으면 개추 ㅋㅋㅋㅋㅋ	ㅇㅇ	05.15	25	0
473157	일반	구글도 잘해서 ai발전 더 잘되면 좋은거아님? 왜이렇게 망하길 바라지 [7]	ㅇㅇ(59.17)	05.15	157	1
473156	일반	순다르 oai보고 ㅈ된거 느꼈는데 취소할 수 없어서 나간거?ㅋㅋ	ramune	05.15	69	0
473155	일반	제미니로 구글 포토 검색 가능 입갤	ㅇㅇ	05.15	62	0
473154	일반	오늘 구글 발표 요약.txt [1]	나미부	05.15	173	0
473153	일반	구글포토에 야짤 존나 저장해놨는데 [1]	Moriae	05.15	123	0
473152	일반	씨발 oai 발표보고 실망이라 해서 미안하다....	비닌	05.15	126	0
473151	일반	졸류ㅜㅜ	ㅇㅇ	05.15	25	0
473149	일반	벌써부터 ㅈ망각이면 개추ㅋㅋ	ff(223.38)	05.15	78	5
473148	일반	부 처님 오실거같으면 개추 ㅋㅋㅋㅋㅋㅋㅋㅋ	나미부	05.15	32	0
473147	일반	우리 제미니 연동 존나 잘했다도르 입갤	ㅇㅇ	05.15	32	0
473146	일반	구글 주가는 왜올라가는거냐 ? [4]	캬르룩	05.15	144	0
473145	일반	응 제미니 많이써 난 gpt 쌀게용	나미부	05.15	28	0
473143	일반	개발자 통계도 걍 허수임 ㅋㅋ	ㅇㅇ(14.5)	05.15	53	0
473142	일반	제미니 벤치마크 개쩐다 어필 ㅋㅋㅋㅋㅋㅋ	ㅇㅇ	05.15	108	1
473141	일반	제미니 나온다!!!!!!	ㅇㅇ	05.15	36	0
473140	일반	Millions more are joining virtually??	ㅇㅇ(61.73)	05.15	38	0
473139	일반	제미니 시대 입갤 ㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ	05.15	55	0
473138	일반	좀 더 드라마틱하게 말해줘!	ㅇㅇ(218.39)	05.15	27	0
473137	일반	원래 각본은	ㅇㅇ(14.5)	05.15	39	0
473135	일반	참고) 구글 발표 출시 루머 [1]	ㅇㅇ(59.17)	05.15	183	2
473134	일반	카레향우회 입갤	ㅇㅇ(218.232)	05.15	15	0
473133	일반	1.5 울트라 아니면 피차이 탄핵좀	ㅇㅋ	05.15	27	0
473132	일반	쟤 왜 목소리에서 로봇음이 나냐? [2]	비닌	05.15	106	0
473131	일반	Gpt4o 오늘 새벽에 열렸던 구글쇼 요약해줘	나미부	05.15	61	0
473130	일반	인도지능 입갤 ㅋㅋㅋㅋㅋ	TS망상	05.15	31	0
473129	일반	인도햄 ㅎㅇㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ	05.15	23	0
473128	일반	1.5 울트라 정도 공개하려나	TS망상	05.15	31	0
473127	일반	와지린다 ㅋㅋㅋㅋ	ㅇㅇ(14.53)	05.15	59	0
473126	일반	아무래도 소개부터 불안한 구글이면 개추	ㅇㅇ	05.15	30	0
473125	일반	잼민이 딸딸이 등판 ㅋㅋ	ㅇㅇ(119.77)	05.15	24	0
473124	일반	뭔 영화를 찍고있냐	이세이미야케	05.15	36	0
473122	일반	개씹뒤집어지는 캘린더 입갤 ㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ	05.15	38	0
473121	일반	구글도 두개재 하나 보여다오	ㅇㅇ(59.17)	05.15	21	0
473120	일반	OAI : 행사 시작 > 소개 > 시연 > 행사 종료	ㅇㅇ(218.39)	05.15	81	0
473119	일반	oai 카운트다운이 진짜 긴장감 개지렸는데	비닌	05.15	98	0
473118	일반	카운트다운 입갤ㅋㅋㅋㅋ	ㅇㅇ	05.15	18	0
473117	일반	큰거 입갤 ㅋㅋㅋㅋㅋ	ㅇㅇ	05.15	16	0
473116	일반	큰 거 오냐?	ㅇㅇ	05.15	19	0
473115	일반	구글빠들 억빠 지리는데	ramune	05.15	42	0

최근 방문

즐겨찾기

즐겨찾기 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

마이너 갤러리 소개

차단하기

[특이점이 온다 갤러리]

갤러리 본문 영역

게시물을 간편하게 NFT로 만들어 보세요!

NFT 발행 방법

NFT 발행

비회원 글삭제,수정

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘

지갑 연결