디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 구글, '트랜스포머' 보완할 기술 잇달아 공개…”메모리·시간 축소”

ㅇㅇ(182.230) 2024.04.16 07:06:41
조회 510 추천 8 댓글 5
														

https://www.aitimes.com/news/articleView.html?idxno=158799

 



7ce88871bc8b07f739ef8fe447ee71698f6162c8dede71116d776737af8c81ed6f0f



구글이 입력 데이터가 커질수록 추론이 느려지고 메모리 공간이 많이 필요한 '트랜스포머' 아키텍처의 약점을 보완하기 위한 새로운 기술을 잇달아 공개했다. 어텐션 메커니즘 발표 7년 만에 이를 뛰어넘을 시도가 본격화되고 있다.


벤처비트는 12일(현지시간) 구글이 대형언어모델(LLM)의 컨텍스트 창의 길이를 무한 확장할 수 있는 ‘인피니-어텐션(Infini-attention)’ 기술에 관한 논문을 온라인 아카이브에 게재했다고 전했다.


'챗GPT'나 '제미나이' 등 LLM에 사용되는 트랜스포머 아키텍처는 컨텍스트 창이 커짐에 따라 필요한 메모리와 계산 시간이 기하급수적으로 증가하는 단점이 있다.


예를 들어, 입력 크기를 토큰 1000개에서 2000개로 확장하면 입력을 처리하는 데 필요한 메모리와 계산 시간이 두배가 아닌 네배로 늘어나게 된다. 이는 텍스트 내 토큰들의 상관관계를 밝혀내기 위해 입력 정보를 병렬로 처리하는 '어텐션 메커니즘' 때문이다.


이 문제를 해결하기 위해 구글은 메모리 및 컴퓨팅 요구 사항을 일정하게 유지하면서 LLM이 무한 길이의 텍스트를 처리할 수 있도록 인피니-어텐션 기술을 도입했다.


인피니-어텐션은 일반적인 어텐션 메커니즘에 ‘압축 메모리’를 통합, 입력이 컨텍스트 길이를 초과하면 모델은 계산 효율성을 위해 압축 메모리에 이전 어텐션 상태를 저장한다. 전체 컨텍스트 기록을 유지하기 위해 다음 컨텍스 길이를 처리할 때 이전 컨텍스트의 어텐션 상태를 버리지 않고 압축 메모리에 저장한다는 설명이다. 


구글에 따르면 인피니-어텐션을 적용한 LLM은 메모리 추가없이도 100만개 이상의 토큰 품질을 유지할 수 있다.


연구진은 "트랜스포머 아키텍처의 어텐션 메커니즘에 대한 미묘하지만 중요한 수정을 통해 기존 LLM을 무한히 긴 컨텍스트로 자연스럽게 확장할 수 있다"라고 설명했다.


또 인피니 어텐션이 매우 긴 컨텍스트에 대한 모델의 일관성을 측정하는 퍼플렉시티(Perplexity) 벤치마크에서 114배 더 적은 메모리를 사용하고도 다른 긴 컨텍스트 트랜스포머 기반 LLM을 능가하는 성능을 기록했다고 주장했다.


비밀번호 대신 사용하는 패스키 검색 테스트에서 인피니-어텐션은 최대 100만개의 토큰으로 구성된 긴 텍스트에 삽입된 난수를 정확하게 반환할 수 있었으며, 최대 50만개 토큰의 텍스트를 요약하는 테스트에서 다른 긴 컨텍스트 모델보다 성능이 뛰어났다.


무한한 컨텍스트 길이를 지원하는 LLM을 사용하면 이론적으로 모든 문서를 프롬프트에 삽입하고 모델이 각 쿼리에 대해 가장 관련성이 높은 답변을 선택하도록 할 수 있다. 또 특정 작업에 대한 성능을 향상하기 위해 모델을 세부적으로 조정할 필요 없이 긴 예제를 제공해 모델을 사용자 정의할 수도 있다.



7ce88871bc8b07f739ef8fe444ee71686eacf90e9048eb8afbbbbd91c010d03bf3



더불어 구글은 엣지 장치용 오픈 소스 소형언어모델(sLM) ‘리커런트젬마(RecurrentGemma)’에 관한 논문을 온라인 아카이브에 게재했다.


이 또한 트랜스포머 아키텍처의 어텐션 메커니즘을 보완한 LLM과 동등한 수준의 성능을 유지하면서 메모리 및 처리 요구 사항을 대폭 축소한다는 내용이다.


상기한 대로 트랜스포머는 입력 데이터를 모두 병렬로 처리하는 어텐션 메커니즘 때문에 데이터 볼륨이 증가함에 따라 메모리와 처리량이 크게 증가하는 약점이 있다. 


이 때문에 LLM은 스마트폰이나 사물인터넷(IoT), 개인용 컴퓨터와 같이 리소스가 제한된 장치에 배포하기 어렵다. 또 데이터센터 내의 원격 서버에서 실행되기 때문에 실시간 응답을 요구하는 AI 애플리케이션에 적합하지 않다.


반면 이번에 공개한 리커런트젬마는 트랜스포머 기반 모델처럼 모든 정보를 병렬로 처리하는 대신, 주어진 시간에 입력 데이터에 집중하여 처리하는 '로컬 어텐션 메커니즘'을 도입했다.


이로 인해 성능을 크게 저하시키지 않으면서 계산 부하를 줄이고 처리 속도를 높인다. 리소스가 제한된 엣지 장치에 배포하는 데 적합하고 원격 서버에서 실행할 필요가 없어 실시간 엣지 어플리케이션에 적합하다는 설명이다. 


리커런트젬마는 새로운 입력 데이터가 처리될 때 업데이트되는 '히든 스테이트(hidden state)'를 유지함으로써 이전 정보를 순차적으로 기억하는 순환 신경망(RNN)의 기본 구성 요소인 선형 반복(linear recurrence)을 어텐션과 결합, 입력 데이터에 관계없이 일정한 수준의 리소스 사용량을 유지함으로써 메모리 및 계산 요구 사항을 확인하면서 확장된 텍스트를  처리할 수 있다.


특히 리커런트젬마는 처리 범위를 줄임으로써 대용량 데이터를 지속적으로 재처리하기 위한 GPU 필요성을 최소화한다. 


하드웨어 요구 사항의 낮아짐에 따라 리커런트젬마와 같은 모델은 일반적으로 초대형 클라우드를 위해 설계된 서버보다 컴퓨팅 전력이 적은 엣지 컴퓨팅 응용 프로그램에 더 적합하다. 이는 클라우드 연결에 의존하지 않고 스마트폰, IoT 장치 또는 임베디드 시스템과 같은 엣지 장치에 직접 언어모델을 실행할 수 있게 한다.


자동등록방지

추천 비추천

8

고정닉 6

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
473172 일반 갤붕이는 폰 갈기전까진 제미니 써야한다고 아 ㅋㅋㅋ ㅇㅇ(121.128) 05.15 42 0
473170 일반 난 자러 갈랜다... [1] ramune갤로그로 이동합니다. 05.15 75 0
473168 일반 병신 1.5 프로 컨텍스트 어필 입갤 ㅋㅋㅋㅋㅋㅋ [2] ㅇㅇ갤로그로 이동합니다. 05.15 117 0
473167 일반 뭐 나온다 ㅇㅇ갤로그로 이동합니다. 05.15 34 0
473166 일반 진지하게 구글 발표 먼저보고 oai 발표봤으면 [2] 비닌갤로그로 이동합니다. 05.15 203 0
473165 일반 근데저새낀왜 코주부안경끼고잇음? ㅇㅇ갤로그로 이동합니다. 05.15 32 0
473164 일반 제미니 멀티모달 개씹뒤집어질것 ㅇㅇ갤로그로 이동합니다. 05.15 44 0
473163 일반 그래도신모델나오면 좋은거지 ㅇㅇ(14.53) 05.15 40 0
473162 일반 그래도 역경을 이기고 미국의 대기업에서 일하는 인도인들 나미부갤로그로 이동합니다. 05.15 47 1
473161 일반 우와! 마침 사진을 못 찾고 있었어요! ㅇㅇ(218.39) 05.15 51 0
473159 일반 루시 수영 존나 잘하는 거 같으면 개추 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 25 0
473157 일반 구글도 잘해서 ai발전 더 잘되면 좋은거아님? 왜이렇게 망하길 바라지 [7] ㅇㅇ(59.17) 05.15 157 1
473156 일반 순다르 oai보고 ㅈ된거 느꼈는데 취소할 수 없어서 나간거?ㅋㅋ ramune갤로그로 이동합니다. 05.15 69 0
473155 일반 제미니로 구글 포토 검색 가능 입갤 ㅇㅇ갤로그로 이동합니다. 05.15 62 0
473154 일반 오늘 구글 발표 요약.txt [1] 나미부갤로그로 이동합니다. 05.15 173 0
473153 일반 구글포토에 야짤 존나 저장해놨는데 [1] Moriae갤로그로 이동합니다. 05.15 123 0
473152 일반 씨발 oai 발표보고 실망이라 해서 미안하다.... 비닌갤로그로 이동합니다. 05.15 126 0
473151 일반 졸류ㅜㅜ ㅇㅇ갤로그로 이동합니다. 05.15 25 0
473149 일반 벌써부터 ㅈ망각이면 개추ㅋㅋ ff(223.38) 05.15 78 5
473148 일반 부 처님 오실거같으면 개추 ㅋㅋㅋㅋㅋㅋㅋㅋ 나미부갤로그로 이동합니다. 05.15 32 0
473147 일반 우리 제미니 연동 존나 잘했다도르 입갤 ㅇㅇ갤로그로 이동합니다. 05.15 32 0
473146 일반 구글 주가는 왜올라가는거냐 ? [4] 캬르룩갤로그로 이동합니다. 05.15 144 0
473145 일반 응 제미니 많이써 난 gpt 쌀게용 나미부갤로그로 이동합니다. 05.15 28 0
473143 일반 개발자 통계도 걍 허수임 ㅋㅋ ㅇㅇ(14.5) 05.15 53 0
473142 일반 제미니 벤치마크 개쩐다 어필 ㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 108 1
473141 일반 제미니 나온다!!!!!! ㅇㅇ갤로그로 이동합니다. 05.15 36 0
473140 일반 Millions more are joining virtually?? ㅇㅇ(61.73) 05.15 38 0
473139 일반 제미니 시대 입갤 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 55 0
473138 일반 좀 더 드라마틱하게 말해줘! ㅇㅇ(218.39) 05.15 27 0
473137 일반 원래 각본은 ㅇㅇ(14.5) 05.15 39 0
473135 일반 참고) 구글 발표 출시 루머 [1] ㅇㅇ(59.17) 05.15 183 2
473134 일반 카레향우회 입갤 ㅇㅇ(218.232) 05.15 15 0
473133 일반 1.5 울트라 아니면 피차이 탄핵좀 ㅇㅋ갤로그로 이동합니다. 05.15 27 0
473132 일반 쟤 왜 목소리에서 로봇음이 나냐? [2] 비닌갤로그로 이동합니다. 05.15 106 0
473131 일반 Gpt4o 오늘 새벽에 열렸던 구글쇼 요약해줘 나미부갤로그로 이동합니다. 05.15 61 0
473130 일반 인도지능 입갤 ㅋㅋㅋㅋㅋ TS망상갤로그로 이동합니다. 05.15 31 0
473129 일반 인도햄 ㅎㅇㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 23 0
473128 일반 1.5 울트라 정도 공개하려나 TS망상갤로그로 이동합니다. 05.15 31 0
473127 일반 와지린다 ㅋㅋㅋㅋ ㅇㅇ(14.53) 05.15 59 0
473126 일반 아무래도 소개부터 불안한 구글이면 개추 ㅇㅇ갤로그로 이동합니다. 05.15 30 0
473125 일반 잼민이 딸딸이 등판 ㅋㅋ ㅇㅇ(119.77) 05.15 24 0
473124 일반 뭔 영화를 찍고있냐 이세이미야케갤로그로 이동합니다. 05.15 36 0
473122 일반 개씹뒤집어지는 캘린더 입갤 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 38 0
473121 일반 구글도 두개재 하나 보여다오 ㅇㅇ(59.17) 05.15 21 0
473120 일반 OAI : 행사 시작 > 소개 > 시연 > 행사 종료 ㅇㅇ(218.39) 05.15 81 0
473119 일반 oai 카운트다운이 진짜 긴장감 개지렸는데 비닌갤로그로 이동합니다. 05.15 98 0
473118 일반 카운트다운 입갤ㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 18 0
473117 일반 큰거 입갤 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 16 0
473116 일반 큰 거 오냐? ㅇㅇ갤로그로 이동합니다. 05.15 19 0
473115 일반 구글빠들 억빠 지리는데 ramune갤로그로 이동합니다. 05.15 42 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2