디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 님들 파이먼 경로적분 트랜스포머 에 왜 관심이 없음?

ㅇㅇ(125.134) 2024.05.13 18:28:07
조회 265 추천 2 댓글 22
														
http://www.itdaily.kr/news/articleView.html?idxno=223062' target="_blank">http://www.itdaily.kr/news/articleView.html?idxno=223062



[아이티데일리] 인공지능(AI) 핵심 알고리즘 전문 연구기업 하인텔(대표 권대석)이 출판 전 학술 논문의 국제적 사전 공개 사이트를 통해 인공지능(AI)의 GPU 및 메모리 사용량을 줄이고, 결과적으로 과도한 학습 시간과 전력 사용량을 1/100가량 줄일 수 있는 방법을 ‘파인먼 경로적분을 이용해, 무한히 긴 문맥을 접어서 응축하는 트랜스포머(Folded Context Condensation in Path Integral Framework for infinite context transformers)’라는 제목으로 공개했다.


양자 역학 및 입자 물리학적 접근

최근 시중에 공개된 대부분의 생성형 AI는 2017년 구글이 최초로 발표한 ‘주의기반 트랜스포머’ 기술을 토대로 동작한다. 이 기술은 사용자와 챗봇이 과거에 주고받은 대화나 작업을 기억하는데 한계가 있고, 이 한계를 늘리면 메모리와 계산 시간이 그 제곱에 비례해서 늘어난다. 즉 3배 더 긴 과거 연산을 기억하기 위해 9배 더 큰 슈퍼컴퓨터와 더 긴 학습시간이 요구된다. (더 늘리기 힘든이유)

아울러 주의기반 트랜스포머는 입력된 단어로부터, 수백억 개의 매개 변수들로 구성된 계산 단계를 수십 층 쌓아 계산해 다음에 발생할 사건을 예측하는 방식으로 동작한다. 입력된 사건들이 어떻게 변화되어 결과가 만들어지는지 그 정확한 동작을 이해·설명하거나 예측하기가 매우 어렵다.

결과적으로 일정 수준 이상의 챗봇이나 생성형 AI를 만들기 위해서는 수천억 원에 달하는 고가의 슈퍼컴퓨터와 엄청난 학습시간, 전력 소모를 감당해야 한다. 막대한 비용을 감수하고 사용자와 주고받은 대화나 과거 연산에 대한 한도를 확대하더라도, 그 한도를 넘는 일정 시간 이후에는 그 이전의 내용을 잊는 문제는 불가피했다.

이 같은 문제를 해결하고자 하인텔은 전통적인 컴퓨터과학 관점에서 벗어나, 주의기반 트랜스포머를 양자 역학적, 입자 물리학적으로 재해석했다. 현대의 입자물리학과 양자 역학에서는 전자와 같은 아주 작은 입자들의 정확한 위치와 운동을 파악할 수 없기에 특정 시점의 상태에서 다음 시점의 상태로 변화할 확률을 계산하는 데 집중했고 ‘파인먼 경로적분’이라는 방법을 사용했다.

하인텔은 수십 개의 계층으로 복잡하게 쌓인 트랜스포머의 동작이, 양자 역학에서의 미세 입자가 특정 시점의 상태에서 다음 시점의 다른 상태로 넘어갈 때 예측을 위해 사용되는 파인먼 경로적분의 미세 단계와 거의 같다는 것을 관찰했다. 복잡한 트랜스포머의 동작을 단순한 물리학적 계산법으로 환원시킨 것이다.

이를 통해 과거에 있었던 다수의 긴 사건 정보를, 소수의 상태 벡터로 압축할 수 있고, 결과적으로 많은 메모리를 사용하지 않고도 과거 기록과 문맥 정보 손실을 최소화할 수 있었다. 실제로 이 기법을 사용한 결과, 가장 최근의 단어 12개씩만을 입력받아 처리하는 작은 트랜스포머조차도, 150개 이상 과거의 사건 내용을 잊지 않는다는 성과를 확인할 수 있었다. 하인텔에서는 이 방법을 ‘접혀진 문맥 응축(folded context condensation)’으로 명명해 발표했다. 본래 GPT에서는 12개로 입력 한계를 설정할 경우, 12개 이전의 단어를 기억하지 못해, 엉뚱한 문장을 생성한다.

하인텔 권대석 대표는 “고전 물리학계에서는 아인슈타인의 상대성 이론이 등장한 이후, 연구 대상에 대한 접근이나 연구 방법이 크게 바뀌었다. 이번 연구가 거기에는 못 미쳐도, 난해한 트랜스포머의 동작에 대해 새로운 이해 방법을 제시한 만큼, 구글, 오픈AI등 세계적 AI 기업들과 비교해도 매우 앞선 성과일 가능성이 있다”며 “구글이 지난 4월 7일, 인피니-어텐션(infini-attention)이라는 이름으로 동일한 목적의 거의 유사한 방법을 아카이브(arxiv)에 논문으로 제시했으나, 하인텔 역시 2024년 3월에 이미 국내 특허를 출원한 상태이며, 기술의 간결성이나 응용 분야의 확장성에서 상당한 경쟁력과 연구 성과를 축적한 상태”라고 밝혔다.


학계 평가는 긍정적

이번 하인텔의 발표에 대해 학계에서도 긍정적으로 평가하고 있다. 충북대학교 김동현 물리학과 교수는 “실험 결과만 좀 더 대규모로 입증하면 네이처급 논문”이라 평가했다.

서울대학교 인공지능 대학원의 엄현상 교수는 “현재 천억 원 단위의 투자가 필요한 챗봇 등 생성형 AI 개발 비용과 운영 비용을 1/100 이하로 줄일 가능성을 제시한 논문”이라며 “GPT와 같은 원천 핵심 연구가 드문 우리나라 현재 상황에서, 트랜스포머 자체를 개량하려는 노력도 큰 의미가 있고, 입자 물리학, 양자역학의 방법론으로 GPT의 최대 문제들인 자원 소모량과 학습 시간을 단축하는 방법을 제시해 구글과 비교할 만한 성과를 얻었다는 것도 인상적이다”라고 평가했다.

이어 엄 교수는 “조금 더 시간과 비용을 투자한 대규모 검증이 필요하겠지만, 물리학 분야에서 전자의 입자성과 파동성을 설명했던 코펜하겐 해석 정도의 영향을 인공지능 분야에 줄지도 모르는, 주목해야 할 논문”이라며 “국내의 원천 연구 외면 풍토와 환경에서 이런 성과를 낸 것은 높이 평가할 일로, 이런 성과들을 잘 발전시켜야 국내 AI 산업과 학계가 세계 수준으로 비약할 수도 있을 것이다. 구글이나 MS 같은 세계적 대기업들이 수조 원 단위의 투자를 하고 슈퍼컴퓨터와 수천명의 연구자를 동원해 핵심기술을 선점하려 애쓰는데, 국내에는 이런 원천 핵심 기술에 대한 투자, 연구가 많지 않다. 이 논문에 의하면 저자들도 역시, 천만 원도 안 하는 GPU 장비 한대로 연구한 것 같다. 결과적으로 이런 획기적 방법을 만들어도 입증하는 데에는 수천억 원, 수백 명의 전문인력이 필요하다 보니, 우리가 훨씬 먼저 뭘 만들건 구글이나 챗GPT에 밀릴 수 밖에 없는 상황”이라고 덧붙였다.

하인텔에서는 연구 자금 부족으로 이번 연구에 500만 원 상당의 컴퓨터 2대만을 이용했으며, 실질적 입증과 상용화를 위해서는 투자와 학계 및 대기업의 협력이 필요한 상황이다.

하인텔은 클루닉스 창업자 권대석 박사와 기초과학연구원 출신의 입자 물리학자 팽원기 박사 2명에 의해 2022년 설립된 AI 연구개발 전문 기업이다. 인간 지능의 근본 동작 원리를 밝혀, 인간 지능을 능가하는 강(强) AI를 개발하는 것이 회사의 목표이며, 현재 5개 이상의 관련 특허를 출원 중이다.

출처 : 아이티데일리(http://www.itdaily.kr)

자동등록방지

추천 비추천

2

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
483081 뉴스 정해진 대사 없는 AI 심문 게임, 스팀 출시 게임메카갤로그로 이동합니다. 24.05.27 64 0
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 7656 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3053] 특갤용갤로그로 이동합니다. 23.08.06 38907 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2469 2
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7151 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 13218 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 8857 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8265 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9067 30
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22630 33
483298 일반 제일 베스트는 한국만 망하고나서 특이점 오는거임 [1] ㅇㅇ(14.42) 05:05 15 0
483297 일반 챗GPT야 이재명식 경제정책이 지속된다면? ㅇㅇ갤로그로 이동합니다. 05:04 4 0
483296 일반 과학자란 새끼가 근거도 없이 "안돼" 타령 ㅇㅇ(121.124) 04:56 16 0
483295 일반 gpt 3.5는 병신맞음? [3] ㅇㅇ갤로그로 이동합니다. 04:32 51 0
483294 일반 사실 특이점 혜택 모두가 못보고 죽는 엔딩도 괜찮음 [5] ㅇㅇ갤로그로 이동합니다. 04:29 55 1
483293 일반 제미니 프로 1.5 무료라길래 써봤는데 ㅇㅇ(220.126) 04:18 49 0
483292 AI창 Suno ai 미쿠 곡 ㅇㅇ(210.105) 03:48 40 0
483291 일반 chatgpt 맥락이해 잘하던데 [2] ㅇㅇ(210.105) 03:36 81 0
483290 AI창 Suno v3 이제 잘뽑히면 거의 전문 작곡가 급으로 뽑히는듯? ㅇㅇ(210.105) 03:29 50 0
483289 일반 현재 Chat gpt도 맥락 이해못하고 존나 멍청하던데 [8] ㅇㅇ(58.120) 03:14 167 0
483288 일반 특이점 ㅇㅈㄹ ㅋㅋ 할머니 왕점이나 봐라 이새끼들아 ㅋㅋ [2] 겅형욱.갤로그로 이동합니다. 03:13 189 0
483287 일반 큰거 오기까지 딱 2주 남았네 [3] ㅇㅇ갤로그로 이동합니다. 02:21 327 0
483286 일반 싱숭생숭 미래꽃 새 트윗 [7] 모브갤로그로 이동합니다. 02:17 365 0
483285 일반 지금 gpt로 머신러닝 배우는데 진짜 재밌네 ㅇㅇ갤로그로 이동합니다. 02:01 136 0
483284 일반 얀르쿤이 3년 내 AGI가 온다고 했단 말이 헛소리인 이유 [4] ㅇㅇ(119.197) 02:00 382 5
483283 일반 스마트폰은 안드로이드와 iOS만 남았는데 ㅇㅇ(59.26) 01:57 63 0
483282 일반 데빈ai ai엔지니어 몇명 이직하노 [1] 초코냥갤로그로 이동합니다. 01:53 171 0
483281 일반 거품의 뜻을 모르나? [5] ㅇㅇ갤로그로 이동합니다. 01:52 150 2
483280 정보/ 콘코르디아 대학의 연구는 AI로 위조 동전을 식별합니다. [2] ㅇㅇ갤로그로 이동합니다. 01:42 113 2
483279 일반 싸움에서 머신러닝 지식 배우는거 재밌네ㅋㅋ [7] ㅇㅇ갤로그로 이동합니다. 01:31 259 0
483278 일반 AI 가속기의 발전이 지금 생각보다 되게 느림 [4] ㅇㅇ(121.159) 01:31 216 0
483277 정보/ AI와의 대화가 인간에게 정신적 외로움과 고통 해소 가능 [1] noosphere갤로그로 이동합니다. 01:22 140 3
483276 정보/ 이제 틀딱이란 말도 못쓰겟노 ㅋㅋㅋ [8] noosphere갤로그로 이동합니다. 01:19 381 4
483275 일반 지피티5 나오면 ㄹㅇ 주4일제 시행해야맞는거 아님? [7] ㅇㅇ갤로그로 이동합니다. 01:16 180 0
483269 일반 ai거품에서 가장 궁금한 부분 [20] ㅇㅇ(117.20) 01:09 301 0
483268 일반 agi 2029 ㅇㅇ [2] ㅇㅇ(14.38) 01:06 98 1
483267 일반 ai가 거품이든 뭐든 빅테크는 이제 멈출 수 없음 [13] ㅇㅇ갤로그로 이동합니다. 01:00 402 5
483266 일반 미국 주3식 우상향 맞음 [1] ㅇㅇ(121.132) 00:59 206 0
483264 일반 기술발전 속도랑은 별개로 ai 투자 거품인건 거의 확실한데 [1] ㅇㅇ(210.106) 00:52 138 0
483263 일반 사실 AI 빅테크 주'식들보다 미국 달러랑 채권이 더문제인데... ㅇㅇ(14.35) 00:48 86 0
483262 일반 근데 .. agi 아니어도 지금 단순 사무직은 진짜 위험한듯.. [1] ㅁㄴㅇ(121.162) 00:47 173 0
483261 일반 AI 개쩌는거 맞아. 근데 가장 큰 문제가 있음 [39] ㅇㅇ(121.159) 00:46 511 0
483259 일반 숏을 정확한 타이밍에 들어가야 하는 이유가 뭐겠냐 ㅋㅋ ㅇㅇ갤로그로 이동합니다. 00:45 68 0
483257 일반 숏치라고 왜 말못함 [4] ㅇㅇ(112.221) 00:41 138 0
483256 일반 선형쯍쯍이햄들도 거품론은 안밀듯 조정은 있을수 있어도 ㅇㅇ갤로그로 이동합니다. 00:39 41 0
483254 일반 숏치라는 놈들은 급식인가 [10] ㅇㅇ(125.134) 00:34 320 0
483253 일반 ai가 거품이 안될려면 [5] ㅇㅇ(117.20) 00:31 201 0
483252 일반 거품 같은 얘기 왜 하는지 모르겠다.. [1] ㅁㄴㅇ(121.162) 00:31 69 0
483251 일반 울회사가 보안 줫도 신경 안 쓰는게 존나 좋다 ㅁㄴㅇ(121.162) 00:25 84 0
483249 일반 거품론자들은 거품만 부르짖고 [5] ㅇㅇ갤로그로 이동합니다. 00:25 104 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2