디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 한 번만 캐시하면 됩니다: 언어모델을 위한 디코더-디코더 아키텍처

ㅇㅇ(125.191) 2024.05.09 13:31:03
조회 173 추천 2 댓글 4
														


1492f368f5dc3f8650bbd58b36807368e59873


https://arxiv.org/abs/2405.05254


https://github.com/microsoft/unilm/tree/master/YOCO


 


키-값 쌍을 한 번만 캐시하는 대규모 언어 모델을 위한 디코더-디코더 아키텍처인 YOCO를 소개합니다. 이는 두 가지 구성요소, 즉 셀프 디코더 위에 크로스 디코더가 적층되어 구성됩니다. 셀프 디코더는 크로스 어텐션을 통해 크로스 디코더에서 재사용되는 전역 키-값(KV) 캐시를 효율적으로 인코딩합니다. 전체 모델은 디코더 전용 Transformer처럼 동작하지만 YOCO는 한 번만 캐시합니다. 이 디자인은 GPU 메모리 요구량을 크게 줄이면서도 전 세계적으로 관심을 받을 수 있는 능력을 유지합니다. 또한 계산 흐름을 통해 최종 출력을 변경하지 않고도 사전 채우기부터 조기 종료까지 가능하므로 사전 채우기 단계 속도가 크게 향상됩니다. 실험 결과는 YOCO가 모델 크기 및 훈련 토큰 수를 확장하는 다양한 설정에서 Transformer에 비해 유리한 성능을 달성한다는 것을 보여줍니다. 또한 거의 완벽한 바늘 검색 정확도로 YOCO를 1M 컨텍스트 길이로 확장합니다. 프로파일링 결과에 따르면 YOCO는 컨텍스트 길이와 모델 크기에 걸쳐 추론 메모리, 사전 채우기 대기 시간 및 처리량을 수십 배로 향상시킵니다. 코드는 https URL 에서 사용할 수 있습니다 .



잇힝

자동등록방지

추천 비추천

2

고정닉 2

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
2870 이슈 [디시人터뷰] 웃는 모습이 예쁜 누나, 아나운서 김나정 운영자 24/06/11 - -
478166 일반 근데 올해안.. 늦어도 내년초 gpt5안나오면 ㅇㅇ(39.124) 05.20 165 0
478165 일반 미국 20일날 뭐 나온다며 ㅇㅇ(112.158) 05.20 111 0
478164 일반 점점 4o 보이스 기대감이 떨어져 가고 있어 [2] ㅇㅇ(119.202) 05.20 322 0
478163 일반 그립다. 과대망상에 빠져서 특이점을 누렸던 그때가. [1] ㅇㅇ(1.239) 05.20 317 0
478162 일반 나는 미래가 정해져 있다고 보는 이유. [19] 내복맨갤로그로 이동합니다. 05.20 420 2
478161 일반 얀르쿤은 AGI가 10년 내에는 어림도 없다고 생각하겠지? [6] ㅇㅇ갤로그로 이동합니다. 05.20 297 1
478160 일반 UBC 는 곧 화폐가 될 수도 있지 않을까? [3] ㅇㅇ(175.192) 05.20 193 1
478159 일반 미라 무라티는 인도계가 아님 [8] ㅇㅇ(210.121) 05.20 428 3
478158 일반 난 외모 준수한편이라 역노화 꼭 나왔으면좋겠음 [9] ㅇㅇ(125.249) 05.20 396 0
478157 일반 진짜 버티기 개힘드네 [4] ㅇㅇ갤로그로 이동합니다. 05.20 246 0
478156 일반 제미니 이미지 분석 안 됐었나? [3] ㅇㅇ갤로그로 이동합니다. 05.20 130 0
478155 일반 형들 만약 몇 조가 있는데 AGI의 가속에 기여할 수 있다면 [12] dd(175.211) 05.20 246 0
478154 일반 perplexity 이거만 하먄 gpt든 claude든 동시에 20달러로 [1] ㅇㅇ(222.235) 05.20 230 0
478153 일반 레커옹은 마인드 업로딩을 “조금씩 주춧돌 바꾸기” 로 설명하는구나 ㅇㅇ(175.192) 05.20 164 0
478152 일반 특갤 납량특집) 특붕이의 꿈 [4] ㅇㅇ(125.133) 05.20 184 0
478151 일반 우리나란 이 기술 4개만 믿어야 함? [5] ㅇㅇ(103.237) 05.20 332 0
478149 일반 역노화는 굳이 나이를 거꾸고 먹어야 하는 것 만은 아님 [4] 내복맨갤로그로 이동합니다. 05.20 232 0
478148 일반 그래서 2029가 정배임? [3] ㅇㅇ(115.23) 05.20 211 0
478146 일반 오랜만에 왔더니 갤 념글 뭐 저래 [3] ㅇㅇ갤로그로 이동합니다. 05.20 226 0
478145 일반 엔스로픽이 안전 때문에 독립했다는 말이 구라로 보이는 이유. [3] 내복맨갤로그로 이동합니다. 05.20 202 2
478144 일반 난 솔직히 퀄리티 문제보단 [2] ㅇㅇ(103.237) 05.20 157 0
478143 역노화 비행기가 나는 원리도 못알아냈는데 [17] ㅇㅇ(112.159) 05.20 604 1
478142 일반 이거보면 웹툰에도 얼마 안가 ai 적용될듯 [24] 갤럭시빠갤로그로 이동합니다. 05.20 616 3
478141 일반 10의 22승 퀀텀점프는 잔짜 불가사의 하기는 하다 [6] ㅇㅇ갤로그로 이동합니다. 05.20 398 1
478140 일반 샘 알트만도 한 얘기지만 기술 심드렁 속도 ㅆㅅㅌㅊ인듯 [5] ㅇㅇ갤로그로 이동합니다. 05.20 392 0
478139 일반 gpt4 예를드러 ㅇㅈㄹ하네. 너프 먹었나? 놋갤만해요갤로그로 이동합니다. 05.20 162 0
478138 일반 개들이 짖어도 특이점은 온다 [2] ㅇㅇ(1.239) 05.20 112 0
478137 일반 알트만이 주장하는 UBC 개념 [1] ㅇㅇ(211.184) 05.20 133 0
478136 일반 특갤, 레딧 같은 곳 또 있냐고 GPT에게 물어봤음. 내복맨갤로그로 이동합니다. 05.20 185 0
478135 일반 나는 정배에 베팅하겠슴 [2] ㅇㅇ(175.192) 05.20 141 1
478134 일반 [설문] GPT5 예상 출시일은? [10] 내복맨갤로그로 이동합니다. 05.20 349 1
478133 일반 특갤같은 커뮤니티는 여기랑 레딧밖에 없음? [3] ㅇㅇ(115.138) 05.20 203 0
478132 일반 GPT VS 클로드 VS 제미나이 검색량 비교 [10] 내복맨갤로그로 이동합니다. 05.20 447 1
478131 일반 사실 르쿤이형이 맞은거면 어쩌냐.. [9] ㅇㅇ갤로그로 이동합니다. 05.20 325 3
478130 일반 한국이 ai에 3.5조 배팅하는거면 할만큼 한거임 [8] ㅇㅇ(211.184) 05.20 368 3
478129 일반 제미니 프로 1.5 활용하기 [3] ㅇㅇ(121.163) 05.20 367 1
478128 일반 4o 쓰려면 뭐해야됨? [5] Zintp_찐팁갤로그로 이동합니다. 05.20 209 0
478127 일반 특이점을 믿는건 좋은데 너무 집착하면 희망고문처럼 되는듯 [1] ㅇㅇ(115.139) 05.20 145 3
478126 일반 오 인간뇌의 방추세포 갯수가 적기 때문에… [4] ㅇㅇ(175.192) 05.20 201 0
478125 일반 제미니도 멀티모달 아님? [9] ㅇㅇ(220.75) 05.20 188 0
478124 일반 ubi보다는 ubc가 좀 더 이상적이긴한듯 [5] ㅇㅇ(211.184) 05.20 177 0
478123 일반 우리 세대에서 특이점 오긴 오냐 [10] ㅇㅇ(121.145) 05.20 557 0
478122 일반 그림쟁이 욕하진 마라 [6] 갤럭시빠갤로그로 이동합니다. 05.20 239 0
478118 일반 알트만의 '돌이켜보면 많이 바뀌었구나 느낄것' ㅇㅇ(211.184) 05.20 137 0
478116 정보/ 누출 LLM 시스템프롬프트 몇가지 번역.txt [1] e/linear갤로그로 이동합니다. 05.20 272 4
478115 일반 파이썬 코드좀 도와줘 [14] 숨동갤로그로 이동합니다. 05.20 286 0
478114 일반 오늘도 노동해방과 특이점을 향한 기도를 올립니다 [2] ㅇㅇ(219.240) 05.20 95 0
478111 일반 그림쟁이 거지같은 새끼들아 또 분탕치러온거냐? [3] ㅇㅇ(58.29) 05.20 192 0
478110 일반 그 경력단절 주부 면접 대신해주는거 있었잖아 ㅇㅇ갤로그로 이동합니다. 05.20 82 0
478108 일반 도라에몽은 언제 나오냐? [4] 초2때부터야동본놈(116.36) 05.19 200 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2