디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] LoRA 전문가의 혼합

ㅇㅇ(125.191) 2024.04.23 21:26:16
조회 73 추천 0 댓글 0
														


00b2fc68f5dc3f8650bbd58b36837c6e790182

https://arxiv.org/abs/2404.13628


LoRA는 다양한 다운스트림 작업을 처리하기 위해 사전 훈련된 대규모 모델의 미세 조정에서 널리 수용되었으며, 주목할만한 효과와 효율성을 보여줌으로써 가장 널리 사용되는 미세 조정 기술 중 하나로 입지를 확고히 했습니다. LoRA 플러그 앤 플레이 플러그인의 모듈식 특성으로 인해 연구원들은 모델이 다양한 다운스트림 작업에서 탁월한 성능을 발휘할 수 있도록 여러 LoRA를 통합하는 방법을 연구했습니다. 그럼에도 불구하고 LoRA 융합에 대한 기존 접근 방식은 고유한 문제를 안고 있습니다. 직접적인 산술 병합으로 인해 사전 훈련된 원래 모델의 생성 기능이나 LoRA의 고유한 정체성이 손실되어 최적이 아닌 결과가 나올 수 있습니다. 반면, 참조 튜닝 기반 융합은 여러 LoRA의 효과적인 조합에 필요한 유연성과 관련하여 한계를 나타냅니다. 이러한 과제에 대응하여 이 문서에서는 계층적 제어와 자유로운 분기 선택을 활용하는 MoLE(Mixture of LoRA Experts) 접근 방식을 소개합니다. MoLE 접근 방식은 직접 산술 병합에 비해 뛰어난 LoRA 융합 성능을 달성할 뿐만 아니라 LoRA를 효과적으로 결합하는 데 중요한 유연성을 유지합니다. NLP(자연어 처리) 및 V&L(비전 및 언어) 영역 모두에서 수행된 광범위한 실험 평가는 MoLE의 효율성을 입증합니다.



추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
16930 정보글 삼성XR 헤드셋에 구글 AI 비서 장착 삼성 VR AR XR 생태계 구축 ㅇㅇ(222.234) 05.18 250 6
16929 일반 LLM 제일 빡치는 점 [2] e/linear갤로그로 이동합니다. 05.17 122 1
16928 일반 AI 안전은 선동에 불과함 [1] 선갤러(112.167) 05.17 127 0
16927 일반 GPT-4o는 에이전트 따까리 모델임 e/linear갤로그로 이동합니다. 05.17 79 0
16926 일반 병신들 gpt3 때 한소리 치매걸린것처럼 또 하네 ㅇㅇ(202.182) 05.17 103 4
16925 일반 모든학자들이 2040년 안에 초인공지능 온다함 나디갤로그로 이동합니다. 05.17 119 1
16924 일반 요즘 네이버 언플하지만 국내는 답이없음 [1] 선갤러(143.244) 05.17 136 4
16923 일반 GPT-4o가 AGI다 [3] ㅇㅇ(118.235) 05.17 180 2
16922 일반 어서 코딩 뚝배기 폭파해야함 [3] 특술람갤로그로 이동합니다. 05.17 150 3
16921 정보글 냉동 인간 뇌 조직, 획기적인 발전으로 다시 살아나다 [1] 특술람갤로그로 이동합니다. 05.17 99 2
16920 일반 Gpt4o는 작년에 출시 됐었어야 함 [4] 특술람갤로그로 이동합니다. 05.17 180 1
16919 일반 여기 보고 느낀점 [2] ㅇㅇ(106.101) 05.17 137 3
16918 정보글 OpenAI가 이미 AGI를 달성했다는 증거 [4] 특술람갤로그로 이동합니다. 05.17 238 0
16917 일반 엘리저 유드코프스키의 AGI 도래 징후 [1] 특술람갤로그로 이동합니다. 05.17 150 0
16916 일반 네덜란드 근황 ㄷㄷ [1] 선갤러(221.153) 05.17 142 2
16915 일반 [공통점 기반의 정보연결]은 지능의 본질이다 [3] Moriae갤로그로 이동합니다. 05.17 102 1
16914 일반 좋았어! 공통점기반의 정보연결이야!! [1] Moriae갤로그로 이동합니다. 05.17 87 1
16913 일반 진짜 지능의 원리 알아냈다 Moriae갤로그로 이동합니다. 05.17 84 0
16912 일반 Lmsys에 gpt2 also랑 gpt4o랑 같이나오는데 뭐셈?? [2] ㅇㅇ(222.96) 05.17 116 0
16911 정보글 다음 주 ms 차례 [4] 특술람갤로그로 이동합니다. 05.17 119 1
16910 정보글 룬 "초지능 접근방식에 따라 많은 변화 기대해야" [2] 특술람갤로그로 이동합니다. 05.17 107 2
16909 정보글 앤트로픽 프롬프트 생성기 특술람갤로그로 이동합니다. 05.17 64 0
16908 일반 지구온난화충 = 병신 shuwa갤로그로 이동합니다. 05.17 78 0
16907 일반 르쿤이형 대응모델 출시 [1] 선갤러(106.248) 05.17 94 0
16906 정보글 美 "인간이 AI 감독해야"…직장 내 AI 사용 행정명령 발표 특술람갤로그로 이동합니다. 05.17 52 0
16905 일반 특슬람들 사고방식이 신기하지않냐 [2] 선갤러(211.36) 05.17 142 6
16904 일반 이게 지능의 작동방식 아닐까? [2] Moriae갤로그로 이동합니다. 05.17 86 0
16903 정보글 LoRA는 덜 배우고 덜 잊어버립니다 [2] 특술람갤로그로 이동합니다. 05.17 90 0
16902 정보글 강화 학습을 통해 의사 결정 에이전트로서 대형 비전 언어 모델 미세 조정 특술람갤로그로 이동합니다. 05.17 40 0
16901 일반 AI에 주권 들먹이는 틀딱들 [1] 특술람갤로그로 이동합니다. 05.17 94 3
16900 정보글 카멜레온: 혼합 모드 조기 융합 기초 모델 특술람갤로그로 이동합니다. 05.17 56 1
16899 일반 특슬람이 기술진보를 바라는 사람이면 ㅇㅇ(1.241) 05.17 89 5
16898 일반 안전 정렬팀은 필요없닷 알트만 good [1] 아몬드초콜릿갤로그로 이동합니다. 05.17 122 0
16897 정보글 MS, 자체 개발 AI 칩 '코발트 100' 내주 출시…"성능 40% 향 특술람갤로그로 이동합니다. 05.17 64 0
16896 정보글 AWS “AI 시대 ‘마법같은 여정’ 제시할 것” [1] 특술람갤로그로 이동합니다. 05.17 105 8
16895 정보글 그렉 브록만 "우리 모두 AI 초능력 얻을 것" [8] 특술람갤로그로 이동합니다. 05.17 158 11
16894 일반 기본 소득하고 있는 나라 있는데 걸로 꺼지면 안됨? [1] ㅇㅇ(118.235) 05.17 92 3
16893 일반 지금 바로 agi안가져오면 [1] ㅇㅇ갤로그로 이동합니다. 05.17 79 1
16892 일반 "Feel the AGI!" ㅇㅇ(61.99) 05.17 62 1
16891 일반 `슈퍼휴먼` AGI, 예상보다 빨리 온다 ㅇㅇ갤로그로 이동합니다. 05.17 95 1
16890 일반 2700 Agi 꽉잡아라 [1] ㅇㅇ(211.234) 05.17 97 4
16888 일반 샘알트먼 이번 인터뷰는 굉장히 중요한걸 시사 [2] ㅇㅇ(220.116) 05.16 205 5
16887 일반 정부가 개입해서 AGI 달성 10년 이상 늦추겠다고 하면 [2] 특술람갤로그로 이동합니다. 05.16 125 0
16886 정보글 Tic-tac-toe를 해결한 gpt4o 특술람갤로그로 이동합니다. 05.16 84 0
16885 일반 Agi오셈!!! [7] ㅇㅇ갤로그로 이동합니다. 05.16 129 1
16884 일반 처음에 gpt-4o를 gpt2라고 불렀으니 [2] 특술람갤로그로 이동합니다. 05.16 129 0
16883 정보글 저널리즘을 죽일 수 있는 GOOGLE AI 기능에 겁먹은 출판사 특술람갤로그로 이동합니다. 05.16 64 0
16882 일반 특붕이가 되려 해도 [5] 특술람갤로그로 이동합니다. 05.16 122 2
16881 일반 2025단 들은 다 바보임 [1] 인안나갤로그로 이동합니다. 05.16 101 3
16880 일반 이제는 골대 대놓고 옮기네 [4] 선갤러(211.36) 05.16 165 5
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2