디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 해당 진화알고리즘 LLM교배 논문 클로드 답변보니앱에서 작성

ㅇㅇ­갤로그로 이동합니다. 2024.03.25 01:21:14
조회 350 추천 6 댓글 4
														

이 연구에서는 모델 병합을 위해 매개변수 공간(Parameter Space, PS)과 데이터 흐름 공간(Data Flow Space, DFS) 두 가지 방식을 사용하고 있습니다.

1. 매개변수 공간(PS) 병합:
- 여러 모델의 가중치를 하나로 통합하여 성능을 높이는 방법입니다.
- 각 레이어별로 DARE(Densely Applied Rotation Ensemble)와 TIES(Task-specific Interference Elimination of Spurious weights) 기법을 사용하여 병합 구성을 최적화합니다.
- CMA-ES(Covariance Matrix Adaptation Evolution Strategy) 알고리즘을 사용하여 병합 구성 매개변수를 최적화합니다.
- 정확도(accuracy), ROUGE 점수 등 작업별 평가 지표를 기반으로 최적의 모델을 선정합니다.

2. 데이터 흐름 공간(DFS) 병합: 
- 모델의 추론 경로(inference path)를 최적화하여 토큰이 신경망을 통과하는 경로를 결정하는 방법입니다.
- 총 M개의 레이어에 대해 반복 횟수 r을 설정하여 T=M*r 크기의 인디케이터 배열 I를 탐색 공간으로 정의합니다.
- I[i]=1이면 i번째 레이어를 포함하고, I[i]=0이면 제외합니다. 이를 통해 탐색 공간을 2^T로 제한합니다.
- 레이어 간 분포 변화에 따른 성능 저하를 막기 위해 스케일링 가중치 행렬 W도 함께 최적화합니다.
- CMA-ES 알고리즘을 사용하여 I와 W를 최적화하며, 검증 데이터에 대한 정확도가 가장 높은 모델을 선택합니다.

위의 두 가지 병합 방식은 서로 직교(orthogonal)하므로 함께 사용할 수 있습니다. 먼저 PS 병합으로 여러 개의 모델을 만든 뒤, 이를 DFS 병합의 입력으로 사용하여 다중 목적 최적화를 수행할 수 있습니다. 

이를 위해 NSGA-II(Non-dominated Sorting Genetic Algorithm II)와 같은 다중 목적 유전 알고리즘을 사용하여 최종 모델의 성능을 향상시킵니다. 이렇게 얻은 최적의 모델들을 다양한 평가 지표에 따라 비교하여 가장 우수한 모델을 선택하게 됩니다.



결국에 수학과 알고리즘이 핵심인듯
못해낼게 없어보인다 진심
자동등록방지

추천 비추천

6

고정닉 4

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
466160 일반 gpt5나오면 ㅇㅇ(211.234) 05.12 56 0
466159 일반 알트만이 말한 magic = 완몰가 임? [6] 친근한게이브갤로그로 이동합니다. 05.12 219 0
466158 일반 솔직히 빈살만같은 중동 석유부자들이 특이점에 지대한 관심 가지면.. [3] ㅇㅇ갤로그로 이동합니다. 05.12 154 1
466157 일반 지금까지 라이브 발표할때는 큰거 2개 이상은 발표했다. ㅇㅇ(183.105) 05.12 92 0
466156 일반 저번 라이브때는 뭐 나왔었음 근데 어브리갤로그로 이동합니다. 05.12 39 0
466155 일반 념글 UBI글 저거 알트만 혼자만의 계획임? [12] ㅇㅇ(221.147) 05.12 284 0
466154 일반 완몰가 나오면 진짜 [3] ㅇㅇ(210.90) 05.12 144 0
466153 일반 이번엔 기술발표라니까 [4] ㅇㅇ(211.36) 05.12 169 0
466152 일반 지금보니현생사는사람이 제일 이득이네 [6] ㅇㅇ갤로그로 이동합니다. 05.12 204 0
466151 일반 이번이 트위터 근들갑이랑 다른이유 [2] ㅇㅇ(125.183) 05.12 142 0
466150 일반 이것만 아니었어도 맘껏 근들갑떨텐데 [2] ㅇㅇ(222.108) 05.12 198 0
466149 AI창 UDIO : 인생의 멜로디 ㅇㅇ(61.101) 05.12 81 0
466148 일반 중요한건 신박한 기술이 전혀 아닌데 [37] ㅇㅇ(117.20) 05.12 346 0
466146 일반 그래서 다들 her나오면 뭐할꺼? [2] ㅇㅇ갤로그로 이동합니다. 05.12 157 0
466145 일반 gpt 성인물 허용되면 한국이 전면금지 때린다고? [12] ㅇㅇ갤로그로 이동합니다. 05.12 367 0
466144 일반 난 이런것만 아니면 만족임 ㅇㅇ(218.154) 05.12 68 0
466143 일반 디시망하기전엔 특이점 오겠지? ㅇㅇ갤로그로 이동합니다. 05.12 33 0
466142 일반 특이점 뉴비인데 특이점오면 정신병도 고쳐짐?? ㅠ ㅠ [7] ㅇㅇ(118.223) 05.12 201 0
466141 일반 OAI 이새끼들 대체 뭘 내놓길래 이렇게 근들갑 떠는거냐 ㅇㅇ(211.197) 05.12 103 0
466140 일반 Chatbot Arena를 하다가 [3] mahogany갤로그로 이동합니다. 05.12 252 0
466139 일반 알two만 "gpt4 auto는 자율에이전트 입니다." ㅇㅇ(183.105) 05.12 195 0
466138 일반 월요일에 별거없으면 다시 활동시작해볼까 [1] ㅇㅇ(39.119) 05.12 114 0
466137 일반 커뮤 논리충들의 가장 큰 잘못은 자본주의의 오독이라고 봄. ㅇㅇ(49.1) 05.12 87 1
466136 일반 근데 특들갑 떠나서 이번에는 제발 [2] ㅇㅇ(218.154) 05.12 131 1
466135 일반 검열 때문에 멍청해진게 아니라 그냥 특붕이들 도파민이 빠진거 뿐ㄴ ㅇㅇ(218.154) 05.12 72 0
466134 일반 구글이 치타면 메타는 초음속전투기임 투우사갤로그로 이동합니다. 05.12 60 0
466133 일반 설레발치는것들 주_식 물렷음 [2] ㅇㅇ(76.38) 05.12 103 0
466132 일반 조코딩 OAI 본사 왔네 ㅋㅋㅋ [8] ㅇㅇ갤로그로 이동합니다. 05.12 557 3
466131 일반 ai가 논리적이고 딱 중립적인 답을 내주니 사회 [3] ㅇㅇ(180.228) 05.12 119 0
466130 정보/ 사람과 게임하는 AI 에이전트 등장 [5] ㅇㅇ(58.123) 05.12 243 3
466127 토의 이런사례 때문에 AI비서보급화되서 자아의탁하는게 이나라엔 답일듯 [5] ㅇㅇ(180.228) 05.12 195 1
466126 일반 oai 트윗 근들갑 걸러야되는 이유 [5] ㅇㅇ(121.140) 05.12 424 9
466125 일반 화요일 새벽에 이정도면 짜치는데 이런 말하는 유저는 차단 ㅇㅇ(218.147) 05.12 114 0
466123 일반 챗 지피티 목소리가 대신 전화를 한다고? [2] ㅇㅇ(121.124) 05.12 239 0
466121 일반 머리가 반이상 날라가기 vs 가슴에 한발 [2] ㅇㅇ(1.237) 05.12 164 0
466120 일반 ai 추천해주세요 [3] ㅇㅇ갤로그로 이동합니다. 05.12 101 0
466119 일반 만약 5나와도 특붕이 반응 똑같음 [4] ㅇㅇ(218.154) 05.12 190 0
466118 일반 다음 주 특붕이들 반응 ㅇㅇ(103.237) 05.12 77 0
466117 일반 also 막혔나? [2] ㅁㅁ(121.143) 05.12 215 0
466116 일반 뭐 밈 게임? 이 씨발 똥게이 새끼가 쳐 돌았나 [4] ㅇㅇ갤로그로 이동합니다. 05.12 307 0
466115 일반 헤이 지피티 오늘 간만에 물이나 빼고싶은데 말이지. 알겠지? [5] ㅇㅇ(121.184) 05.12 256 0
466114 일반 한국시간 화요일에 결정된다.. [1] ㅇㅇ(211.46) 05.12 239 0
466112 일반 ㄹㅇ 구글은 폐업헸냐??? [6] ㅇㅇ(218.153) 05.12 358 0
466111 일반 Gpt5 포함해서 당분간 Agi와는 거리가 멀다고 본다. [3] Qw(116.84) 05.12 325 1
466110 일반 oai 호들갑 심해지는거 보니까 입맛 뚝 떨어진다 ㅇㅇ(118.235) 05.12 106 0
466109 일반 이건 신박한 기술 맞는거 걑다 [2] ㅇㅇ(117.20) 05.12 371 0
466108 일반 역대급 특들갑으로 기대치는 MAX네 ㅇㅇ(220.116) 05.12 106 0
466107 일반 OAI 직원들 기차놀이는 역대급 호들갑 아니냐? ㅇ0oO갤로그로 이동합니다. 05.12 176 1
466106 일반 chatGPT 전화통화 [4] 특술람갤로그로 이동합니다. 05.12 335 1
466105 일반 흥분하는 openai 연구원 [42] ㅇㅇ(125.191) 05.12 5721 22
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2