디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 그래서 사카나가 뭐만듬?앱에서 작성

ㅇㅇ갤로그로 이동합니다. 2024.08.20 12:43:39
조회 634 추천 12 댓글 11
														

3db5c935ecd12bf423ed86e74281776c5b48d95b29355cad3701ce8116205433350e2618e3490f145fe9c5

 

Evolutionary Optimization of Model Merging Recipes

We present a novel application of evolutionary algorithms to automate the creation of powerful foundation models. While model merging has emerged as a promising approach for LLM development due to its cost-effectiveness, it currently relies on human intuition and domain knowledge, limiting its potential. Here, we propose an evolutionary approach that overcomes this limitation by automatically discovering effective combinations of diverse open-source models, harnessing their collective intelligence without requiring extensive additional training data or compute. Our approach operates in both parameter space and data flow space, allowing for optimization beyond just the weights of the individual models. This approach even facilitates cross-domain merging, generating models like a Japanese LLM with Math reasoning capabilities. Surprisingly, our Japanese Math LLM achieved state-of-the-art performance on a variety of established Japanese LLM benchmarks, even surpassing models with significantly more parameters, despite not being explicitly trained for such tasks. Furthermore, a culturally-aware Japanese VLM generated through our approach demonstrates its effectiveness in describing Japanese culture-specific content, outperforming previous Japanese VLMs. This work not only contributes new state-of-the-art models back to the open-source community, but also introduces a new paradigm for automated model composition, paving the way for exploring alternative, efficient approaches to foundation model development.

arxiv.org


여러 모델들을 병합하는 효과적인 방법 개발함

그걸로






7ced8076b7836ff53aee98a518d6040386d6c0640ad93fcb82f4

7ced8076b7836ff53aed98a518d604035ee328dd4123f53b1739

7ced8076b7836ff53aec98a518d60403b4b76f535e5216d18c3f

일본어 기반 LLM "EvoLLM-JP"와

이미지인식 얹은 "EvoVLM-JP" 개발












7ced8076b7836ff53de698bf06d60403c096f55d3fa70b1c2456

7ced8076b7836ff53aeb98a518d60403a24b29362aea2389db5d

일본어 프롬프트 인식되는 이미지생성모델 "EvoSDXL-JP" 개발












우키요에 생성 모델 "Evo-Ukiyoe" 와 채색모델 "Evo-Nishikie" 개발












https://huggingface.co/SakanaAI



딥러닝 공부까진 못해도 블로그읽고 풀오픈소스로뿌린모델은 좀 써보자

이새끼들은 걍 특갤이 세상의 전부임
자동등록방지

추천 비추천

12

고정닉 6

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기
자동등록방지

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2930 설문 논란보다 더 욕 많이 먹어서 억울할 것 같은 스타는? 운영자 24/09/23 - -
2932 이슈 [디시人터뷰] '더 인플루언서' 표은지, 귀여움과 섹시함을 겸비한 모델 운영자 24/09/26 - -
514379 일반 사카나ai 파인튜닝이 아니라 모델병합 ai를 만드는중인데 [16] ㅇㅇ갤로그로 이동합니다. 08.20 366 3
514376 일반 하사비스가 ai로 만든 신약이 수년내 투여될거라 했음 ㅇㅇ(211.59) 08.20 237 1
514375 일반 다들 언제부터 특이점을 믿었나요? [5] 군구갤로그로 이동합니다. 08.20 164 0
514374 일반 사실상 복제가 가장 빠른 루트같은데 [11] ㅇㄴ(180.80) 08.20 257 0
514373 일반 역노화가 상용화 됐다는건 울라리를 뽑았단 뜻임 [1] ㅇㅇ갤로그로 이동합니다. 08.20 179 0
514372 일반 노화가속 연구하는 사람인데 [2] ㅇㅇ(211.189) 08.20 274 0
514369 일반 근데 5년 안에 AI가 역노화 약 개발할거 같지 않음? [16] ㅇㅇ(210.205) 08.20 529 1
514368 일반 설령 생물학적 영생이 불가능하다? [3] ㅇㅇ(125.177) 08.20 246 0
514367 일반 노화 연구하는 사람인데 [10] ㅇㅇ(210.104) 08.20 476 0
514363 일반 멀리 안가도 애초에 AI가 그림 그린다는것 자체가 [9] 할수있다노력움이갤로그로 이동합니다. 08.20 392 0
514362 일반 역노화는 젊은 세대의 악몽이 될 거임 [13] 늙병필갤로그로 이동합니다. 08.20 580 0
514360 일반 아무리 생각해도 역노화는 테세우스의 배 메타임 [2] ㅇㅇ(119.194) 08.20 204 0
514359 일반 역노화를 너무 까마득하게 여김 [7] ㅇㅇ갤로그로 이동합니다. 08.20 323 2
514358 일반 포유류 신체 재생한 케이스 지금 있어? [1] ㅇㄴ(180.80) 08.20 124 0
514355 일반 그냥 의학 발전만 무난하게 계속돼도 수명은 늘어날거임 [7] ㅇㅇ(121.152) 08.20 183 0
514353 일반 역노화 가능하다해도 [10] ㅇㅇ(210.104) 08.20 285 0
514349 일반 근데 미래학자중에 제일 타율 좋은 게 커즈와일임? [7] ㅇㅇ(183.104) 08.20 273 0
514348 일반 노화 → 몸이 서서히 손상되는 것 [4] ㅇㅇ갤로그로 이동합니다. 08.20 282 5
514347 역노화 초지능 나와도 역노화 불가능하다는 애들은 뭐임? [3] ㅇㅇ갤로그로 이동합니다. 08.20 334 0
514346 일반 난 20살 처음 특이점 알게 됐을때도 역노화가 최우선이었음 [6] ㅇㅇ갤로그로 이동합니다. 08.20 275 2
514345 일반 에어컨은 키고 살아라 좀 [3] ㅇㅇ(211.189) 08.20 272 0
514344 일반 파킨슨병보다 치매가 완치 훨씬 힘들듯 ㅇㅇ(183.104) 08.20 164 2
514343 일반 SF영화 보면 영생 추구는 인간의 오만 [3] ㅇㅇ(27.100) 08.20 180 0
514342 일반 예전에 특갤에서 얼평하던거 막힘? [1] ㅇㅇ(220.95) 08.20 102 0
514341 일반 역노화는 그래도 특갤에서 바라는 기술 중에선 쉬운편이지. [4] ㅇㅇ(125.177) 08.20 183 0
514339 일반 질병해방이 역노화보다 먼저야? [5] 진지(180.80) 08.20 154 0
514337 일반 내년에도 여름을 이렇게 보내야하나? [16] ㅇㅇ갤로그로 이동합니다. 08.20 316 0
514335 일반 특이점이고 나발이고 쿠팡에서 콜라주문했는데 왜 [1] ㅇㅇ(59.12) 08.20 143 0
514334 일반 ai 자폐아 조기 진단에 활용 ㅇㅇ(121.139) 08.20 132 0
514333 일반 ai는 환멸의 계곡에 있다 [2] ㅇㅇ(121.139) 08.20 280 0
514332 AI창 Flux 여자모음5 [19] [7] ㅇㅇ(14.42) 08.20 633 11
514331 역노화 특갤러 90%는 역노화 때문에 특이점 기다리는거 아님? [20] ㅇㅇ갤로그로 이동합니다. 08.20 495 2
514330 정보/ Cohere CEO 에이단 고메즈 인터뷰 (08.20) [11] MinasAnor갤로그로 이동합니다. 08.20 2207 24
514329 일반 양자역학을 못푼다는게 시뮬레이션 세상 증거아님? [10] ㅇㅇ(49.142) 08.20 458 0
514328 일반 본인 기다리고있는거 2가지 [3] 투우사갤로그로 이동합니다. 08.20 335 1
514327 일반 클로드 무료버전 쥐좆으로 바꼈길래 빡쳐서 [1] INTJ(14.7) 08.20 290 0
514326 일반 스케일 키워도 인간 근사값이 한계고 빠른 이륙은 개소리 아님? [4] ㅇㅇ(114.201) 08.20 221 2
514325 일반 선형햄들 벙찌겠노 ㅋㅋㅋㅋㅋ [3] ㅇㅇ(183.108) 08.20 322 1
514324 일반 진짜 온난화때문에 특이점오기전에 [7] ㅈㅈ(116.37) 08.20 216 0
514323 일반 지금 인류가 모든 에너지 llm에 투자하면 [3] ㅇㅇ갤로그로 이동합니다. 08.20 207 0
514322 일반 팩트는 특갤이 건강해지고 있다는거임 [2] ㅇㅇ(116.33) 08.20 236 4
514321 일반 그래도 뤼튼이 이정도라도 해줬으면 ㅇㅇ갤로그로 이동합니다. 08.20 268 0
514320 일반 나는 개인적으로 gpt가 신창섭갤로그로 이동합니다. 08.20 124 1
514319 일반 구글 보면 엄청 영악함 [2] ㅇㅇ(119.207) 08.20 351 0
514317 일반 소문으로는 GPT5가 4.0에 거의 10배 스케일이던데 [2] ㅇㅇ갤로그로 이동합니다. 08.20 451 0
514316 일반 카드 결제도 안받는 아날로그 천국에서 획기적인 ai가 잘도 나오겠노ㅋㅋ [1] ㅇㅇ갤로그로 이동합니다. 08.20 184 1
514315 일반 요즘 특갤은 뭔가 새로운 이슈가 나오면 원글을 못찾겠어 ㅡㅡ [4] ㅇㅇ갤로그로 이동합니다. 08.20 141 0
514313 일반 진짜 사카나가 뭘 잘못했다고 이렇게 까여야 되냐? [19] ㅇㅇ갤로그로 이동합니다. 08.20 2719 35
514309 정보/ VFusion3D: 비디오 디퓨전 기반의 3D 생성 모델.meta [1] ㅇㅇ갤로그로 이동합니다. 08.20 376 10
514307 일반 일본 무시하지 말라고 ai 시대엔 버튜버가 답이다 [6] ㅇㅇ(110.145) 08.20 337 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2