디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] KAN: 콜모고로프-아놀드 네트웍스

ㅇㅇ(125.191) 2024.05.01 11:52:09
조회 192 추천 1 댓글 0
														

https://arxiv.org/abs/2404.19756


Kolmogorov-Arnold 표현 정리에서 영감을 받아 KAN(Kolmogorov-Arnold 네트워크)을 MLP(다층 퍼셉트론)의 유망한 대안으로 제안합니다. MLP에는 노드("뉴런")에 고정된 활성화 기능이 있는 반면, KAN에는 에지("가중치")에 학습 가능한 활성화 기능이 있습니다. KAN에는 선형 가중치가 전혀 없습니다. 모든 가중치 매개변수는 스플라인으로 매개변수화된 일변량 함수로 대체됩니다. 우리는 겉으로는 단순해 보이는 이러한 변화로 인해 KAN이 정확성과 해석 가능성 측면에서 MLP보다 뛰어난 성능을 발휘한다는 것을 보여줍니다. 정확성을 위해 훨씬 작은 KAN은 데이터 피팅 및 PDE 해결에서 훨씬 더 큰 MLP와 비슷하거나 더 나은 정확도를 달성할 수 있습니다. 이론적으로나 경험적으로 KAN은 MLP보다 더 빠른 신경 확장 법칙을 가지고 있습니다. 해석 가능성을 위해 KAN은 직관적으로 시각화될 수 있으며 인간 사용자와 쉽게 상호 작용할 수 있습니다. 수학과 물리학의 두 가지 예를 통해 KAN은 과학자들이 수학과 물리 법칙을 (재)발견하는 데 도움을 주는 유용한 협력자임이 입증되었습니다. 요약하면, KAN은 MLP에 대한 유망한 대안으로, MLP에 크게 의존하는 오늘날의 딥 러닝 모델을 더욱 개선할 수 있는 기회를 열어줍니다.


최종 결론: KAN과 MLP 중 어떤 것을 사용해야 할까요? 현재 KAN의 가장 큰 걸림돌은 느린 학습 속도입니다. 동일한 수의 파라미터가 주어졌을 때, KAN은 일반적으로 MLP보다 10배 느립니다. 하지만 우리는 KAN의 효율성을 최적화하기 위해 많은 노력을 기울이지 않았다는 점을 솔직히 인정해야 합니다. 그래서 우리는 KAN의 느린 학습을 근본적인 한계라기보다는 향후 개선해야 할 공학적 문제로 간주합니다. 만약 여러분이 모델을 빠르게 학습시키고 싶다면, MLP를 사용해야 합니다. 하지만 다른 경우에는 KAN이 MLP와 비슷하거나 더 나을 수 있어 시도해 볼 만한 가치가 있습니다. 그림 6.1의 의사 결정 트리는 KAN을 사용해야 할 때를 결정하는 데 도움이 될 수 있습니다. 간단히 말해, 해석 가능성 및/또는 정확도를 중요하게 생각하고 느린 학습이 큰 문제가 되지 않는다면, KAN을 시도해 보는 것이 좋습니다.



0a90d425cbc31491369ef7b815c13473dee4ca44cd31650260b1a85725bda8


추천 비추천

1

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2872 설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
18214 일반 OAI가 뻐기는 이유는 ㅇㅇ(61.73) 11:12 0 0
18213 정보글 "오늘 점심은 치킨" ㅇㅇ(223.62) 11:09 3 0
18212 일반 어째 특갤이 저렇게까지 개병신이 됐냐 [1] ㅇㅇ(61.73) 10:49 27 3
18211 정보글 Scott Aaronson "인간이 개가 될 수도 있다" 특술람갤로그로 이동합니다. 10:40 15 0
18210 일반 무라티챤 이 발언은 너무 쎈거 아닌가여 ㅇㅅㅇ [4] 선갤러(122.36) 09:59 49 0
18209 일반 그냥 클로드가 정답이다 GPT코딩(118.235) 09:46 15 0
18208 일반 오에 이 새기들은 뭔데 이렇게 뻐기는 걸까? GPT코딩(118.235) 09:28 29 0
18207 정보글 특갤늬우스) 그짝갤 현실부정 중 ㅋㅋ ㅇㅇ(223.62) 09:13 49 6
18205 일반 이럼 이거 완전 나가리 아님? [2] GPT코딩(118.235) 09:01 55 3
18204 정보글 정보) 클린 선갤을 만들기 위해 사라져야할 두가지 [5] ㅇㅇ(223.62) 07:33 60 12
18203 일반 요즘 정보글 재밌게 보고있음 [1] ㅇㅇ(223.62) 07:19 60 11
18202 일반 팩트 말했더니 차단당했노 ㅇㅇ(125.185) 05:01 44 5
18201 일반 실제 사용하는 입장에서 좀 김빠지긴 함 선갤러(37.120) 03:34 53 7
18200 일반 술람아 넌 왜 여기만 정보글을 올리냐 ㅇㅇ(115.139) 01:08 54 7
18199 일반 앤트로픽은 감속주의임 [2] 특술람갤로그로 이동합니다. 00:20 82 0
18198 일반 클로드3.5 소넷이 MMLU-Pro에서 gpt4o 능가 특술람갤로그로 이동합니다. 00:17 50 0
18197 일반 딥마인드 연구원 "오픈모델 GemmaV2 곧 발표" 특술람갤로그로 이동합니다. 00:07 40 0
18196 일반 OpenAI 실시간 분석DB Rockset 인수 특술람갤로그로 이동합니다. 00:04 28 0
18195 일반 클로드3.5 소넷 프롬프트 방법으로 GPQA에서 인간 박사 능가함 특술람갤로그로 이동합니다. 00:02 46 0
18194 일반 영화 아틀라스에서 뉴럴링크 나오네 인안나갤로그로 이동합니다. 06.21 21 0
18193 일반 결국 소네트 3.5에서 정체됐네 ㅇㅇ(118.235) 06.21 57 3
18192 일반 아직 agi소식없음?? [5] ㅇㅇ갤로그로 이동합니다. 06.21 58 2
18191 일반 갤 럭 시 = 찐 따 폰 임 선갤러(125.190) 06.21 16 0
18190 일반 클로드3.5는어느정도? [3] ㅂㄱ(112.71) 06.21 61 0
18189 일반 파웰 파흐니에프스키 "agi는 매우 임박" [8] 특술람갤로그로 이동합니다. 06.21 130 3
18188 일반 앤토픽도 보여주는데 멜론 마스크는 머하나여 ㅇㅅㅇ [1] 선갤러(122.36) 06.21 45 0
18187 일반 그래서 선형들이 어쩔건데? [2] 특술람갤로그로 이동합니다. 06.21 100 1
18186 일반 오 개꿀이닷 [4] 아몬드초콜릿갤로그로 이동합니다. 06.21 60 1
18185 일반 내 완몰가 남편들 [14] 아몬드초콜릿갤로그로 이동합니다. 06.21 115 1
18184 일반 곤충이나 동물에 [5] (61.105) 06.21 54 1
18183 정보글 AI 혁명, 저소득 노동자보다 고임금 전문직에 더 큰 위협 [2] 선갤러(175.207) 06.21 70 3
18182 일반 '코GPT' 개발 주도 김일두 카카오브레인 대표 퇴사 선갤러(223.39) 06.21 32 0
18181 일반 "기온 1℃ 오르면 농산물 물가상승률 0.4∼0.5%p↑" 선갤러(221.157) 06.21 27 0
18180 일반 부천사는 김씨 "오늘 저녁 피자로 결정" [2] ㅇㅇ(14.42) 06.21 128 19
18179 일반 첨단 AI의 안전성에 관한 국제 과학 보고서 [1] ㅇㅇ갤로그로 이동합니다. 06.21 37 1
18178 일반 특술람 웃기네 [2] 선갤러(121.133) 06.21 168 24
18177 일반 학자별 AGI 도래 시기 예측 [2] ㅇㅇ(118.235) 06.21 60 4
18176 정보글 손정의 "10년 내 초인공지능 실현…인간보다 1만배 똑똑" [10] 특술람갤로그로 이동합니다. 06.21 135 7
18175 일반 선형들 귀엽네 [8] 특술람갤로그로 이동합니다. 06.21 117 0
18174 일반 기하급수적으로 발전한다면서 선갤러(211.46) 06.21 40 3
18173 일반 내 시나리오로 가고있네 [7] 선갤러(211.46) 06.21 103 6
18172 일반 골대 옮기기 GOAT 선갤러(211.46) 06.21 78 11
18171 일반 특슬람 저능아 새끼들 언제까지 기다려야 하노 ㅇㅇ(106.101) 06.21 117 17
18170 일반 ClaudeAI, ChatGPT, Gemini 모두 코드를 이해하지 못함 [5] ㅇㅇ(106.101) 06.21 93 7
18169 일반 Claude 3.5 Sonnet 써봤음 ㅇㅇ(106.101) 06.21 55 0
18168 일반 mistral 7b는 arm기반 아키텍처에서 동작 가능? [1] 선갤러(121.133) 06.21 26 0
18167 정보글 MIT 연구진, 언어와 사고 담당 뇌 영역 별개임을 확인 [7] 선갤러(218.52) 06.21 160 14
18166 일반 기본소득은 몇년도에나옴?? [4] ㅇㅇ갤로그로 이동합니다. 06.21 40 0
18165 일반 25년정부터 [3] (61.105) 06.21 57 0
18164 일반 특이점 믿는 애들은 무당도 잘 믿을듯 ㄹㅇ ㅇㅇ(106.101) 06.21 54 10
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2