디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보글] KAN: 콜모고로프-아놀드 네트웍스

ㅇㅇ(125.191) 2024.05.01 11:52:09
조회 162 추천 0 댓글 0
														

https://arxiv.org/abs/2404.19756


Kolmogorov-Arnold 표현 정리에서 영감을 받아 KAN(Kolmogorov-Arnold 네트워크)을 MLP(다층 퍼셉트론)의 유망한 대안으로 제안합니다. MLP에는 노드("뉴런")에 고정된 활성화 기능이 있는 반면, KAN에는 에지("가중치")에 학습 가능한 활성화 기능이 있습니다. KAN에는 선형 가중치가 전혀 없습니다. 모든 가중치 매개변수는 스플라인으로 매개변수화된 일변량 함수로 대체됩니다. 우리는 겉으로는 단순해 보이는 이러한 변화로 인해 KAN이 정확성과 해석 가능성 측면에서 MLP보다 뛰어난 성능을 발휘한다는 것을 보여줍니다. 정확성을 위해 훨씬 작은 KAN은 데이터 피팅 및 PDE 해결에서 훨씬 더 큰 MLP와 비슷하거나 더 나은 정확도를 달성할 수 있습니다. 이론적으로나 경험적으로 KAN은 MLP보다 더 빠른 신경 확장 법칙을 가지고 있습니다. 해석 가능성을 위해 KAN은 직관적으로 시각화될 수 있으며 인간 사용자와 쉽게 상호 작용할 수 있습니다. 수학과 물리학의 두 가지 예를 통해 KAN은 과학자들이 수학과 물리 법칙을 (재)발견하는 데 도움을 주는 유용한 협력자임이 입증되었습니다. 요약하면, KAN은 MLP에 대한 유망한 대안으로, MLP에 크게 의존하는 오늘날의 딥 러닝 모델을 더욱 개선할 수 있는 기회를 열어줍니다.


최종 결론: KAN과 MLP 중 어떤 것을 사용해야 할까요? 현재 KAN의 가장 큰 걸림돌은 느린 학습 속도입니다. 동일한 수의 파라미터가 주어졌을 때, KAN은 일반적으로 MLP보다 10배 느립니다. 하지만 우리는 KAN의 효율성을 최적화하기 위해 많은 노력을 기울이지 않았다는 점을 솔직히 인정해야 합니다. 그래서 우리는 KAN의 느린 학습을 근본적인 한계라기보다는 향후 개선해야 할 공학적 문제로 간주합니다. 만약 여러분이 모델을 빠르게 학습시키고 싶다면, MLP를 사용해야 합니다. 하지만 다른 경우에는 KAN이 MLP와 비슷하거나 더 나을 수 있어 시도해 볼 만한 가치가 있습니다. 그림 6.1의 의사 결정 트리는 KAN을 사용해야 할 때를 결정하는 데 도움이 될 수 있습니다. 간단히 말해, 해석 가능성 및/또는 정확도를 중요하게 생각하고 느린 학습이 큰 문제가 되지 않는다면, KAN을 시도해 보는 것이 좋습니다.



0a90d425cbc31491369ef7b815c13473dee4ca44cd31650260b1a85725bda8


추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
16973 일반 선형충 [1] ㅇㅇ갤로그로 이동합니다. 05.19 43 1
16972 일반 진화로 역전파 대체하는 알고리즘만 만들면 끝임 [2] Moriae갤로그로 이동합니다. 05.19 66 1
16971 일반 진화로 역전파를 대체할 알고리즘을 만들어야함 [2] Moriae갤로그로 이동합니다. 05.19 40 0
16970 일반 진화가 역전파보다 학습속도가 느리다고 해도 Moriae갤로그로 이동합니다. 05.19 30 0
16969 일반 인공지능 만드는법 Moriae갤로그로 이동합니다. 05.19 40 0
16968 일반 역전파가 진화보다 열등한 이유 Moriae갤로그로 이동합니다. 05.19 48 0
16967 일반 가속하셈 [1] 선갤러(125.191) 05.18 75 1
16966 정보글 힌튼은 언어모델이 이해한다는 입장이셈 [1] 선갤러(125.191) 05.18 98 1
16965 정보글 로봇공학의 확장법칙 특술람갤로그로 이동합니다. 05.18 57 1
16964 일반 교육 뚝배기 초토화 시켜버리자!!! [5] ㅇㅇ(125.191) 05.18 101 1
16963 일반 이거맞음? [2] ㅇㅇ갤로그로 이동합니다. 05.18 83 0
16962 일반 [손실함수=적합도함수] 난 개천재야 씨발 ㅋㅋㅋㅋㅋㅋㅋㅋ [2] Moriae갤로그로 이동합니다. 05.18 99 0
16961 일반 역전파의 손실함수를 진화의 적합도함수로 써야함 Moriae갤로그로 이동합니다. 05.18 44 0
16960 일반 다른 방법 평가좀 Moriae갤로그로 이동합니다. 05.18 37 0
16959 일반 아시발... 결국 원래대로 돌아와버렸네 [1] Moriae갤로그로 이동합니다. 05.18 87 0
16958 일반 빨리 완몰가나와서 NPC들 다 가스실로 보내고싶다 ㅇㅇ(211.57) 05.18 46 0
16957 일반 좀더 일반화해봄 Moriae갤로그로 이동합니다. 05.18 41 0
16956 일반 진짜 혁신적인 인공지능 개발법 알아냈다 [4] Moriae갤로그로 이동합니다. 05.18 137 0
16955 일반 얼굴 바꾸는 프로그램 인안나갤로그로 이동합니다. 05.18 69 0
16954 일반 비난기사들 쏟아지네 [1] 선갤러(182.209) 05.18 144 2
16953 일반 여성 전용 기본소득은 음모론 아님 shuwa갤로그로 이동합니다. 05.18 102 1
16952 일반 특갤 보니깐 나중에 규제 얼마나 심해질지 두려움 [1] shuwa갤로그로 이동합니다. 05.18 124 0
16951 정보글 크리스티안 세게디 "진정하셈" [4] 특술람갤로그로 이동합니다. 05.18 134 2
16950 정보글 선다피차이 "우리는 모델을 80배 더 효율적으로 만들었다" [1] 특술람갤로그로 이동합니다. 05.18 103 0
16949 일반 스스로도 구하지 못한 정렬팀 [1] 특술람갤로그로 이동합니다. 05.18 76 0
16948 일반 우한 연구소에 코로나 연구 자금을 지원한 미국 정부 shuwa갤로그로 이동합니다. 05.18 56 0
16947 일반 얘들은 아직도 이러고 있네. 날씨 좋은 주말인데. [3] 병신®갤로그로 이동합니다. 05.18 123 8
16946 일반 알 유 레디 포 제 뉴 월드 오더 ㅇㅅㅇ 선갤러(122.36) 05.18 50 0
16945 일반 윤석열 15분도시 시동 거네 shuwa갤로그로 이동합니다. 05.18 82 0
16944 일반 룬붕이 "논스톱 딜레마" 특술람갤로그로 이동합니다. 05.18 59 0
16943 일반 세상이 특갤말대로 안 흘러가는 이유 ㅇㅅㅇ [1] 선갤러(122.36) 05.18 115 1
16942 일반 결국 전유물 시나리오가 확정이네? [5] 선갤러(223.38) 05.18 120 3
16941 정보글 맥스 테그마크 "AI는 훈련받지 않은 질문 일반화 답변 가능" 특술람갤로그로 이동합니다. 05.18 80 5
16940 일반 마틴 식칼쭝쭝이 ㅈㄴ 웃기네여 ㅇㅅㅇ [1] 선갤러(122.36) 05.18 70 1
16939 일반 룬붕이 삭제 된 트윗 [1] 특술람갤로그로 이동합니다. 05.18 90 2
16938 일반 특붕이들은 기억나셈?? 특술람갤로그로 이동합니다. 05.18 68 1
16937 정보글 제프리힌튼 "일리야 셔츠케버가 옳았다" 특술람갤로그로 이동합니다. 05.18 89 4
16936 정보글 Gemini 0521 특술람갤로그로 이동합니다. 05.18 56 0
16935 일반 특갤 부패 또 완장짓하네 [4] 선갤러(218.153) 05.18 151 5
16934 정보글 Gemini 1.5 pro 성능개선 특술람갤로그로 이동합니다. 05.18 93 7
16933 일반 많은생각이드는짤 (61.105) 05.18 90 0
16932 일반 어차피 기후위기로 망함 ㅅㄱ<<<ㅂㅅ같은 점 [1] ㅇㅇ(211.234) 05.18 90 4
16930 정보글 삼성XR 헤드셋에 구글 AI 비서 장착 삼성 VR AR XR 생태계 구축 ㅇㅇ(222.234) 05.18 183 6
16929 일반 LLM 제일 빡치는 점 [2] e/linear갤로그로 이동합니다. 05.17 104 1
16928 일반 AI 안전은 선동에 불과함 [1] 선갤러(112.167) 05.17 113 0
16927 일반 GPT-4o는 에이전트 따까리 모델임 e/linear갤로그로 이동합니다. 05.17 65 0
16926 일반 병신들 gpt3 때 한소리 치매걸린것처럼 또 하네 ㅇㅇ(202.182) 05.17 90 4
16925 일반 모든학자들이 2040년 안에 초인공지능 온다함 나디갤로그로 이동합니다. 05.17 105 1
16924 일반 요즘 네이버 언플하지만 국내는 답이없음 [1] 선갤러(143.244) 05.17 115 4
16923 일반 GPT-4o가 AGI다 [3] ㅇㅇ(118.235) 05.17 161 2
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2