디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] AI는 이해를 하는가

ㅇㅇ(175.206) 2024.04.23 21:35:38
조회 186 추천 3 댓글 2
														

다만, AI의 방식이 인간과는 다르다는 건 명확하고, 여전히 이해라는 측면에서 한참 모자란 건 맞는 듯.

하지만, 특갤에서 지난 1년동안 수없이 말 나왔다가 격추 되어 온 '통계 앵무새'냐에 대해선, 개인적으로 반대함.


https://www.youtube.com/watch?v=Z9SL2ygm2Sc

 


짐 켈러가 1년 반전에 스탠포드에서 강연했던 영상임.


물론 1년 반이면 엄청 바뀐 것도 많고, 짐 켈러도 '아 지금 생각 해보니 아님ㅎㅎㅋㅋㅈㅅ;;' 했을 수도 있겠지만


당시 발언 중 인상 깊었던 말이 하나 있었음.



7cf3c028e2f206a26d81f6e44083706eb2


7ff3c028e2f206a26d81f6e44389746940


우리가 이해라고 부르는 것은


지식의 총합이 아니라


정보들의 관계의 총합이다.


---------------------------------------------


예를 들어서, 사과에 대한 지식. 즉 백과사전 같은 데이터만 잔뜩 있는 건 이해의 영역이라고 할 수 없음.


하지만, 사과라는 단어가 '먹는 것'에 가깝고, '식물' 혹은 '과일' 단어들과 가깝고, 건축, 스포츠 등의 단어나 문장들과는 멀다는 걸


컴퓨터 혹은 AI가 '알고' 있다면, 이건 이해에 한층 가까워진 거라고 생각함.


그런데 현재 AI 들은 어떤가.


요즘 이상하게 LLM 폄하가 다시 특갤의 지배적인 정서가 되는 것 같고

(르쿤형이 지지 받아서 그런 것 같다. 개인적으로 좋아하지만 이 형이 힘을 얻으면 갤 분위기 박살남)


AI 전혀 모르는 분들도 그냥 LLM이 통계모델이다. 확률 앵무새다. 라는 말에 혹하시는 것 같은데...


나도 전공자도 뭣도 아니지만, 가볍게 공부한 내용을 전달해보면.



언어모델. NLP 역사에서 최초로 등장했던 모델들은 진짜 확률 앵무새였음.


학습 데이터들에서 A 단어 뒤에 B 단어가 올 확률이 80%인지 50% 인지 전부 학습하고 실행시킴.


그럼 당연히 문장은 만들어지지만, 끔찍한 수준이 됨.


그 다음으로 등장한 건 word2vec이라는 애들이었음. 얘네도 단어를 학습하긴 하는데, 위 모델보다 훨씬 디테일하게 정보를 저장한다고 보면 됨.


물론, 바로 뒤 단어만이 아니라, 주변 단어를 학습하기도 하고.


word2vec이라는 단어에서도 알 수 있지만, 단어 정보를 vector에 저장함. 벡터는 그냥 수많은 숫자 덩어리라고 생각해도 되고.


즉, 단어 하나를 수많은 숫자로 그 특징들을 저장하는거지.


이랬더니 나름 재밌는 현상들이 나타났는데.


서울이라는 단어의 벡터에서, 한국 벡터를 빼고

(숫자들끼리니까 더하고 뺄 수 있음)


일본 벡터를 넣으면, 도쿄 벡터가 나온거임.


물론, 한국 빼고, 미국을 넣으면 워싱....턴이 나올 지 뉴욕이 나올지는 모름. 어떤 데이터를 학습 했냐에 따라 다르겠지. 어쨌든.


단순하게 확률을 내뱉는 게 아니라, 단어간의 관계를 어느정도 학습한 상태라고 보면 됨.


왕과 왕비의 관계가, 남편과 아내의 관계와 비슷하다는 것도 이해 했다고 할 수 있을 듯. 물론 인간의 이해와는 다르고, 그냥 알고 있다고 치자.



그리고, 현재 LLM을 주도하고 있는 트랜스포머 애들은 이 다음 단계임.


얘네는, 전공자 아니니까 무식하게 말하면, word2vec보다 병렬연산 되는 것도 컸고(그래야 학습 되니까) 무엇보다 문맥을 통째로 집어넣어서 문맥 학습이 됐음.


즉 단어의 정보만이 아니라, 문맥 정보도 학습하는거임.


많이 개선된거지.


그렇다고 얘가 이해를 하냐. AGI가 되냐. 지능이 있냐.


이건 나도 아니라고 봄. 그렇다고 하는 사람도 솔직히 없고.


하지만, 인류 역사에서 만들어낸 인공적인 지능 중에선 가장 그럴듯하다고 생각함.


얘가 AGI 혹은 스스로 사고하고 개선하는 수준까지 도달할 수 있는 진 모르겠지만, 실마리는 보여줬다고 생각한다.



-----------------------


물론 르쿤형 말처럼, 이걸로만 봐도 LLM은 학습 데이터가 너무 많이 필요하기도 하고, 가성비도 안 좋음.


인간의 방식을 이해하고 여기서 실마리를 찾아내서 구현한다면, 밥 한공기의 에너지만으로도 리만가설 증명하는 인공지능도 만들어낼 수 있겠지.


하지만, 지금 LLM이 단순하게 확률 앵무새냐. 이해를 하나도 못 하고 아무 말이나 내뱉는 애냐.


이건 아니라고 생각함.


우리가 이해라고 부르는 것은

지식의 총합이 아니라

정보들의 관계의 총합이다.


완벽하지 않고, 가성비가 낮아서 그렇지, 분명 정보들의 관계 총합에 다가서고 있다고 생각함.


원래, GPT가 쩔게 나오면 칭찬 일색이고, 구려지면 AI겨울 타령하는 게 특갤이고, 나도 그러고 놀긴 하는데.


요즘은 openAI가 잠잠하고, 르쿤형이 조금 힘 받으니까


진지하게 LLM 폄하하고, AI 폄하하는 글들이 보이는 것 같은데....뭐 각자 생각이니까. 근데 개인적으론 크게 동의하지 않는다는 말을 하고 싶었음.



결론은 뭐다?


GPT5 빨리 안 내놓은 알트만이 문제다.


ps. 비전공자가 아무 헛소리나 내뱉은 거니까 문제 제기시, 당연히 네가 옳습니다.

자동등록방지

추천 비추천

3

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
471767 일반 음성모드 어케써? [3] ㅇㅇ갤로그로 이동합니다. 05.14 91 0
471766 일반 업계 반응 떴다 [2] 디붕이(121.190) 05.14 312 0
471765 일반 4o 무료라는애들잇는데 뭐가진짜임? [9] ㅇㅇ갤로그로 이동합니다. 05.14 339 0
471764 일반 결국 llm의 한계만 알게된거임 [6] ㅇㅇ(211.46) 05.14 228 0
471763 일반 gpt3 -> 3.5 수준 능지 개선은 기대했는데 ㅇㅇ(39.123) 05.14 85 0
471761 일반 성능에 화난 애들 <<< 정상임 [2] ㅇㅇ갤로그로 이동합니다. 05.14 182 3
471760 일반 지금 성능에 만족하는 새끼들은 시발 [2] ㅇㅇ갤로그로 이동합니다. 05.14 114 1
471759 일반 오늘 발표로 '하... LLM발전 멈췄구나' 하는 놈들 [1] ㅇㅇ(163.152) 05.14 180 0
471758 일반 해뜨니까 선형충새끼들 기어나왔네 [3] ㅇㅇ갤로그로 이동합니다. 05.14 79 0
471757 일반 음성 빨리 나와라 제발 [2] ㅇㅇ(121.189) 05.14 66 0
471756 일반 개인적으로 대단하다고 느꼈던 점 [6] ㅇㅇ(175.206) 05.14 314 6
471755 일반 4o가 개쩌는게 맞긴함 [1] ㅇㅇ(222.96) 05.14 175 0
471754 일반 속도는 당연히 피크 타임에는 좀 느려지긴 하겠지 ㅇㅇ(218.154) 05.14 34 0
471750 일반 이런 거 보니 search gpt 내놨으면 ㅇㅇ(163.152) 05.14 53 0
471749 일반 보여준거 다 고점으로 평가하면 나름 쩌는게 맞는듯 [6] Zoltraak갤로그로 이동합니다. 05.14 113 0
471748 일반 아... AGI 안왔네 프리먼갤로그로 이동합니다. 05.14 63 0
471747 일반 아니 ㅋㅋㅋ AI가 실시간으로 대화하면서 노래부르는걸 보고도 ㅋㅋㅋ [2] ㅇㅇ(121.143) 05.14 134 0
471745 일반 이 시각 유일하게 좆된 애들 [1] ㅇㅇ갤로그로 이동합니다. 05.14 200 0
471744 일반 이제 gpt 능지만 올릴 수 있으면 되겠군 ㅇㅇ갤로그로 이동합니다. 05.14 24 0
471743 일반 알트만이 신기할정도로 꿈같은놈이긴 함 [2] ㅇㅇ(121.131) 05.14 100 0
471742 일반 당연히 A2A 좆도 못느끼지 ㅋㅋㅋㅋㅋ [2] ㅇㅇ갤로그로 이동합니다. 05.14 111 0
471741 일반 실시간 통역 어케 쓰는거임 [4] ㅇㅇ갤로그로 이동합니다. 05.14 117 0
471740 일반 이미지 읽는 거 너무 좋ㄷ ㅏㅠㅠㅠ [1] ㅇㅇ갤로그로 이동합니다. 05.14 97 0
471739 일반 결국 백수인 나의 승리네ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [4] ㅇㅇ(1.243) 05.14 192 1
471738 일반 나 간호산데 [1] ㅇㅇ갤로그로 이동합니다. 05.14 88 0
471737 일반 챗 gpt api중에 완전 무료 모델도 있음? [4] ㅇㅇ(175.196) 05.14 167 0
471734 일반 오늘 발표로 2027 agi 순조롭네 ㅇㅇ(125.136) 05.14 76 0
471733 일반 4만토큰에 0.37달러임 [3] 디붕이(121.190) 05.14 180 1
471732 일반 형들 이미지 올리면 분석도됨 ? ㅇㅇ(118.38) 05.14 25 0
471731 일반 특이점 뜻도 모르는 애들 많네 ㅋㅋ [29] ㅇㅇ(39.123) 05.14 295 0
471729 일반 ㅅ발 개쩐다는 놈들은 유입이냐 [7] ㅇㅇ(222.236) 05.14 217 1
471728 일반 뭐가 대단한지 이유를 설명해줄게 [8] ㅇㅇ(118.36) 05.14 444 12
471727 일반 특이점 2028년에 안 1옴 ㅇㅇ갤로그로 이동합니다. 05.14 52 0
471726 일반 오픈AI도 실시간 대화용으로는 4o가 최선이긴 하겠다 ㅇㅇ(120.142) 05.14 83 0
471724 일반 오픈ai=블리자드 [1] ㅇㅇ(220.83) 05.14 103 0
471723 일반 사실 ai성능이 독보적으로 나아지지않으면 ㅇㅇ(222.120) 05.14 110 0
471722 일반 털드만 이 새끼가 무서운게 구글 엿먹이길 잘함 ㅇㅇ갤로그로 이동합니다. 05.14 74 0
471721 일반 지금 옴니가 그리는 그림, 목소리는 [1] ㅇㅇ(114.202) 05.14 90 2
471719 일반 4o 코딩 어떰? [4] ㅇㅇ갤로그로 이동합니다. 05.14 208 0
471717 일반 gpt-4o 무료면 유료로 쓰고 있는 사람들은..? [6] ㅇㅇ갤로그로 이동합니다. 05.14 419 0
471716 일반 라이브 데모에 안 나온 또 하나의 핵심 - 비전/그림 업그레이드 [3] Bqbq갤로그로 이동합니다. 05.14 263 8
471715 일반 알트만이 그냥 GPT-5 나올 때까지 기능 감질나게 하나씩 푸는 거네 ㅇㅇ(120.142) 05.14 93 0
471714 일반 Audio To Audio 1도 의미 없는 이유 [3] ㅇㅇ(210.95) 05.14 190 0
471713 일반 근데 진짜 속도는 너무 빠르지 않냐? [3] ㅇㅇ(218.154) 05.14 184 3
471712 일반 근데 작년 제미니 과대광고랑 비슷해서 [1] ㅇㅇ(222.120) 05.14 133 0
471710 일반 개쩐다는 애들 정체를 생각해봤는데 [4] ㅇㅇ(39.123) 05.14 236 0
471709 일반 반응 나뉘는것도 당연하지 [1] ㅇㅇ갤로그로 이동합니다. 05.14 106 0
471708 정보/ 지금 풀린 4o는 기능적으로 한정되어있음 [3] ㅇㅇ(114.202) 05.14 280 1
471707 일반 비전 기능 어케 쓰는거임? [2] ㅇㅇ(39.117) 05.14 83 0
471706 일반 4o가 고비 같다는 거 보면 소문대로인 거 아닌가 [1] ㅇㅇ(120.142) 05.14 184 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2