디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 특이점 접은동안 라마3 나왔구나

선갤러(66.115) 2024.04.27 09:42:36
조회 123 추천 3 댓글 1
														

특이점 맨날 할때는 라마3 조오오오오오온나 기대하고 그랬는데


신경 안쓰며서 살다가 나오고 나서 확인하니 파급효과 그런건 없네


다만 성능적으로 라마3가 적은파라미터로 라마2보다 개선된건 맞는듯


라마2 70 > 라마3 8 > 라마2 13


다만 라마2 처음나왔을때보다 뽕이 덜할수 밖에 없는게


그땐 라마2 70 을 돌리려면 1천만원이상 깨졌음 깔끔하게 글카메모리 140기가 필요했거든


어지간한 특이점에 미친 컴덕이라도 프로그램 하나 돌려보려고 취미에 1천을 태우는 사람은 손에 꼽아서


몇몇 선동에 놀아났는데



그동안 상황이 많이 달라져서 이젠 누구나 저렴하게(상대적으로) 찍먹이 가능하게 됨


1. 모델 양자화 기술이 개발돼서, 모델 성능을 좀 떨어뜨리면서 훨씬 적은 용량으로 초대형 모델을 돌릴 수 있게 됨


대충 70b 모델같은거 썡으로 그래픽 메모리 140기가 말고 그 반타작인 70기가(64기가~80기가) 로 어거지로 돌리면서 성능저하는 10% 내외 수준

뭐 이런식으로 돌리는게 가능해짐 (성능저하 더 감안하고 더 작은 메모리에서도 실행 가능)


2. apu통합메모리 활용으로 더욱 더 저렴하게 대형 모델 로딩 가능해짐 


MAC이나 내장글카 달린 apu들은 cpu/gpu가 콘솔처럼 램을 공유함


그래서 gpu gddr 메모리로 수십 수백기가 맞추는 비용대비 훨씬 저렴하게 메모리 용량 확보가 가능한데


이걸 이용해서 마치 gpu메모리가 그만큼 있는것처럼 응용해서 대형모델 썡으로 돌리는 기술이 발전함


3. 아예 일반램+글카램 통합 하이브리드로 대형모델 올리는 기술까지 나옴


까놓고 말해서 일반인도 DDR5 48GB 풀뱅으로 192기가 확보하고, 글카 대충 젤 싸구려 4060 8G 달아주면


마치 메모리 200기가 인것처럼 라마3 70B 통쨰로 돌릴 수 있음



단지 순수 브렘만으로 140기가 이상 확보해서 돌리는것보다 한 5배정도 느릴뿐


다만 답변 속도만 느릴뿐이라, 긴 장문 질문하고 6초만에 답변해주느냐, 30초뒤에 답변해주느냐 시간차이일 뿐이라


답변의 퀄리티는 누구나 이제 확인 가능해서, 금방 결과물이 까발려




요약: 

라마2때는 70b 돌려보려면 장비빨에 1000만원 이상 태울 수 있는 극소수만 가능해서 그놈들이 선동 존나 해댔었음.

라마3는 각종 소프트웨어적인 기술의 발전으로 훨씬 저렴하게 한 200만원 정도 태우면 집에서 개인이 라마3 70b 돌릴 수 있어져서

많은사람들이 실체를 알 수 있어서 뻥카가 잘 안먹히고 금방 열기가 식어버림


그럼 개인pc에 천만원 이상 태운놈들 요즘은 또 뭘로 선동하고 다니냐면? 70b 위에는 140b 200b 400b 짜리들도 있음. 이것들은 여전히 돌려보려면 수천만원 깨짐

저걸로 또 개같이 선동하고 다님 존나 좋다면서

추천 비추천

3

고정닉 1

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
16496 일반 장애인을 전부 없애자! YOMI갤로그로 이동합니다. 04:33 16 1
16495 정보글 구글, ‘알파폴드3’ 네이처에 공개…정확도 1.5배, DNA까지 분석 ㅇㅇ(125.191) 00:46 38 0
16493 정보글 알파폴드3 발표 [1] 선갤러(125.191) 00:12 59 3
16491 일반 대부분은 특이점에 부정적일수밖에없음 [18] ㅇㅇ(212.102) 05.08 116 0
16490 정보글 업무용 AI가 여기에 있습니다 선갤러(125.191) 05.08 24 0
16489 정보글 샘 알트만 "gpt4 경제적 영향 실패로 미래모델 변화 과소평가 우려" 선갤러(125.191) 05.08 46 1
16488 일반 출산가구에 페널티를 부여해야 함 ㅇㅇ(125.191) 05.08 34 2
16487 정보글 OpenAI 로건이 구글로 떠난 이유 ㅇㅇ(125.191) 05.08 45 0
16486 일반 cern의 입자가속기와 악마 소환 포탈 shuwa갤로그로 이동합니다. 05.08 32 0
16485 일반 세상은 수학으로 이루어져 있다 ㅇㅇ갤로그로 이동합니다. 05.08 34 2
16484 일반 특슬람들의 골대 옮기기 [1] 선갤러(103.107) 05.08 78 9
16483 일반 지금 떡밥도는 GPT2가 얼마나 대단한거임? [3] ㅇㅇ(180.224) 05.08 77 0
16482 일반 중국도 대단하긴 해 [1] 인안나갤로그로 이동합니다. 05.08 43 1
16481 일반 딥스 = e/acc ㅇㅅㅇ [1] 선갤러(122.36) 05.08 36 0
16480 일반 딥스 머장 블랙록 ceo 피셜로 저출산 오히려 좋다네여 ㅇㅅㅇ [1] 선갤러(122.36) 05.08 65 2
16479 일반 구글 i/o 부수는 gpt2 선갤러(125.191) 05.08 34 0
16478 일반 일자리 잃고 복지 외치면서 드러눕자가 쟤들으 실체. [2] 병신®갤로그로 이동합니다. 05.08 54 1
16477 일반 특이점이온다 오픈채팅방 [1] 이이으갤로그로 이동합니다. 05.08 37 1
16476 일반 세상은 선형도, 지수함수도 아니라 [3] ㅇㅇ(220.116) 05.08 81 0
16475 일반 gpt2 온디바이스 모델이면 [3] 선갤러(125.191) 05.08 69 0
16474 일반 agi가 2100년에 오는 합리적인 이유 ㅇㅅㅇ [3] 선갤러(122.36) 05.08 72 0
16473 일반 ai가 아직까지도 사업투자용 아이템이란 생각이 끊이질 않는다 [1] ㅇㅇ(220.116) 05.08 45 1
16472 일반 내일 선다피차이 인터뷰 함 선갤러(125.191) 05.08 40 0
16471 일반 안녕하세여 ㅇㅅㅇ [3] 선갤러(122.36) 05.08 56 1
16470 일반 OAI 최고운영책임자 "챗GPT는 12개월 내에 우스꽝스러울 것임" [2] 선갤러(220.73) 05.08 102 0
16469 일반 OpenAI 차기 모델 파이프라인 예정 [1] 선갤러(220.73) 05.08 49 3
16468 일반 MS, 매개변수 5000억개 오픈 소스 최대 규모 LLM 공개 예정 [2] ㅇㅇ갤로그로 이동합니다. 05.08 29 1
16466 일반 특슬람 병신들 오늘도 설레발 존나 치고 있으셈 ㅋㅋ [2] ㅇㅇ(221.166) 05.08 93 4
16465 일반 우리는 지금 폭풍전야 속에 있으셈 [6] 선갤러(125.191) 05.08 93 1
16464 일반 OpenAI 본인들부터가 LLM 한계 제일 잘 알 거라서 [1] ㅇㅇ(120.142) 05.08 63 0
16463 일반 지금 agi 레벨2 되기에 부족한게뭐임?? [6] ㅇㅇ갤로그로 이동합니다. 05.08 92 2
16462 정보글 xLSTM: 확장된 장단기 메모리 ㅇㅇ(125.191) 05.08 49 3
16461 일반 AGI가 뭔진 논쟁이 많지만 GPT-5부터 본격적인 일자리 대체 시작될듯 [2] ㅇㅇ(120.142) 05.08 83 2
16460 일반 중국에서 만들고 있는 휴머노이드 로봇 선갤러(125.191) 05.08 56 1
16459 일반 와ㅋㅋㅋㅋ [1] 리구갤로그로 이동합니다. 05.08 75 0
16458 일반 선형충들은 모름 [8] 선갤러(125.191) 05.08 103 1
16457 일반 Gpt5나오면서 사회에 어떤변화가올것같음?? [3] ㅇㅇ갤로그로 이동합니다. 05.08 64 1
16456 일반 LLM 때문에 AGI가 더 늦춰질 가능성 [2] 선갤러(103.107) 05.08 73 4
16455 일반 ㅜㅜ [5] ㅇㅇ갤로그로 이동합니다. 05.08 78 2
16452 정보글 메타 연구원 4배 효율성 달성하는 레시피 공개예정 [2] ㅇㅇ(125.191) 05.08 82 1
16451 정보글 openai 행사 월요일로 연기 [6] ㅇㅇ(125.191) 05.08 112 0
16450 일반 Gpt5가 예상대로 안나오면어떡함 [1] ㅇㅇ갤로그로 이동합니다. 05.08 69 1
16449 일반 GPT2의 정체는 이거일듯 [5] 선갤러(103.107) 05.08 266 15
16448 일반 간혹 국내 개발자들 보면 ㅇㅇ(125.191) 05.08 89 0
16447 정보글 에릭 슈미트 "AI는 과대평가가 아니라 과소평가 되고 있다" [2] ㅇㅇ(125.191) 05.08 147 3
16446 정보글 데이터와 AI에 대한 우리의 접근 방식 ㅇㅇ(125.191) 05.08 38 0
16445 정보글 openai 우리가 온라인에서 보고 듣는 것의 출처 이해하기 선갤러(125.191) 05.07 51 0
16444 일반 역시 특갤 오랜만에 흥하니까 [2] ㅇㅇ(112.186) 05.07 136 4
16443 일반 삼성 이재용 신약개발 가속화 미국 바이오 큰손 플래그십과 바이오허브 구축 ㅇㅇ(222.234) 05.07 56 2
16442 일반 gpt 4.5로 1억 개의 일자리를 파괴하면 [5] 선갤러(125.191) 05.07 118 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2