디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] “자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴

ㅇㅇ(182.230) 2024.04.22 19:12:07
조회 241 추천 3 댓글 5
														

https://www.aitimes.com/news/articleView.html?idxno=158993

 



7ce8887fbc8107f739ee87ed44ee766a7c6c989c2774c6784e7a0f3e926394b918b3



'챗GPT'나 '라마 2'와 같은 대형언어모델(LLM) 기반 인공지능(AI) 서비스를 제공하는 비용이 월 5400달러(약 750만원) 수준인 것으로 나타났다. 이는 독자적으로 구축한 LLM을 자체 호스팅하는 비용보다 저렴한 것이다.


벤처비트는 21일(현지시간) 기업이 LLM 기반의 AI 서비스를 제공하는 데 드는 비용을 공개했다.


이에 따르면 이 비용은 기업이 🔼오픈AI의 챗GPT를 기반으로 한 서비스 🔼클라우드의 오픈 소스 LLM을 기반으로 한 서비스 🔼자체 LLM을 기반으로 한 서비스에 따라 차이가 있다.


먼저 아마존웹서비스(AWS)에서 지원하는 70억(7B) 매개변수의 오픈 소스 라마 2를 기반 모델로 사용할 경우, 라마 2가 매개변수당 2 바이트를 소비하는 BFLOAT16을 사용해 훈련했기 때문에 모델 크기는 140기가바이트(GB)가 된다.


만약 로라(LoRA)를 사용하면 0.1%에 해당하는 7000만 매개변수만 조정할 수 있기 때문에 미세조정에는 0.14GB를 소비한다. 여기에 미세조정 중에 역전파, 활성화 저장, 데이터 세트 저장 등의 메모리 오버헤드를 수용하려면 훈련 가능한 매개변수가 소비하는 것보다 최대 5배 더 많은 0.7GB의 메모리 공간을 유지하는 것이 좋다. 즉, 미세조정 총 용량은 141GB다.


AWS EC2 온디맨드 가격을 기준으로 시간당 2.8달러인 컴퓨팅 비용에 따라 미세조정에 소요되는 비용은 하루 67달러다. 미세조정은 며칠 동안 지속되지 않기 때문에 큰 비용은 아니다.


또 모델을 배포할 때는 140GB의 메모리를 소비하는 모델 가중치와 0.14GB의 메모리를 소비하는 로라 미세조정 가중치를 저장할 140.14GB의 추가 메모리가 필요하다. 오버헤드를 고려하면 약 1.5배 약 210GB 메모리를 유지하는 것이 좋다.


AWS EC2 온디맨드 가격을 기준으로 하면 GPU 컴퓨팅 비용은 시간당 3.70달러다. 모델을 메모리에 로드한 상태로 유지하고 들어오는 요청에 응답하는 데 드는 비용이 하루 90달러이며, 매월 약 2700달러의 비용이 든다.


첫번째 모델에서 요청이 실패할 경우를 대비한 이중화를 고려하면 비용은 하루 180달러, 월 5400달러가 된다.


이는 일반적으로오픈 소스보다 훨씬 비싸다고 여겨졌던 오픈AI의 'GPT-3.5 터보'를 사용할 경우와 비슷하다.


오픈AI의 가격을 기준으로 GPT-3.5 터보 미세조정 비용은 1000토큰당 0.008달러다.


대부분 단어가 토큰2개로 이뤄졌다고 가정하면, 오픈 소스 라마 2 70B 모델의 일일 미세조정 비용 67달러에 맞추면 오픈AI 모델에는 약 415만 단어를 제공할 수 있다. 이는 A4 페이지의 평균 단어 수를 300개로가정하면 최대 1만4000페이지 분량의 데이터를 모델에 제공할 수 있다는 설명이다. 미세조정 데이터가 많지 않을 가능성이 높기 때문에 오픈AI를 사용하면 미세조정 비용은 오히려 저렴해진다.


AWS와 달리 오픈AI는 미세조정 비용이 훈련 시간이 아니라, 미세조정 데이터의 양에 따라 책정된다. 평균 1000토큰당 0.004달러로 계산하면, 하루 180달러의 비용으로 API를 통해 매일 2220만 단어를 보낼 수 있다.


이는 7만4000페이지 이상의 데이터이며 각 페이지당 300단어에 해당하는 비교적 큰 수치로, AWS보다 1시간 동안 더 많은 양을 처리할 수 있다. 게다가 오픈AI는 종량제 가격이기 때문에 사용한 만큼만 비용을 지불한다.


다만 오픈AI의 경우는 일일 사용한도가 있어 이를 초과하면 서비스가 예고없이 중단될 수 있다. 해결 방법은 사용 제한을 늘려 서비스를 활성화시키는 것이다.


반면 독자적인 모델을 기반으로 자체 호스팅 서비스를 제공할 경우, 비용은 인력 및 유지 관리와 같은 추가 비용으로 인해 총 비용이 20만~25만달러(약 2억8000~3억5000원)로 크게 증가할 수 있다.


물론 처음부터 독자적인 모델을 소유하면 데이터 및 사용량에 대한 통제력을 유지하는 등의 이점이 있지만, 자체 호스팅을 실행 가능하게 만들려면 인력 및 물류를 관리하기 위한 리소스와 함께 하루 최대 2220만 단어를 훨씬 초과하는 사용자 요청 로드가 필요하다.


아비 차왈라 AI포트 데이터 과학자이자 제작자는 "결론적으로 API를 사용하는 대신, 독자 모델을 소유하는 것이 대부분의 경우 재정적으로 이익이 될 가능성은 거의 없다"라고 지적했다.


자동등록방지

추천 비추천

3

고정닉 1

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
474277 일반 앱등이 형님들이 유입되면 OAI도 떼돈벌지 [1] 도서관킬러갤로그로 이동합니다. 05.15 60 0
474276 일반 몇십년 후 그래프를 보면 '어? 뭔가 바꼈나봐' [2] ㅇㅇ(121.140) 05.15 150 1
474275 일반 오늘부터 건강관리와 소득 늘리는거 두개에 올인한다. [3] ㅇㅇ(122.34) 05.15 109 0
474274 일반 이번 인터뷰 보니깐 바로 알겠네 [2] ㅇㅇ(119.193) 05.15 240 2
474273 일반 알트만 인터뷰에서 가장 중요한거 [10] ㅇㅇ(117.20) 05.15 331 1
474272 일반 nft 메타버스 ai 레츠고! ㅇㅇ(119.193) 05.15 34 0
474271 일반 역시 애플이야 돈냄새는 [2] ㅇㅇ갤로그로 이동합니다. 05.15 151 0
474269 일반 몇십년후 그래프를 보면 뭔가 바뀌어있을거다?? [2] 거더라갤로그로 이동합니다. 05.15 123 0
474268 일반 gpt 4o 어캐 적용함 질문봇갤로그로 이동합니다. 05.15 59 0
474267 일반 알트만 인터뷰 보니까 모델은 자주 여러개 발표할거같네 [5] ㅇㅇ(121.131) 05.15 234 0
474266 일반 ChatGPT에 VPN 쓸 수 있음? Ad_Astra갤로그로 이동합니다. 05.15 44 0
474265 일반 씨발 일리야 왜떠남? [4] ㅇㅇ(106.101) 05.15 263 0
474264 일반 tpu가 진짜 성능 좋긴 한거 맞아? [4] ㅇㅇ갤로그로 이동합니다. 05.15 114 0
474263 일반 갤럭시 gos 터지고 좆같아서 싹 애플로 넘어갔는데 ㅇㅇ(121.154) 05.15 162 0
474262 일반 로컬형님들이 맥을 추론용으로 많이 사용하는 이유 디붕이(121.190) 05.15 117 0
474261 일반 구글 라이브의 의의 [1] Samus갤로그로 이동합니다. 05.15 171 1
474260 일반 지갤떡뭐 [2] ㅇㅇ(211.235) 05.15 55 0
474259 일반 구글 발표회는 액침냉각 TPU 6세대 출시말고는 뭐 없는건가 ㅇㅇ­갤로그로 이동합니다. 05.15 62 0
474258 일반 특이점 오면 쉽게 핑크빛 [1] ㅇㅇ갤로그로 이동합니다. 05.15 91 0
474256 일반 다른 사람 목소리 학습시키는 ai는 보통 뭐씀? [2] 직캠러(220.120) 05.15 79 1
474255 일반 새로운 CSO 폴란드 사람 같네 ㅇㅇ(1.235) 05.15 40 0
474254 일반 사만다 해금되면 연예 코치도 해주는 거냐? [1] 내복맨갤로그로 이동합니다. 05.15 47 0
474252 일반 애플이 똑똑한게 아니라 이제 걍 하청기업 되는거 아니냐? [2] ㅇㅇ(122.43) 05.15 124 0
474251 일반 Sam Altman 오늘자 인터뷰 요약 [42] ㅇㅇ(58.123) 05.15 5515 59
474250 일반 데이터 ai쪽으로 대학원온게 정말 다행이다 [3] ㅇㅇ(122.43) 05.15 205 0
474249 일반 일리야 oai 나갔구나 [2] ㅇㅇ­갤로그로 이동합니다. 05.15 146 0
474248 일반 메모리 기능 맛있네 ㄹㅇ [11] 도서관킬러갤로그로 이동합니다. 05.15 370 0
474246 일반 미용학원 상담받았더니 Ai대체된다고 헤어나 하란소리들음 [4] ㅇㅇ(14.50) 05.15 137 0
474245 일반 Gpt. 메모리는못쓰게하냐 [2] 연맛갤로그로 이동합니다. 05.15 118 0
474244 일반 4o 무료 출시하면 3.5는 사라질려나? [1] 소노자키갤로그로 이동합니다. 05.15 165 0
474242 일반 OA 개같이 패줘 [1] Singnice갤로그로 이동합니다. 05.15 151 0
474241 일반 그래서 지금 특이점 정배 몇년? [8] ㅇㅇ(103.138) 05.15 184 0
474240 일반 openai가 일본 대우해주는거 맞음 [4] ㅇㅇ(122.43) 05.15 252 0
474239 일반 솔직히 까놓고 사진 맞추기 놀이 밖에 더있나? [16] ㅇㅇ(117.20) 05.15 260 2
474238 일반 지옥에서 외치는 선형충들의 절규 [1] ㅇㅇ(14.55) 05.15 142 1
474237 일반 구글 보니까 애플이 눈치가 빨랐던거 같네 [1] ㅇㅇ(121.131) 05.15 269 0
474236 일반 vpn 끄니까 바로 메모리기능 사라지네 ㅋㅋㅋ [2] 캬르룩갤로그로 이동합니다. 05.15 218 0
474235 일반 4o가 갤주 신간도 번역해줄거야 ㅇㅇ(121.131) 05.15 63 0
474234 일반 앞으로 남은떡밥 뭐있음?? [3] ㅇㅇ갤로그로 이동합니다. 05.15 109 0
474233 일반 다 맞추는건 아닌데 그래도 꽤 잘맞추네 ㅇㅇ(218.150) 05.15 92 0
474231 일반 4o 공짜로 주면 프로 구독하는 의미가 있음? [2] ㅇㅇ(110.145) 05.15 259 0
474230 일반 개지리네 ㅋㅋ [1] ㅇㅇ(211.230) 05.15 184 0
474229 일반 클로드 구독해제하고 gpt로 넘어감 ㅇㅇ(122.43) 05.15 101 0
474228 일반 물리학 질문에 대한 답변 llm 배틀 [1] 디붕이(121.190) 05.15 98 0
474227 일반 gpt4o 사진에 위치정보 없어도 위치인식이 됨? [2] ㅇㅇ(122.43) 05.15 133 0
474226 일반 선형충이 뭐야??? [3] ㅇㅇ(121.129) 05.15 111 0
474225 일반 결국 ㅈ망이네 ㅇㅇ갤로그로 이동합니다. 05.15 117 1
474223 일반 필독! GPT-4o 미쳤다!!! [3] 내복맨갤로그로 이동합니다. 05.15 421 0
474222 일반 코딩용으로 클로드3 구독중인데 gpt4o로 넘어갈만 하냐? [3] ㅇㅇ(122.43) 05.15 172 0
474219 일반 Perplexity Pro 구독 한달하고, GPT는 사만다 나오면 해야지 [1] ㅇㅇ(221.155) 05.15 149 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2