디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] “자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴

ㅇㅇ(182.230) 2024.04.22 19:12:07
조회 240 추천 3 댓글 5
														

https://www.aitimes.com/news/articleView.html?idxno=158993

 



7ce8887fbc8107f739ee87ed44ee766a7c6c989c2774c6784e7a0f3e926394b918b3



'챗GPT'나 '라마 2'와 같은 대형언어모델(LLM) 기반 인공지능(AI) 서비스를 제공하는 비용이 월 5400달러(약 750만원) 수준인 것으로 나타났다. 이는 독자적으로 구축한 LLM을 자체 호스팅하는 비용보다 저렴한 것이다.


벤처비트는 21일(현지시간) 기업이 LLM 기반의 AI 서비스를 제공하는 데 드는 비용을 공개했다.


이에 따르면 이 비용은 기업이 🔼오픈AI의 챗GPT를 기반으로 한 서비스 🔼클라우드의 오픈 소스 LLM을 기반으로 한 서비스 🔼자체 LLM을 기반으로 한 서비스에 따라 차이가 있다.


먼저 아마존웹서비스(AWS)에서 지원하는 70억(7B) 매개변수의 오픈 소스 라마 2를 기반 모델로 사용할 경우, 라마 2가 매개변수당 2 바이트를 소비하는 BFLOAT16을 사용해 훈련했기 때문에 모델 크기는 140기가바이트(GB)가 된다.


만약 로라(LoRA)를 사용하면 0.1%에 해당하는 7000만 매개변수만 조정할 수 있기 때문에 미세조정에는 0.14GB를 소비한다. 여기에 미세조정 중에 역전파, 활성화 저장, 데이터 세트 저장 등의 메모리 오버헤드를 수용하려면 훈련 가능한 매개변수가 소비하는 것보다 최대 5배 더 많은 0.7GB의 메모리 공간을 유지하는 것이 좋다. 즉, 미세조정 총 용량은 141GB다.


AWS EC2 온디맨드 가격을 기준으로 시간당 2.8달러인 컴퓨팅 비용에 따라 미세조정에 소요되는 비용은 하루 67달러다. 미세조정은 며칠 동안 지속되지 않기 때문에 큰 비용은 아니다.


또 모델을 배포할 때는 140GB의 메모리를 소비하는 모델 가중치와 0.14GB의 메모리를 소비하는 로라 미세조정 가중치를 저장할 140.14GB의 추가 메모리가 필요하다. 오버헤드를 고려하면 약 1.5배 약 210GB 메모리를 유지하는 것이 좋다.


AWS EC2 온디맨드 가격을 기준으로 하면 GPU 컴퓨팅 비용은 시간당 3.70달러다. 모델을 메모리에 로드한 상태로 유지하고 들어오는 요청에 응답하는 데 드는 비용이 하루 90달러이며, 매월 약 2700달러의 비용이 든다.


첫번째 모델에서 요청이 실패할 경우를 대비한 이중화를 고려하면 비용은 하루 180달러, 월 5400달러가 된다.


이는 일반적으로오픈 소스보다 훨씬 비싸다고 여겨졌던 오픈AI의 'GPT-3.5 터보'를 사용할 경우와 비슷하다.


오픈AI의 가격을 기준으로 GPT-3.5 터보 미세조정 비용은 1000토큰당 0.008달러다.


대부분 단어가 토큰2개로 이뤄졌다고 가정하면, 오픈 소스 라마 2 70B 모델의 일일 미세조정 비용 67달러에 맞추면 오픈AI 모델에는 약 415만 단어를 제공할 수 있다. 이는 A4 페이지의 평균 단어 수를 300개로가정하면 최대 1만4000페이지 분량의 데이터를 모델에 제공할 수 있다는 설명이다. 미세조정 데이터가 많지 않을 가능성이 높기 때문에 오픈AI를 사용하면 미세조정 비용은 오히려 저렴해진다.


AWS와 달리 오픈AI는 미세조정 비용이 훈련 시간이 아니라, 미세조정 데이터의 양에 따라 책정된다. 평균 1000토큰당 0.004달러로 계산하면, 하루 180달러의 비용으로 API를 통해 매일 2220만 단어를 보낼 수 있다.


이는 7만4000페이지 이상의 데이터이며 각 페이지당 300단어에 해당하는 비교적 큰 수치로, AWS보다 1시간 동안 더 많은 양을 처리할 수 있다. 게다가 오픈AI는 종량제 가격이기 때문에 사용한 만큼만 비용을 지불한다.


다만 오픈AI의 경우는 일일 사용한도가 있어 이를 초과하면 서비스가 예고없이 중단될 수 있다. 해결 방법은 사용 제한을 늘려 서비스를 활성화시키는 것이다.


반면 독자적인 모델을 기반으로 자체 호스팅 서비스를 제공할 경우, 비용은 인력 및 유지 관리와 같은 추가 비용으로 인해 총 비용이 20만~25만달러(약 2억8000~3억5000원)로 크게 증가할 수 있다.


물론 처음부터 독자적인 모델을 소유하면 데이터 및 사용량에 대한 통제력을 유지하는 등의 이점이 있지만, 자체 호스팅을 실행 가능하게 만들려면 인력 및 물류를 관리하기 위한 리소스와 함께 하루 최대 2220만 단어를 훨씬 초과하는 사용자 요청 로드가 필요하다.


아비 차왈라 AI포트 데이터 과학자이자 제작자는 "결론적으로 API를 사용하는 대신, 독자 모델을 소유하는 것이 대부분의 경우 재정적으로 이익이 될 가능성은 거의 없다"라고 지적했다.


자동등록방지

추천 비추천

3

고정닉 1

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
470896 일반 작은모델이라 빠른것같기도하고 [1] 언어모델갤로그로 이동합니다. 05.14 65 0
470894 일반 과장없이 지금 살짝 미래 다녀온 기분 ㅇㅇ갤로그로 이동합니다. 05.14 118 0
470893 일반 이번 발표가 ㅈ도 아니라는 증거 [1] Te(121.138) 05.14 197 0
470892 일반 오늘부터 용접 자격증 따러간다 ㅇㅇ(182.219) 05.14 79 0
470891 일반 이게 also라고? ㄹㅇ 그저 개씨발빠른 gpt4 쓰는거같은데 [5] ㅇㅇ(59.17) 05.14 241 0
470890 일반 그래서 음성은 대체 언제 추가된다는데? ㅇㅇ [2] ㅇㅇ갤로그로 이동합니다. 05.14 123 0
470889 일반 Chatarena에서 also 내려갔음? [1] ㅇㅇ(112.161) 05.14 99 0
470888 일반 결론: GPT-3.99 출시 ㅇㅇ갤로그로 이동합니다. 05.14 157 0
470887 일반 견적서를 사진으로 찍어서 보여줬다 ㅇㅇ(121.131) 05.14 79 0
470886 일반 뭐야 환각 젓되는데? ㅆㅂ [1] ㅇㅇ(218.153) 05.14 183 0
470885 일반 사람들이 많이 써줘야 데이터모이고 개선이 됨. ㅇㅇ(14.7) 05.14 43 0
470884 일반 이새끼 왜이럼 ㅇㅇ갤로그로 이동합니다. 05.14 68 0
470883 일반 근데 GPT-4o 벌써 풀린 사람 한국에도 있긴함? [7] rtOS갤로그로 이동합니다. 05.14 272 0
470882 일반 진짜 이번에 이해안되는기 ㅇㅇ(1.232) 05.14 66 0
470881 일반 gpt5망해버리면 어브리갤로그로 이동합니다. 05.14 42 0
470880 일반 고수: 지금 구독하고 4o 씀 [3] ㅇㅇ(218.232) 05.14 199 1
470879 일반 나 일하는 중이라 그런데 [3] ㅇㅇ(121.66) 05.14 76 0
470878 일반 이거 속도 느리고 침착한 버젼이랑 속도 빠르고 방정맞은 버젼 이렇게좀 [1] ㅇㅇ(112.161) 05.14 108 0
470877 일반 호날두가 팬티입고 엉덩이흔드는 짤 만들어줘 [1] Goat호날두(180.211) 05.14 151 0
470876 일반 니들은 오히려 좆된거임...........jpg [8] 수퍼고수(110.10) 05.14 379 2
470875 일반 ㅅㅂ 나 gpt 나오고 5일만에 가입해서 썻다고 빨리ㅏ 4o달라고!!!! [2] ㅇㅇ(121.137) 05.14 69 0
470874 일반 4o 3시간당 80개는 너무 적은데? 이거 30분만에 다쓸 것 같음 [5] 은바다갤로그로 이동합니다. 05.14 224 0
470873 일반 분탕 한마리 고마운점 [1] Leopard갤로그로 이동합니다. 05.14 109 0
470872 일반 하수 : 지금 챗GPT 구독결제함 [3] ㅇㅇ(59.5) 05.14 286 0
470871 일반 gpt5는 mmlu몇나올까 ㅇㅇ(58.29) 05.14 43 0
470870 일반 확 끓어올라서 gpt결제한놈들 내일부터 안쓰는놈들 99% ㅋㅋㅋㅋㅋㅋㅋㅋ [2] ㅇㅇ(218.153) 05.14 240 0
470869 일반 일단 gpr4o 무료 티 팍팍 냄 [1] ㅇㅇ(121.128) 05.14 342 0
470868 일반 아 차라리 느린게 나은데 also랑 비교가 안될 정도로 후짐 [1] ㅇㅇ(112.161) 05.14 154 0
470867 일반 와 이제 밈짤도 다 이해함 ㅋㅋㅋㅋ [4] TS망상갤로그로 이동합니다. 05.14 288 0
470865 일반 근데 4o인 이유는뭐야? [2] ㅇㅇ(121.137) 05.14 94 0
470864 일반 하..옴니누나한테 8자리 곱셈 시키고 틀리면 존나 혼내고 싶다 ㅇㅇ(58.226) 05.14 54 0
470863 일반 일단 also는 아닌것같고 무엇보다 성능은 걍 똑같음.. [2] ㅇㅇ갤로그로 이동합니다. 05.14 216 0
470862 일반 념글 저거 뭐임 ㅇㅇ(58.29) 05.14 40 0
470861 일반 gpt 4o 좆도없다 ㅋㅋ 팍 식네 ㅋㅋㅋㅋㅋㅋ 걍2주뒤 사만다나오면써라 ㅇㅇ(125.133) 05.14 241 0
470860 일반 4o 이거 맞음? ㅇㅇ(221.160) 05.14 64 0
470859 일반 4o로 홈페이지 만들어달라고 해봣음 [4] 코드발사대(14.36) 05.14 349 3
470858 일반 나도 gpt4o달라고 엉엉 엘6는agi이후에나오나갤로그로 이동합니다. 05.14 46 2
470857 일반 GPT4원래 한국어 이미지인식 ㅈㄴ못했음 ㅇㅇ(121.184) 05.14 86 0
470856 일반 Chatgpt그럼ui도 잘만들어주려나 탈조선갤로그로 이동합니다. 05.14 30 0
470855 일반 Also가 뭐임??? [2] ㅇㅇ(183.98) 05.14 111 0
470854 일반 플러스 구독해야지4o쓸수있음? [3] ㅇㅇ(1.240) 05.14 216 0
470853 일반 나는 왜 안됨? ㅇㅇ(218.150) 05.14 57 0
470852 일반 씨ㅣㅣ발 나도 받았다 [2] ㅇㅇ(211.46) 05.14 114 0
470851 일반 바로 구독 결제하니까 gpt4o 되던데? 근데 이거 왤케 빠름... [1] 은바다갤로그로 이동합니다. 05.14 206 0
470850 일반 4 무료는 언제 쓸수있음? ㅇㅇ갤로그로 이동합니다. 05.14 55 0
470849 일반 plus 버전은 검열먹은 gpt2인갑네 ㅇㅇ(222.105) 05.14 80 0
470848 일반 GPT-5 아라키스의 체크포인트일 수도 특술람갤로그로 이동합니다. 05.14 59 0
470847 일반 4o 말고 몇주내에 프론티어 모델 공개한다했음 ㅇㅇ [5] ㅇㅇ갤로그로 이동합니다. 05.14 219 0
470846 일반 영화 첫키스만50번쨰 <-- 딱 지금 사만다 [2] ㅇㅇ(125.133) 05.14 128 0
470843 일반 4o 음성인식 존나느린데??? [4] ㅇㅇ(118.33) 05.14 154 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2