“자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] “자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴

ㅇㅇ(182.230) 2024.04.22 19:12:07

조회 241 추천 3 댓글 5

https://www.aitimes.com/news/articleView.html?idxno=158993

“자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴...월 750만원선”

'챗GPT'나 '라마 2'와 같은 대형언어모델(LLM) 기반 인공지능(AI) 서비스를 제공하는 비용이 월 5400달러(약 750만원) 수준인 것으로 나타났다. 이는 독자적으로 구축한 LLM을 자체 호스팅하는 비용보다 저렴한 것이다.벤처비트는 21일(현지시간) 기업이 LLM 기반의 AI 서비스를 제공하는 데 드는 비용을 공개했다.이에 따르면 이 비용은 기업이 🔼오픈AI의 챗GPT를 기반으로 한 서비스 🔼클라우드의 오픈 소스 LLM을 기반으로 한 서비스 🔼자체 LLM을 기반으로 한 서비스에 따라 차이가 있다. 먼저 아마존웹서비스(AWS

www.aitimes.com

7ce8887fbc8107f739ee87ed44ee766a7c6c989c2774c6784e7a0f3e926394b918b3

'챗GPT'나 '라마 2'와 같은 대형언어모델(LLM) 기반 인공지능(AI) 서비스를 제공하는 비용이 월 5400달러(약 750만원) 수준인 것으로 나타났다. 이는 독자적으로 구축한 LLM을 자체 호스팅하는 비용보다 저렴한 것이다.

벤처비트는 21일(현지시간) 기업이 LLM 기반의 AI 서비스를 제공하는 데 드는 비용을 공개했다.

이에 따르면 이 비용은 기업이 🔼오픈AI의 챗GPT를 기반으로 한 서비스 🔼클라우드의 오픈 소스 LLM을 기반으로 한 서비스 🔼자체 LLM을 기반으로 한 서비스에 따라 차이가 있다.

먼저 아마존웹서비스(AWS)에서 지원하는 70억(7B) 매개변수의 오픈 소스 라마 2를 기반 모델로 사용할 경우, 라마 2가 매개변수당 2 바이트를 소비하는 BFLOAT16을 사용해 훈련했기 때문에 모델 크기는 140기가바이트(GB)가 된다.

만약 로라(LoRA)를 사용하면 0.1%에 해당하는 7000만 매개변수만 조정할 수 있기 때문에 미세조정에는 0.14GB를 소비한다. 여기에 미세조정 중에 역전파, 활성화 저장, 데이터 세트 저장 등의 메모리 오버헤드를 수용하려면 훈련 가능한 매개변수가 소비하는 것보다 최대 5배 더 많은 0.7GB의 메모리 공간을 유지하는 것이 좋다. 즉, 미세조정 총 용량은 141GB다.

AWS EC2 온디맨드 가격을 기준으로 시간당 2.8달러인 컴퓨팅 비용에 따라 미세조정에 소요되는 비용은 하루 67달러다. 미세조정은 며칠 동안 지속되지 않기 때문에 큰 비용은 아니다.

또 모델을 배포할 때는 140GB의 메모리를 소비하는 모델 가중치와 0.14GB의 메모리를 소비하는 로라 미세조정 가중치를 저장할 140.14GB의 추가 메모리가 필요하다. 오버헤드를 고려하면 약 1.5배 약 210GB 메모리를 유지하는 것이 좋다.

AWS EC2 온디맨드 가격을 기준으로 하면 GPU 컴퓨팅 비용은 시간당 3.70달러다. 모델을 메모리에 로드한 상태로 유지하고 들어오는 요청에 응답하는 데 드는 비용이 하루 90달러이며, 매월 약 2700달러의 비용이 든다.

첫번째 모델에서 요청이 실패할 경우를 대비한 이중화를 고려하면 비용은 하루 180달러, 월 5400달러가 된다.

이는 일반적으로오픈 소스보다 훨씬 비싸다고 여겨졌던 오픈AI의 'GPT-3.5 터보'를 사용할 경우와 비슷하다.

오픈AI의 가격을 기준으로 GPT-3.5 터보 미세조정 비용은 1000토큰당 0.008달러다.

대부분 단어가 토큰2개로 이뤄졌다고 가정하면, 오픈 소스 라마 2 70B 모델의 일일 미세조정 비용 67달러에 맞추면 오픈AI 모델에는 약 415만 단어를 제공할 수 있다. 이는 A4 페이지의 평균 단어 수를 300개로가정하면 최대 1만4000페이지 분량의 데이터를 모델에 제공할 수 있다는 설명이다. 미세조정 데이터가 많지 않을 가능성이 높기 때문에 오픈AI를 사용하면 미세조정 비용은 오히려 저렴해진다.

AWS와 달리 오픈AI는 미세조정 비용이 훈련 시간이 아니라, 미세조정 데이터의 양에 따라 책정된다. 평균 1000토큰당 0.004달러로 계산하면, 하루 180달러의 비용으로 API를 통해 매일 2220만 단어를 보낼 수 있다.

이는 7만4000페이지 이상의 데이터이며 각 페이지당 300단어에 해당하는 비교적 큰 수치로, AWS보다 1시간 동안 더 많은 양을 처리할 수 있다. 게다가 오픈AI는 종량제 가격이기 때문에 사용한 만큼만 비용을 지불한다.

다만 오픈AI의 경우는 일일 사용한도가 있어 이를 초과하면 서비스가 예고없이 중단될 수 있다. 해결 방법은 사용 제한을 늘려 서비스를 활성화시키는 것이다.

반면 독자적인 모델을 기반으로 자체 호스팅 서비스를 제공할 경우, 비용은 인력 및 유지 관리와 같은 추가 비용으로 인해 총 비용이 20만~25만달러(약 2억8000~3억5000원)로 크게 증가할 수 있다.

물론 처음부터 독자적인 모델을 소유하면 데이터 및 사용량에 대한 통제력을 유지하는 등의 이점이 있지만, 자체 호스팅을 실행 가능하게 만들려면 인력 및 물류를 관리하기 위한 리소스와 함께 하루 최대 2220만 단어를 훨씬 초과하는 사용자 요청 로드가 필요하다.

아비 차왈라 AI포트 데이터 과학자이자 제작자는 "결론적으로 API를 사용하는 대신, 독자 모델을 소유하는 것이 대부분의 경우 재정적으로 이익이 될 가능성은 거의 없다"라고 지적했다.

고정닉 1

원본 첨부파일 1

158993_171182_2723.jpg

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2863	설문	시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는?	운영자	24/05/27	-	-
474277	일반	앱등이 형님들이 유입되면 OAI도 떼돈벌지 [1]	도서관킬러	05.15	60	0
474276	일반	몇십년 후 그래프를 보면 '어? 뭔가 바꼈나봐' [2]	ㅇㅇ(121.140)	05.15	150	1
474275	일반	오늘부터 건강관리와 소득 늘리는거 두개에 올인한다. [3]	ㅇㅇ(122.34)	05.15	109	0
474274	일반	이번 인터뷰 보니깐 바로 알겠네 [2]	ㅇㅇ(119.193)	05.15	240	2
474273	일반	알트만 인터뷰에서 가장 중요한거 [10]	ㅇㅇ(117.20)	05.15	331	1
474272	일반	nft 메타버스 ai 레츠고!	ㅇㅇ(119.193)	05.15	34	0
474271	일반	역시 애플이야 돈냄새는 [2]	ㅇㅇ	05.15	151	0
474269	일반	몇십년후 그래프를 보면 뭔가 바뀌어있을거다?? [2]	거더라	05.15	123	0
474268	일반	gpt 4o 어캐 적용함	질문봇	05.15	59	0
474267	일반	알트만 인터뷰 보니까 모델은 자주 여러개 발표할거같네 [5]	ㅇㅇ(121.131)	05.15	234	0
474266	일반	ChatGPT에 VPN 쓸 수 있음?	Ad_Astra	05.15	44	0
474265	일반	씨발 일리야 왜떠남? [4]	ㅇㅇ(106.101)	05.15	263	0
474264	일반	tpu가 진짜 성능 좋긴 한거 맞아? [4]	ㅇㅇ	05.15	114	0
474263	일반	갤럭시 gos 터지고 좆같아서 싹 애플로 넘어갔는데	ㅇㅇ(121.154)	05.15	162	0
474262	일반	로컬형님들이 맥을 추론용으로 많이 사용하는 이유	디붕이(121.190)	05.15	117	0
474261	일반	구글 라이브의 의의 [1]	Samus	05.15	171	1
474260	일반	지갤떡뭐 [2]	ㅇㅇ(211.235)	05.15	55	0
474259	일반	구글 발표회는 액침냉각 TPU 6세대 출시말고는 뭐 없는건가	ㅇㅇ	05.15	62	0
474258	일반	특이점 오면 쉽게 핑크빛 [1]	ㅇㅇ	05.15	91	0
474256	일반	다른 사람 목소리 학습시키는 ai는 보통 뭐씀? [2]	직캠러(220.120)	05.15	79	1
474255	일반	새로운 CSO 폴란드 사람 같네	ㅇㅇ(1.235)	05.15	40	0
474254	일반	사만다 해금되면 연예 코치도 해주는 거냐? [1]	내복맨	05.15	47	0
474252	일반	애플이 똑똑한게 아니라 이제 걍 하청기업 되는거 아니냐? [2]	ㅇㅇ(122.43)	05.15	124	0
474251	일반	Sam Altman 오늘자 인터뷰 요약 [42]	ㅇㅇ(58.123)	05.15	5515	59
474250	일반	데이터 ai쪽으로 대학원온게 정말 다행이다 [3]	ㅇㅇ(122.43)	05.15	205	0
474249	일반	일리야 oai 나갔구나 [2]	ㅇㅇ	05.15	146	0
474248	일반	메모리 기능 맛있네 ㄹㅇ [11]	도서관킬러	05.15	370	0
474246	일반	미용학원 상담받았더니 Ai대체된다고 헤어나 하란소리들음 [4]	ㅇㅇ(14.50)	05.15	137	0
474245	일반	Gpt. 메모리는못쓰게하냐 [2]	연맛	05.15	118	0
474244	일반	4o 무료 출시하면 3.5는 사라질려나? [1]	소노자키	05.15	165	0
474242	일반	OA 개같이 패줘 [1]	Singnice	05.15	151	0
474241	일반	그래서 지금 특이점 정배 몇년? [8]	ㅇㅇ(103.138)	05.15	184	0
474240	일반	openai가 일본 대우해주는거 맞음 [4]	ㅇㅇ(122.43)	05.15	252	0
474239	일반	솔직히 까놓고 사진 맞추기 놀이 밖에 더있나? [16]	ㅇㅇ(117.20)	05.15	260	2
474238	일반	지옥에서 외치는 선형충들의 절규 [1]	ㅇㅇ(14.55)	05.15	142	1
474237	일반	구글 보니까 애플이 눈치가 빨랐던거 같네 [1]	ㅇㅇ(121.131)	05.15	269	0
474236	일반	vpn 끄니까 바로 메모리기능 사라지네 ㅋㅋㅋ [2]	캬르룩	05.15	218	0
474235	일반	4o가 갤주 신간도 번역해줄거야	ㅇㅇ(121.131)	05.15	63	0
474234	일반	앞으로 남은떡밥 뭐있음?? [3]	ㅇㅇ	05.15	109	0
474233	일반	다 맞추는건 아닌데 그래도 꽤 잘맞추네	ㅇㅇ(218.150)	05.15	92	0
474231	일반	4o 공짜로 주면 프로 구독하는 의미가 있음? [2]	ㅇㅇ(110.145)	05.15	259	0
474230	일반	개지리네 ㅋㅋ [1]	ㅇㅇ(211.230)	05.15	184	0
474229	일반	클로드 구독해제하고 gpt로 넘어감	ㅇㅇ(122.43)	05.15	101	0
474228	일반	물리학 질문에 대한 답변 llm 배틀 [1]	디붕이(121.190)	05.15	98	0
474227	일반	gpt4o 사진에 위치정보 없어도 위치인식이 됨? [2]	ㅇㅇ(122.43)	05.15	133	0
474226	일반	선형충이 뭐야??? [3]	ㅇㅇ(121.129)	05.15	111	0
474225	일반	결국 ㅈ망이네	ㅇㅇ	05.15	117	1
474223	일반	필독! GPT-4o 미쳤다!!! [3]	내복맨	05.15	421	0
474222	일반	코딩용으로 클로드3 구독중인데 gpt4o로 넘어갈만 하냐? [3]	ㅇㅇ(122.43)	05.15	172	0
474219	일반	Perplexity Pro 구독 한달하고, GPT는 사만다 나오면 해야지 [1]	ㅇㅇ(221.155)	05.15	149	0