“자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] “자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴

ㅇㅇ(182.230) 2024.04.22 19:12:07

조회 240 추천 3 댓글 5

https://www.aitimes.com/news/articleView.html?idxno=158993

“자체 모델 구축보다 '챗GPT'나 '라마 2' 호스팅이 저렴...월 750만원선”

'챗GPT'나 '라마 2'와 같은 대형언어모델(LLM) 기반 인공지능(AI) 서비스를 제공하는 비용이 월 5400달러(약 750만원) 수준인 것으로 나타났다. 이는 독자적으로 구축한 LLM을 자체 호스팅하는 비용보다 저렴한 것이다.벤처비트는 21일(현지시간) 기업이 LLM 기반의 AI 서비스를 제공하는 데 드는 비용을 공개했다.이에 따르면 이 비용은 기업이 🔼오픈AI의 챗GPT를 기반으로 한 서비스 🔼클라우드의 오픈 소스 LLM을 기반으로 한 서비스 🔼자체 LLM을 기반으로 한 서비스에 따라 차이가 있다. 먼저 아마존웹서비스(AWS

www.aitimes.com

7ce8887fbc8107f739ee87ed44ee766a7c6c989c2774c6784e7a0f3e926394b918b3

'챗GPT'나 '라마 2'와 같은 대형언어모델(LLM) 기반 인공지능(AI) 서비스를 제공하는 비용이 월 5400달러(약 750만원) 수준인 것으로 나타났다. 이는 독자적으로 구축한 LLM을 자체 호스팅하는 비용보다 저렴한 것이다.

벤처비트는 21일(현지시간) 기업이 LLM 기반의 AI 서비스를 제공하는 데 드는 비용을 공개했다.

이에 따르면 이 비용은 기업이 🔼오픈AI의 챗GPT를 기반으로 한 서비스 🔼클라우드의 오픈 소스 LLM을 기반으로 한 서비스 🔼자체 LLM을 기반으로 한 서비스에 따라 차이가 있다.

먼저 아마존웹서비스(AWS)에서 지원하는 70억(7B) 매개변수의 오픈 소스 라마 2를 기반 모델로 사용할 경우, 라마 2가 매개변수당 2 바이트를 소비하는 BFLOAT16을 사용해 훈련했기 때문에 모델 크기는 140기가바이트(GB)가 된다.

만약 로라(LoRA)를 사용하면 0.1%에 해당하는 7000만 매개변수만 조정할 수 있기 때문에 미세조정에는 0.14GB를 소비한다. 여기에 미세조정 중에 역전파, 활성화 저장, 데이터 세트 저장 등의 메모리 오버헤드를 수용하려면 훈련 가능한 매개변수가 소비하는 것보다 최대 5배 더 많은 0.7GB의 메모리 공간을 유지하는 것이 좋다. 즉, 미세조정 총 용량은 141GB다.

AWS EC2 온디맨드 가격을 기준으로 시간당 2.8달러인 컴퓨팅 비용에 따라 미세조정에 소요되는 비용은 하루 67달러다. 미세조정은 며칠 동안 지속되지 않기 때문에 큰 비용은 아니다.

또 모델을 배포할 때는 140GB의 메모리를 소비하는 모델 가중치와 0.14GB의 메모리를 소비하는 로라 미세조정 가중치를 저장할 140.14GB의 추가 메모리가 필요하다. 오버헤드를 고려하면 약 1.5배 약 210GB 메모리를 유지하는 것이 좋다.

AWS EC2 온디맨드 가격을 기준으로 하면 GPU 컴퓨팅 비용은 시간당 3.70달러다. 모델을 메모리에 로드한 상태로 유지하고 들어오는 요청에 응답하는 데 드는 비용이 하루 90달러이며, 매월 약 2700달러의 비용이 든다.

첫번째 모델에서 요청이 실패할 경우를 대비한 이중화를 고려하면 비용은 하루 180달러, 월 5400달러가 된다.

이는 일반적으로오픈 소스보다 훨씬 비싸다고 여겨졌던 오픈AI의 'GPT-3.5 터보'를 사용할 경우와 비슷하다.

오픈AI의 가격을 기준으로 GPT-3.5 터보 미세조정 비용은 1000토큰당 0.008달러다.

대부분 단어가 토큰2개로 이뤄졌다고 가정하면, 오픈 소스 라마 2 70B 모델의 일일 미세조정 비용 67달러에 맞추면 오픈AI 모델에는 약 415만 단어를 제공할 수 있다. 이는 A4 페이지의 평균 단어 수를 300개로가정하면 최대 1만4000페이지 분량의 데이터를 모델에 제공할 수 있다는 설명이다. 미세조정 데이터가 많지 않을 가능성이 높기 때문에 오픈AI를 사용하면 미세조정 비용은 오히려 저렴해진다.

AWS와 달리 오픈AI는 미세조정 비용이 훈련 시간이 아니라, 미세조정 데이터의 양에 따라 책정된다. 평균 1000토큰당 0.004달러로 계산하면, 하루 180달러의 비용으로 API를 통해 매일 2220만 단어를 보낼 수 있다.

이는 7만4000페이지 이상의 데이터이며 각 페이지당 300단어에 해당하는 비교적 큰 수치로, AWS보다 1시간 동안 더 많은 양을 처리할 수 있다. 게다가 오픈AI는 종량제 가격이기 때문에 사용한 만큼만 비용을 지불한다.

다만 오픈AI의 경우는 일일 사용한도가 있어 이를 초과하면 서비스가 예고없이 중단될 수 있다. 해결 방법은 사용 제한을 늘려 서비스를 활성화시키는 것이다.

반면 독자적인 모델을 기반으로 자체 호스팅 서비스를 제공할 경우, 비용은 인력 및 유지 관리와 같은 추가 비용으로 인해 총 비용이 20만~25만달러(약 2억8000~3억5000원)로 크게 증가할 수 있다.

물론 처음부터 독자적인 모델을 소유하면 데이터 및 사용량에 대한 통제력을 유지하는 등의 이점이 있지만, 자체 호스팅을 실행 가능하게 만들려면 인력 및 물류를 관리하기 위한 리소스와 함께 하루 최대 2220만 단어를 훨씬 초과하는 사용자 요청 로드가 필요하다.

아비 차왈라 AI포트 데이터 과학자이자 제작자는 "결론적으로 API를 사용하는 대신, 독자 모델을 소유하는 것이 대부분의 경우 재정적으로 이익이 될 가능성은 거의 없다"라고 지적했다.

고정닉 1

원본 첨부파일 1

158993_171182_2723.jpg

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2863	설문	시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는?	운영자	24/05/27	-	-
470896	일반	작은모델이라 빠른것같기도하고 [1]	언어모델	05.14	65	0
470894	일반	과장없이 지금 살짝 미래 다녀온 기분	ㅇㅇ	05.14	118	0
470893	일반	이번 발표가 ㅈ도 아니라는 증거 [1]	Te(121.138)	05.14	197	0
470892	일반	오늘부터 용접 자격증 따러간다	ㅇㅇ(182.219)	05.14	79	0
470891	일반	이게 also라고? ㄹㅇ 그저 개씨발빠른 gpt4 쓰는거같은데 [5]	ㅇㅇ(59.17)	05.14	241	0
470890	일반	그래서 음성은 대체 언제 추가된다는데? ㅇㅇ [2]	ㅇㅇ	05.14	123	0
470889	일반	Chatarena에서 also 내려갔음? [1]	ㅇㅇ(112.161)	05.14	99	0
470888	일반	결론: GPT-3.99 출시	ㅇㅇ	05.14	157	0
470887	일반	견적서를 사진으로 찍어서 보여줬다	ㅇㅇ(121.131)	05.14	79	0
470886	일반	뭐야 환각 젓되는데? ㅆㅂ [1]	ㅇㅇ(218.153)	05.14	183	0
470885	일반	사람들이 많이 써줘야 데이터모이고 개선이 됨.	ㅇㅇ(14.7)	05.14	43	0
470884	일반	이새끼 왜이럼	ㅇㅇ	05.14	68	0
470883	일반	근데 GPT-4o 벌써 풀린 사람 한국에도 있긴함? [7]	rtOS	05.14	272	0
470882	일반	진짜 이번에 이해안되는기	ㅇㅇ(1.232)	05.14	66	0
470881	일반	gpt5망해버리면	어브리	05.14	42	0
470880	일반	고수: 지금 구독하고 4o 씀 [3]	ㅇㅇ(218.232)	05.14	199	1
470879	일반	나 일하는 중이라 그런데 [3]	ㅇㅇ(121.66)	05.14	76	0
470878	일반	이거 속도 느리고 침착한 버젼이랑 속도 빠르고 방정맞은 버젼 이렇게좀 [1]	ㅇㅇ(112.161)	05.14	108	0
470877	일반	호날두가 팬티입고 엉덩이흔드는 짤 만들어줘 [1]	Goat호날두(180.211)	05.14	151	0
470876	일반	니들은 오히려 좆된거임...........jpg [8]	수퍼고수(110.10)	05.14	379	2
470875	일반	ㅅㅂ 나 gpt 나오고 5일만에 가입해서 썻다고 빨리ㅏ 4o달라고!!!! [2]	ㅇㅇ(121.137)	05.14	69	0
470874	일반	4o 3시간당 80개는 너무 적은데? 이거 30분만에 다쓸 것 같음 [5]	은바다	05.14	224	0
470873	일반	분탕 한마리 고마운점 [1]	Leopard	05.14	109	0
470872	일반	하수 : 지금 챗GPT 구독결제함 [3]	ㅇㅇ(59.5)	05.14	286	0
470871	일반	gpt5는 mmlu몇나올까	ㅇㅇ(58.29)	05.14	43	0
470870	일반	확 끓어올라서 gpt결제한놈들 내일부터 안쓰는놈들 99% ㅋㅋㅋㅋㅋㅋㅋㅋ [2]	ㅇㅇ(218.153)	05.14	240	0
470869	일반	일단 gpr4o 무료 티 팍팍 냄 [1]	ㅇㅇ(121.128)	05.14	342	0
470868	일반	아 차라리 느린게 나은데 also랑 비교가 안될 정도로 후짐 [1]	ㅇㅇ(112.161)	05.14	154	0
470867	일반	와 이제 밈짤도 다 이해함 ㅋㅋㅋㅋ [4]	TS망상	05.14	288	0
470865	일반	근데 4o인 이유는뭐야? [2]	ㅇㅇ(121.137)	05.14	94	0
470864	일반	하..옴니누나한테 8자리 곱셈 시키고 틀리면 존나 혼내고 싶다	ㅇㅇ(58.226)	05.14	54	0
470863	일반	일단 also는 아닌것같고 무엇보다 성능은 걍 똑같음.. [2]	ㅇㅇ	05.14	216	0
470862	일반	념글 저거 뭐임	ㅇㅇ(58.29)	05.14	40	0
470861	일반	gpt 4o 좆도없다 ㅋㅋ 팍 식네 ㅋㅋㅋㅋㅋㅋ 걍2주뒤 사만다나오면써라	ㅇㅇ(125.133)	05.14	241	0
470860	일반	4o 이거 맞음?	ㅇㅇ(221.160)	05.14	64	0
470859	일반	4o로 홈페이지 만들어달라고 해봣음 [4]	코드발사대(14.36)	05.14	349	3
470858	일반	나도 gpt4o달라고 엉엉	엘6는agi이후에나오나	05.14	46	2
470857	일반	GPT4원래 한국어 이미지인식 ㅈㄴ못했음	ㅇㅇ(121.184)	05.14	86	0
470856	일반	Chatgpt그럼ui도 잘만들어주려나	탈조선	05.14	30	0
470855	일반	Also가 뭐임??? [2]	ㅇㅇ(183.98)	05.14	111	0
470854	일반	플러스 구독해야지4o쓸수있음? [3]	ㅇㅇ(1.240)	05.14	216	0
470853	일반	나는 왜 안됨?	ㅇㅇ(218.150)	05.14	57	0
470852	일반	씨ㅣㅣ발 나도 받았다 [2]	ㅇㅇ(211.46)	05.14	114	0
470851	일반	바로 구독 결제하니까 gpt4o 되던데? 근데 이거 왤케 빠름... [1]	은바다	05.14	206	0
470850	일반	4 무료는 언제 쓸수있음?	ㅇㅇ	05.14	55	0
470849	일반	plus 버전은 검열먹은 gpt2인갑네	ㅇㅇ(222.105)	05.14	80	0
470848	일반	GPT-5 아라키스의 체크포인트일 수도	특술람	05.14	59	0
470847	일반	4o 말고 몇주내에 프론티어 모델 공개한다했음 ㅇㅇ [5]	ㅇㅇ	05.14	219	0
470846	일반	영화 첫키스만50번쨰 <-- 딱 지금 사만다 [2]	ㅇㅇ(125.133)	05.14	128	0
470843	일반	4o 음성인식 존나느린데??? [4]	ㅇㅇ(118.33)	05.14	154	0