AI용어) Prompt vs Fine-tuning vs RAG

ㅇㅇ · 2024.05.03 00:07:05

https://slashpage.com/haebom/dk58wg2en8xrvmnqevxz

Prompt vs Fine-tuning vs RAG - 해봄의 잡동사니

최근 다양한 분들이 인공지능에 관심을 가지면서 평소 IT업계에 별 관심이 없던 분들도 이에대해 다양한 문의를 주시고 계십니다. 실제로 요청에 의해 도움을 몇번 드리기도 하면서 기술적으로 어려운 부분 보다는 지금 우리 서비스 혹은 도메인에 맞는 방법을 찾는 시기 같습니다. 모델의 발전은 계속해서 일어날 것이고 칩셋, 전력량 등에 대한 문제도 결국 시간이 해결...

slashpage.com

7fee837fb78407f16a8fd9b707e22f05b83724e25ac2baacadaf29ef5477f3b49e90272eeb7fd70bbd

프롬프트 엔지니어링(디자인, 기법... 뭐든)

- 가장 기본적인 방법으로, 모델에게 원하는 정보를 얻기 위해 적절한 지시사항을 주는 것과 같습니다.

- 누구나 쉽게 사용할 수 있지만, 모델이 학습한 내용에 크게 의존하므로 최신 정보나 구체적인 내용을 얻는 데는 한계가 있습니다.

파인튜닝(Fine-tuning)

- 기존 언어 모델에 새로운 정보를 학습시켜 업데이트하는 것으로, 시간과 비용이 많이 들지만 특정 주제에 대해 전문성을 갖출 수 있습니다.

- 사용자가 원하는 대로 모델을 커스터마이징할 수 있고, 정확도가 높아지는 장점이 있습니다. 하지만 기술적 이해도가 필요하고 많은 데이터가 필요합니다.

RAG(Retrieval Augmented Generation)

- 언어 모델과 지식 베이스를 결합한 방식으로, 질문에 답할 때 관련 정보를 먼저 수집한 뒤 이를 바탕으로 답변을 생성합니다.

- 최신 정보가 필요하거나 다양한 주제를 다룰 때 유용하며, 프롬프트 엔지니어링과 파인튜닝의 중간 정도의 난이도와 비용이 듭니다.

- RAG의 성능은 벡터 데이터베이스의 영향을 많이 받는데, MyScale이라는 SQL 기반의 벡터 DB를 활용하면 비용 절감과 성능 향상의 이점이 있습니다.

가끔 파인튜닝과 RAG를 사용하면 할루시네이션(즉, 모델이 사실이 아닌 정보를 생성하는 현상)이나 멀티턴 대화의 어려움이 곧 잘 해결될 것이라 기대하는 분들이 있지만 이는 약간 틀립니다. 실제로 위 방법을 적용한다고 LLM이 가지는 고유한 문제점이 해결되진 않기 때문이죠.

- 할루시네이션: 파인튜닝 과정에서 모델은 제공된 학습 데이터에 매우 의존하게 됩니다. 학습 데이터가 오류를 포함하고 있거나, 충분히 다양하지 않은 경우 모델이 잘못된 정보를 학습하여, 이를 진실로 인식하고 출력할 수 있습니다. RAG의 경우, 외부 정보 소스에서 검색된 데이터의 질과 관련성에 따라 출력의 정확성이 달라질 수 있으며, 이는 때로 할루시네이션을 유발할 수 있습니다.

- 멀티턴 대화: 멀티턴 대화는 이전 대화의 맥락을 이해하고 이에 적절히 반응하는 능력을 필요로 합니다. 파인튜닝된 모델이나 RAG를 사용할 경우, 대화의 맥락을 모델이 충분히 이해하고 반영하기 위해서는 추가적인 최적화가 필요합니다. 특히, 모델이 각 대화 턴의 연관성을 정확히 파악하지 못하면 대화의 자연스러움이 떨어질 수 있습니다.

오히려 이런 경우를 바로 해결하고 싶으면 Prompt 기법들을 가져다 쓰는게 효용성이 더 높습니다. 이유는 간단한데 들인 비용에 비해 효과가 월등하기 때문입니다. 이는 모델이 좋아질 수록 더더욱 유용해질 것 입니다. 나중엔 의도하면서 말하지 않아도 앵간하면 다 처리해주는 모델들이 나올거구요.

RAG의 경우, 외부 지식 베이스에서 retrieval된 정보가 부정확하거나 불완전할 수 있습니다. 이는 모델이 잘못된 정보를 바탕으로 할루시네이션을 일으키는 원인이 될 수 있죠. 또한 대화의 맥락을 고려하지 않고 단순히 retrieval된 정보에 의존하게 되면, 멀티턴 대화에서 일관성 있는 응답을 하기 어려워집니다.

파인튜닝의 경우, 학습 데이터의 품질과 양에 크게 영향을 받습니다. 데이터가 부족하거나 편향되어 있다면, 모델은 overfitting되어 일반화 성능이 떨어질 수 있습니다. 이는 할루시네이션이나 부적절한 응답으로 이어질 수 있죠. 또한 파인튜닝된 모델은 학습 데이터에 없었던 새로운 주제나 맥락에 대해서는 대처하기 어려울 수 있습니다.

이런 점을 고려했을 때, 가성비 면에서는 프롬프트 엔지니어링이 가장 유리할 수 있습니다. 프롬프트 엔지니어링은 기존 모델의 지식을 최대한 활용하면서도, 사용자가 원하는 방향으로 모델을 유도할 수 있기 때문이죠. 또한 구현이 쉽고 비용이 적게 들어, 다양한 상황에서 빠르게 적용해볼 수 있습니다.

하지만 프로젝트의 요구사항에 따라 RAG나 파인튜닝이 더 적합한 경우도 있을 것입니다. 예를 들어 특정 도메인에 특화된 응답이 필요하다면 파인튜닝이, 실시간으로 최신 정보를 반영해야 한다면 RAG가 더 나은 선택일 수 있습니다.

결국 어떤 방식이 가장 좋을지는 프로젝트의 목적, 데이터의 특성, 가용 자원 등을 종합적으로 고려해 결정해야 할 것 같습니다. 필요에 따라 여러 방식을 함께 사용하는 것도 좋은 전략이 될 수 있겠죠. 프롬프트 엔지니어링으로 기본적인 성능을 확보하고, 파인튜닝이나 RAG를 부분적으로 적용해 보완하는 식으로요.

간단하게 비교하면 다음과 같이 비교할 순 있겠습니다.

a15714ab041eb360be3335625683746f0053452cd6a6e889d73563f69d10cd6ea07b70f91ddbcd55dfb242dc1a

하지만 위에서도 말했듯이 이 모든게 점점 쉬워질 것입니다. 실제로 최근 국내외 기업들이 이것들이 모두 가능한 서비스를 하나 둘 내놓고 있습니다.

파인튜닝이나 RAG도 UI로 누구나 할 수 있는 시대가 성큼 성큼 다가오고 있는 것도 사실이라 어떤 방법이 무조건 좋다라는 접근법 혹은 이런 방법을 적용하면 이 문제가 모두 해결된다는 은탄환을 기대하시는 분들에겐 아쉬운 이야기이지만... 현재로선 이정도 알고 접근하시면 좀 더 지금 상황에서 필요한게 무엇인지를 생각할 수 있을 것 같습니다.

번호	말머리	제목	글쓴이	작성일	조회	추천
2863	설문	시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는?	운영자	24/05/27	-	-
475377	정보/ 정보/뉴스	잠잘때 뇌 노폐물 청소? “딱히 그렇지 않아” [48]	ㅇㅇ(182.230)	05.15	5850	27
475470	정보/ 정보/뉴스	OpenAI 공동창립자 겸 과학자 "내 직업 대체? 5년정도 걸릴듯" [26]	ㅇㅇ(59.17)	05.16	4643	28
475551	정보/ 정보/뉴스	돼지 뇌, 몸에서 분리된 채 5시간 동안 생존 [34]	ㅇㅇ(182.230)	05.16	4758	35
475219	일반	챗GPT-4o 미친것같다 진심;;; [17]	불곰적위대	05.15	8000	44
475180	일반	gpt-4o 이년 진짜 미쳤네 [45]	도서관킬러	05.15	4350	26
475173	일반	GPT-4ㅇ한테 태양계 공전 시스템 코딩시켜봄 [47]	ㅇㅇ(221.155)	05.15	5541	41
475023	일반	gpt4o으로 10분만에 만든 하노이탑 시뮬레이션 [14]	et	05.15	4264	33
475017	일반	일리야와 초정렬팀이 근본인 이유...factos [15]	ㅇㅇ(118.37)	05.15	3643	39
474896	일반	지금 특갤 상황보니까 완장들은 운영 이렇게해야할거같음 ㅇㅇ [25]	ㅇㅇ(61.97)	05.15	2844	42
474882	일반	gpt-4o 개오져서 갤순위 높아지니까 유입 분탕충새끼들 개지랄을 하네 [9]	ㅇㅇ(125.137)	05.15	2767	44
474787	정보/ 정보/뉴스	Super Alignment 프로젝트 사실상 붕괴 [6]	ㅇㅇ(119.77)	05.15	648	17
474775	일반	현재 특이점 갤러리 상황 요약.....jpg [15]	ㅇㅇ(59.9)	05.15	5430	34
474618	정보/ 정보/뉴스	새로운 언어모델 벤치마크 MMLU-Pro [15]	특갤용	05.15	506	16
474562	일반	gpt4o 이거 코드 천줄 넘어가도 잘 인식 하는데 머임? [10]	lightvector	05.15	4064	41
474535	정보/ 정보/뉴스	Google I/O 2024에서 발표된 모든 것들 [6]	니지카엘	05.15	509	15
474343	일반	속보) 일리야 큰거온다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [8]	ㅇㅇ(118.37)	05.15	5323	30
474294	일반	안전, 초정렬, 일리야 내치고도 점진적 발전 ㅇㅈㄹ ㅋㅋ [5]	ㅇㅇ(115.22)	05.15	3488	37
474251	일반	Sam Altman 오늘자 인터뷰 요약 [42]	ㅇㅇ(58.123)	05.15	5515	59
474137	정보/ 정보/뉴스	OAI 안전 정렬 팀, 다수 퇴사 혹은 해고 [3]	ㅇㅇ(119.77)	05.15	479	12
474088	정보/ 정보/뉴스	일리야, OAI와 결별 및 프로젝트 공개 예고 [12]	ㅇㅇ(119.77)	05.15	3933	38
473930	일반	??? : 흠.... [22]	ㅇㅇ(211.200)	05.15	4569	50
473884	정보/ 정보/뉴스	오늘 공개된 '제미니 1.5 플래쉬'의 혁신성 [5]	ㅇㅇ(119.77)	05.15	534	16
473681	일반	내가 느낀 openai와의 차이점 [24]	ㅇㅇ(116.123)	05.15	4411	32
473461	일반	여기서 GPT-4o 메디컬 개 미친 성능 [18]	Spark	05.15	5259	39
472895	일반	gpt4o이새끼 좀 지리는데 [6]	ㅇㅇ(121.151)	05.15	2117	24
472667	일반	GPT-4o vs GPT-4 풍경 이미지 인식 비교 [18]	elryiop	05.14	5457	37
472656	일반	gpt4o는 상상력도 풍부하네 [16]	친근한게이브	05.14	4763	43
472472	일반	진짜 나만 다른 세상인건가 4o 코딩성능 ㅈ되는거같은데 [11]	ㅇㅇ(175.213)	05.14	5244	32
472439	일반	GPT4O 갓 패치 ㅇㅈ한다	ㅇㅇ(118.235)	05.14	3515	30
472362	정보/ 정보/뉴스	오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다 [43]	rtOS	05.14	7057	53
471494	정보/ 정보/뉴스	처음으로 mathvista에서 인간을 능가한 gpt4o [24]	특술람	05.14	4069	32
472057	정보/ 정보/뉴스	OAI 이벤트 초대남이 우연히 들은 말 [10]	ㅇㅇ(119.77)	05.14	612	16
472054	일반	"숨죽였던 치타가 달리기 시작한다" [19]	ㅇㅇ(118.37)	05.14	4446	36
471541	일반	■완장들은 특갤계엄령 선포해라 분탕들 좆지랄떠는거 안보이나 [24]	ㅇㅇ(61.97)	05.14	2681	44
471512	일반	GPT-4o 실체.jpg (특슬람, 선형충 멸망) [13]	ㅇㅇ(218.238)	05.14	7052	32
471475	일반	념글 사과문제 영어로 하니까 맞추는데? [14]	ㅇㅇ(119.192)	05.14	3993	29
471384	일반	념글GPT4도 리롤하면 사과문제 못맞추잖아 [7]	ㅇㅇ(121.184)	05.14	3147	17
471376	일반	4o에 왜 열광하는지 모르겠음 [61]	비닌	05.14	6526	37
471362	일반	gpt 4o 빠른대신 구리네 [24]	ㅇㅇ(175.125)	05.14	6052	25
471328	토의	하도 근들갑 떨어대길래 공식영상 보고 왔는데 [21]	ㅇㅇ(103.212)	05.14	3761	31
471293	일반	솔직히 살짝 짜치면 개추... [8]	ㅇㅇ(183.98)	05.14	5512	40
471208	일반	gpt4o 이미지 인식 미쳤네 ㅋㅋㅋㅋ [27]	비오는날의개구리	05.14	6084	24
471167	정보/ 정보/뉴스	개쩌는 오픈AI, GPT-4o 음성 모델 영상 모음 [22]	월코존버	05.14	5279	37
471082	일반	ㄹㅇ TTS, stt 모델 갖다 버렸네 도약이노 [16]	ㅇㅇ(220.71)	05.14	4183	21
471058	일반	오늘새벽 광란의 특갤 실전 요약.jpg [10]	ㅇㅇ	05.14	4686	39
471035	일반	GPT-5 진행상황 곧 공개? [12]	ㅇㅇ(59.5)	05.14	4609	24
470838	일반	이미지 인식능력 돌았다 [9]	ㅇㅅㅇ(210.91)	05.14	3830	22
470819	일반	Gpt4o 이미지 인식능력 장난아니네 [7]	ㅇㅅㅇ(210.91)	05.14	4136	19
470537	정보/ 정보/뉴스	GPT-4o MMLU 88.7 [9]	ㅇㅇ(61.82)	05.14	3193	19
470528	AI창 AI창작	gpt4o로 만든거 gif로 쪄왔다 ㅋㅋㅋㅋ 싹 다 가속시켜!!! [18]	ㅇㅇ(121.162)	05.14	2305	22

최근 방문

즐겨찾기

즐겨찾기 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

마이너 갤러리 소개

차단하기

[특이점이 온다 갤러리]

갤러리 본문 영역

게시물을 간편하게 NFT로 만들어 보세요!

NFT 발행 방법

NFT 발행

비회원 글삭제,수정

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

파워링크 광고

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘

지갑 연결