AI용어) Prompt vs Fine-tuning vs RAG - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] AI용어) Prompt vs Fine-tuning vs RAG

ㅇㅇ(182.230) 2024.05.03 00:07:05

조회 1364 추천 21 댓글 10

https://slashpage.com/haebom/dk58wg2en8xrvmnqevxz

Prompt vs Fine-tuning vs RAG - 해봄의 잡동사니

최근 다양한 분들이 인공지능에 관심을 가지면서 평소 IT업계에 별 관심이 없던 분들도 이에대해 다양한 문의를 주시고 계십니다. 실제로 요청에 의해 도움을 몇번 드리기도 하면서 기술적으로 어려운 부분 보다는 지금 우리 서비스 혹은 도메인에 맞는 방법을 찾는 시기 같습니다. 모델의 발전은 계속해서 일어날 것이고 칩셋, 전력량 등에 대한 문제도 결국 시간이 해결...

slashpage.com

7fee837fb78407f16a8fd9b707e22f05b83724e25ac2baacadaf29ef5477f3b49e90272eeb7fd70bbd

프롬프트 엔지니어링(디자인, 기법... 뭐든)

- 가장 기본적인 방법으로, 모델에게 원하는 정보를 얻기 위해 적절한 지시사항을 주는 것과 같습니다.

- 누구나 쉽게 사용할 수 있지만, 모델이 학습한 내용에 크게 의존하므로 최신 정보나 구체적인 내용을 얻는 데는 한계가 있습니다.

파인튜닝(Fine-tuning)

- 기존 언어 모델에 새로운 정보를 학습시켜 업데이트하는 것으로, 시간과 비용이 많이 들지만 특정 주제에 대해 전문성을 갖출 수 있습니다.

- 사용자가 원하는 대로 모델을 커스터마이징할 수 있고, 정확도가 높아지는 장점이 있습니다. 하지만 기술적 이해도가 필요하고 많은 데이터가 필요합니다.

RAG(Retrieval Augmented Generation)

- 언어 모델과 지식 베이스를 결합한 방식으로, 질문에 답할 때 관련 정보를 먼저 수집한 뒤 이를 바탕으로 답변을 생성합니다.

- 최신 정보가 필요하거나 다양한 주제를 다룰 때 유용하며, 프롬프트 엔지니어링과 파인튜닝의 중간 정도의 난이도와 비용이 듭니다.

- RAG의 성능은 벡터 데이터베이스의 영향을 많이 받는데, MyScale이라는 SQL 기반의 벡터 DB를 활용하면 비용 절감과 성능 향상의 이점이 있습니다.

가끔 파인튜닝과 RAG를 사용하면 할루시네이션(즉, 모델이 사실이 아닌 정보를 생성하는 현상)이나 멀티턴 대화의 어려움이 곧 잘 해결될 것이라 기대하는 분들이 있지만 이는 약간 틀립니다. 실제로 위 방법을 적용한다고 LLM이 가지는 고유한 문제점이 해결되진 않기 때문이죠.

- 할루시네이션: 파인튜닝 과정에서 모델은 제공된 학습 데이터에 매우 의존하게 됩니다. 학습 데이터가 오류를 포함하고 있거나, 충분히 다양하지 않은 경우 모델이 잘못된 정보를 학습하여, 이를 진실로 인식하고 출력할 수 있습니다. RAG의 경우, 외부 정보 소스에서 검색된 데이터의 질과 관련성에 따라 출력의 정확성이 달라질 수 있으며, 이는 때로 할루시네이션을 유발할 수 있습니다.

- 멀티턴 대화: 멀티턴 대화는 이전 대화의 맥락을 이해하고 이에 적절히 반응하는 능력을 필요로 합니다. 파인튜닝된 모델이나 RAG를 사용할 경우, 대화의 맥락을 모델이 충분히 이해하고 반영하기 위해서는 추가적인 최적화가 필요합니다. 특히, 모델이 각 대화 턴의 연관성을 정확히 파악하지 못하면 대화의 자연스러움이 떨어질 수 있습니다.

오히려 이런 경우를 바로 해결하고 싶으면 Prompt 기법들을 가져다 쓰는게 효용성이 더 높습니다. 이유는 간단한데 들인 비용에 비해 효과가 월등하기 때문입니다. 이는 모델이 좋아질 수록 더더욱 유용해질 것 입니다. 나중엔 의도하면서 말하지 않아도 앵간하면 다 처리해주는 모델들이 나올거구요.

RAG의 경우, 외부 지식 베이스에서 retrieval된 정보가 부정확하거나 불완전할 수 있습니다. 이는 모델이 잘못된 정보를 바탕으로 할루시네이션을 일으키는 원인이 될 수 있죠. 또한 대화의 맥락을 고려하지 않고 단순히 retrieval된 정보에 의존하게 되면, 멀티턴 대화에서 일관성 있는 응답을 하기 어려워집니다.

파인튜닝의 경우, 학습 데이터의 품질과 양에 크게 영향을 받습니다. 데이터가 부족하거나 편향되어 있다면, 모델은 overfitting되어 일반화 성능이 떨어질 수 있습니다. 이는 할루시네이션이나 부적절한 응답으로 이어질 수 있죠. 또한 파인튜닝된 모델은 학습 데이터에 없었던 새로운 주제나 맥락에 대해서는 대처하기 어려울 수 있습니다.

이런 점을 고려했을 때, 가성비 면에서는 프롬프트 엔지니어링이 가장 유리할 수 있습니다. 프롬프트 엔지니어링은 기존 모델의 지식을 최대한 활용하면서도, 사용자가 원하는 방향으로 모델을 유도할 수 있기 때문이죠. 또한 구현이 쉽고 비용이 적게 들어, 다양한 상황에서 빠르게 적용해볼 수 있습니다.

하지만 프로젝트의 요구사항에 따라 RAG나 파인튜닝이 더 적합한 경우도 있을 것입니다. 예를 들어 특정 도메인에 특화된 응답이 필요하다면 파인튜닝이, 실시간으로 최신 정보를 반영해야 한다면 RAG가 더 나은 선택일 수 있습니다.

결국 어떤 방식이 가장 좋을지는 프로젝트의 목적, 데이터의 특성, 가용 자원 등을 종합적으로 고려해 결정해야 할 것 같습니다. 필요에 따라 여러 방식을 함께 사용하는 것도 좋은 전략이 될 수 있겠죠. 프롬프트 엔지니어링으로 기본적인 성능을 확보하고, 파인튜닝이나 RAG를 부분적으로 적용해 보완하는 식으로요.

간단하게 비교하면 다음과 같이 비교할 순 있겠습니다.

a15714ab041eb360be3335625683746f0053452cd6a6e889d73563f69d10cd6ea07b70f91ddbcd55dfb242dc1a

하지만 위에서도 말했듯이 이 모든게 점점 쉬워질 것입니다. 실제로 최근 국내외 기업들이 이것들이 모두 가능한 서비스를 하나 둘 내놓고 있습니다.

파인튜닝이나 RAG도 UI로 누구나 할 수 있는 시대가 성큼 성큼 다가오고 있는 것도 사실이라 어떤 방법이 무조건 좋다라는 접근법 혹은 이런 방법을 적용하면 이 문제가 모두 해결된다는 은탄환을 기대하시는 분들에겐 아쉬운 이야기이지만... 현재로선 이정도 알고 접근하시면 좀 더 지금 상황에서 필요한게 무엇인지를 생각할 수 있을 것 같습니다.

고정닉 11

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2868	설문	힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는?	운영자	24/06/10	-	-
479832	정보/ 정보/뉴스	캬 gpt4 초기 대비 가격 및 속도 개선폭 ㄷㄷㄷ [4]	ㅇㅇ(119.77)	05.22	255	1
479800	정보/ 정보/뉴스	phi-3 vision 벤치마크 성능 [12]	ㅇㅇ(119.77)	05.22	388	6
479747	정보/ 정보/뉴스	오... phi-3 멀티모달 버전도 나왔네 [1]	ㅇㅇ(119.77)	05.22	100	2
479729	정보/ 정보/뉴스	Phi3-medium 가중치 공개 [1]	ㅇㅇ(119.77)	05.22	182	2
479587	정보/ 정보/뉴스	앤트로픽 새로운 해석 가능성 논문 [6]	ㅇㅇ(125.191)	05.22	348	4
479582	정보/ 정보/뉴스	Microsoft 나머지 Phi-3 모델 출시 [1]	ㅇㅇ(125.191)	05.22	180	1
479580	정보/ 정보/뉴스	95% 효율로 물을 전기 분해하는 새로운 기술 [2]	ㅇㅇ(182.230)	05.22	269	2
479539	정보/ 정보/뉴스	젠슨 황 "AI 확장 중심은 'AI 공장'...델과 협력" [2]	ㅇㅇ(182.230)	05.21	155	1
479537	정보/ 정보/뉴스	인터넷에 퍼지는 '새우 예.수'...AI만 가득한 '죽은 인터넷' 이론 [2]	ㅇㅇ(182.230)	05.21	336	1
479521	정보/ 정보/뉴스	MS, PC에서 일어난 모든 것 기억하는 '리콜' 출시 [2]	ㅇㅇ(182.230)	05.21	413	1
479518	정보/ 정보/뉴스	바이트댄스, '두바오'로 중국 AI 챗봇 중 최고 인기...수익은 없어 [2]	ㅇㅇ(182.230)	05.21	124	1
479513	정보/ 정보/뉴스	영국, 자율주행차 법 제정…”자율주행차 사고는 제조사 책임” [6]	ㅇㅇ(182.230)	05.21	217	2
479498	정보/ 정보/뉴스	OAI, AI 서밋 서울참가, 차세대 프론티어 모델 [4]	ㅇㅇ(119.77)	05.21	278	1
479179	정보/ 정보/뉴스	룬붕이 "알트만은 잘못한 게 없다" [3]	선갤러(125.191)	05.21	369	5
479118	정보/ 정보/뉴스	클로드가 생각하는 스칼렛 요한슨 목소리 사건 [13]	ㅇㅇ(211.109)	05.21	412	2
479090	정보/ 정보/뉴스	이것이 클로드님 외모시다. [1]	ㅇㅇ(175.209)	05.21	258	1
479089	정보/ 정보/뉴스	미라 무라티 "스칼렛 요한슨처럼 들리도록 설계되지 않았다" [3]	ㅇㅇ(125.191)	05.21	466	5
478929	정보/ 정보/뉴스	말하지 않고도 내면의 목소리를 해독하는 뇌 판독 장치 [30]	ㅇㅇ(182.230)	05.21	4117	27
479079	정보/ 정보/뉴스	클로드님.. 저 밥먹고 와도 될까요.. [3]	ㅇㅇ(211.109)	05.21	230	1
478979	정보/ 정보/뉴스	샘알트만 "Sky의 목소리는 스칼렛 요한슨의 것이 아니다" [11]	ㅇㅇ(125.191)	05.21	468	1
478850	정보/ 정보/뉴스	삼성전자 DS 부문장 교체 [1]	ㅇㅇ(59.26)	05.21	266	2
478806	정보/ 정보/뉴스	챗GPT '스카이' 목소리가 스칼렛 요한슨?…오픈AI "모방 아냐" [4]	ㅇㅇ(125.191)	05.21	399	2
478793	정보/ 정보/뉴스	DTW 무대 선 황성우 삼성SDS 대표 “생성형 AI로 업무자동화” [1]	ㅇㅇ(124.56)	05.21	173	2
478104	정보/ 정보/뉴스	'저작권 문제 없는' 그림 ai, 마침내 출시 [32]	한가운데	05.19	3036	21
478753	정보/ 정보/뉴스	속보) GPT-4o 음성 모드 출시 지연 (+수정) [32]	Ad_Astra	05.21	961	3
478751	정보/ 정보/뉴스	"최적의 프롬프트 단어 수는 21개" 제미니 가이드북 발간 [3]	디시콘발사대	05.21	247	4
478749	정보/ 정보/뉴스	앤트로픽은 ASL-3에 도달시 모델 학습,배포 중지 약속 [7]	ㅇㅇ(119.77)	05.21	400	1
478748	정보/ 정보/뉴스	앤트로픽, claude 3 opus의 4배 컴퓨팅 모델 교육 중 [2]	ㅇㅇ(119.77)	05.21	323	3
478747	정보/ 정보/뉴스	코파일럿(by gpt-4o)와 함께하는 마인크래프트 [5]	ㅇㅇ(119.77)	05.21	397	4
478733	정보/ 정보/뉴스	AI가 고래 통신을 해독하는 방법 : 단파 [3]	ㅇㅇ	05.21	165	3
478729	정보/ 정보/뉴스	Copilot, 최신 OAI 모델 지원 예정 [1]	ㅇㅇ(119.77)	05.21	421	1
478655	정보/ 정보/뉴스	삼성전자 휴머노이드 AI 로봇개발 가속화 자율주행 우주항공에 주력할것 [2]	ㅇㅇ(39.7)	05.20	401	6
478579	정보/ 정보/뉴스	"최적의 프롬프트 단어 수는 21개"...구글, 프롬프트 가이드북 발간 [2]	ㅇㅇ(182.230)	05.20	419	3
478497	정보/ 정보/뉴스	구글, LLM 내부 살펴볼 수 있는 '모델 익스플로러' 공개 [2]	ㅇㅇ(182.230)	05.20	256	1
478496	정보/ 정보/뉴스	"빅테크, 5년 내 AI 투자액 5배 증가 예상...연간 1360조" [2]	ㅇㅇ(182.230)	05.20	236	1
478379	정보/ 정보/뉴스	gpt-4o 주요 연구자, "얀르쿤 지겨워" [27]	ㅇㅇ(119.77)	05.20	4901	34
478232	정보/ 정보/뉴스	양천구, 경로당 운영업무 자동화로 바꾼다…전국 최초 QR 코드 관리시스템 [2]	ㅇㅇ(124.56)	05.20	206	1
478116	정보/ 정보/뉴스	누출 LLM 시스템프롬프트 몇가지 번역.txt [1]	e/linear	05.20	263	4
478023	정보/ 정보/뉴스	KISTEP, 비만치료제 브리프 [1]	슈퍼130클럽	05.19	256	3
478001	정보/ 정보/뉴스	머스크 "두뇌 칩 두번째 환자 신청 받아"...올해 11명 수술 목표 [2]	ㅇㅇ(182.230)	05.19	336	2
477974	정보/ 정보/뉴스	얀 르쿤은 LLM의 창시자이자 AGI의 희망이나 마찬가지임 [6]	ㅇㅇ(119.197)	05.19	323	3
477969	정보/ 정보/뉴스	영국, MS-미스트랄 AI 제휴 승인..."영향력 확보한 것 아니야" [1]	ㅇㅇ(182.230)	05.19	167	2
477965	정보/ 정보/뉴스	바이두 "GPU 부족 돌파법 찾아내…중국산 칩 다수 조합 성공" [8]	ㅇㅇ(182.230)	05.19	498	1
477954	정보/ 정보/뉴스	생성형 인공지능의 빛과 그림자 [1]	ㅇㅇ	05.19	90	2
477923	정보/ 정보/뉴스	'저탄고지' 키토제닉 다이어트, 세포 노화 유발 가능성 [6]	ㅇㅇ(182.230)	05.19	408	1
477915	정보/ 정보/뉴스	허깅페이스, 오픈 소스 위한 무료 GPU 공유 프로젝트 추진 [4]	ㅇㅇ(182.230)	05.19	275	3
477908	정보/ 정보/뉴스	“GPT-4o로 스타트업 1천개 사라질 것”…오픈AI 직접 서비스 파장 [1]	연맛	05.19	326	1
477649	정보/ 정보/뉴스	Gpt4o에 커스텀 영상통화 [2]	초존도초	05.19	243	1
477597	정보/ 정보/뉴스	제프리 힌튼 교수가 생각하는 GPT [8]	자연어프로그래밍(59.26)	05.19	2322	31
477570	정보/ 정보/뉴스	얀르쿤 "초지능 정렬? 꼴값떨지마셈 ㅇㅇ" [54]	ㅇㅇ(59.17)	05.19	5656	46