디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] AI용어) Prompt vs Fine-tuning vs RAG

ㅇㅇ(182.230) 2024.05.03 00:07:05
조회 1353 추천 21 댓글 10
														

https://slashpage.com/haebom/dk58wg2en8xrvmnqevxz

 



7fee837fb78407f16a8fd9b707e22f05b83724e25ac2baacadaf29ef5477f3b49e90272eeb7fd70bbd



프롬프트 엔지니어링(디자인, 기법... 뭐든)

- 가장 기본적인 방법으로, 모델에게 원하는 정보를 얻기 위해 적절한 지시사항을 주는 것과 같습니다.

- 누구나 쉽게 사용할 수 있지만, 모델이 학습한 내용에 크게 의존하므로 최신 정보나 구체적인 내용을 얻는 데는 한계가 있습니다.


파인튜닝(Fine-tuning)

- 기존 언어 모델에 새로운 정보를 학습시켜 업데이트하는 것으로, 시간과 비용이 많이 들지만 특정 주제에 대해 전문성을 갖출 수 있습니다.

- 사용자가 원하는 대로 모델을 커스터마이징할 수 있고, 정확도가 높아지는 장점이 있습니다. 하지만 기술적 이해도가 필요하고 많은 데이터가 필요합니다.


RAG(Retrieval Augmented Generation)

- 언어 모델과 지식 베이스를 결합한 방식으로, 질문에 답할 때 관련 정보를 먼저 수집한 뒤 이를 바탕으로 답변을 생성합니다.

- 최신 정보가 필요하거나 다양한 주제를 다룰 때 유용하며, 프롬프트 엔지니어링과 파인튜닝의 중간 정도의 난이도와 비용이 듭니다.

- RAG의 성능은 벡터 데이터베이스의 영향을 많이 받는데, MyScale이라는 SQL 기반의 벡터 DB를 활용하면 비용 절감과 성능 향상의 이점이 있습니다.



가끔 파인튜닝과 RAG를 사용하면 할루시네이션(즉, 모델이 사실이 아닌 정보를 생성하는 현상)이나 멀티턴 대화의 어려움이 곧 잘 해결될 것이라 기대하는 분들이 있지만 이는 약간 틀립니다. 실제로 위 방법을 적용한다고 LLM이 가지는 고유한 문제점이 해결되진 않기 때문이죠.


- 할루시네이션: 파인튜닝 과정에서 모델은 제공된 학습 데이터에 매우 의존하게 됩니다. 학습 데이터가 오류를 포함하고 있거나, 충분히 다양하지 않은 경우 모델이 잘못된 정보를 학습하여, 이를 진실로 인식하고 출력할 수 있습니다. RAG의 경우, 외부 정보 소스에서 검색된 데이터의 질과 관련성에 따라 출력의 정확성이 달라질 수 있으며, 이는 때로 할루시네이션을 유발할 수 있습니다.


- 멀티턴 대화: 멀티턴 대화는 이전 대화의 맥락을 이해하고 이에 적절히 반응하는 능력을 필요로 합니다. 파인튜닝된 모델이나 RAG를 사용할 경우, 대화의 맥락을 모델이 충분히 이해하고 반영하기 위해서는 추가적인 최적화가 필요합니다. 특히, 모델이 각 대화 턴의 연관성을 정확히 파악하지 못하면 대화의 자연스러움이 떨어질 수 있습니다.


오히려 이런 경우를 바로 해결하고 싶으면 Prompt 기법들을 가져다 쓰는게 효용성이 더 높습니다. 이유는 간단한데 들인 비용에 비해 효과가 월등하기 때문입니다. 이는 모델이 좋아질 수록 더더욱 유용해질 것 입니다. 나중엔 의도하면서 말하지 않아도 앵간하면 다 처리해주는 모델들이 나올거구요.


RAG의 경우, 외부 지식 베이스에서 retrieval된 정보가 부정확하거나 불완전할 수 있습니다. 이는 모델이 잘못된 정보를 바탕으로 할루시네이션을 일으키는 원인이 될 수 있죠. 또한 대화의 맥락을 고려하지 않고 단순히 retrieval된 정보에 의존하게 되면, 멀티턴 대화에서 일관성 있는 응답을 하기 어려워집니다.


파인튜닝의 경우, 학습 데이터의 품질과 양에 크게 영향을 받습니다. 데이터가 부족하거나 편향되어 있다면, 모델은 overfitting되어 일반화 성능이 떨어질 수 있습니다. 이는 할루시네이션이나 부적절한 응답으로 이어질 수 있죠. 또한 파인튜닝된 모델은 학습 데이터에 없었던 새로운 주제나 맥락에 대해서는 대처하기 어려울 수 있습니다.


이런 점을 고려했을 때, 가성비 면에서는 프롬프트 엔지니어링이 가장 유리할 수 있습니다. 프롬프트 엔지니어링은 기존 모델의 지식을 최대한 활용하면서도, 사용자가 원하는 방향으로 모델을 유도할 수 있기 때문이죠. 또한 구현이 쉽고 비용이 적게 들어, 다양한 상황에서 빠르게 적용해볼 수 있습니다.


하지만 프로젝트의 요구사항에 따라 RAG나 파인튜닝이 더 적합한 경우도 있을 것입니다. 예를 들어 특정 도메인에 특화된 응답이 필요하다면 파인튜닝이, 실시간으로 최신 정보를 반영해야 한다면 RAG가 더 나은 선택일 수 있습니다.


결국 어떤 방식이 가장 좋을지는 프로젝트의 목적, 데이터의 특성, 가용 자원 등을 종합적으로 고려해 결정해야 할 것 같습니다. 필요에 따라 여러 방식을 함께 사용하는 것도 좋은 전략이 될 수 있겠죠. 프롬프트 엔지니어링으로 기본적인 성능을 확보하고, 파인튜닝이나 RAG를 부분적으로 적용해 보완하는 식으로요.


간단하게 비교하면 다음과 같이 비교할 순 있겠습니다.



a15714ab041eb360be3335625683746f0053452cd6a6e889d73563f69d10cd6ea07b70f91ddbcd55dfb242dc1a



하지만 위에서도 말했듯이 이 모든게 점점 쉬워질 것입니다. 실제로 최근 국내외 기업들이 이것들이 모두 가능한 서비스를 하나 둘 내놓고 있습니다. 


파인튜닝이나 RAG도 UI로 누구나 할 수 있는 시대가 성큼 성큼 다가오고 있는 것도 사실이라 어떤 방법이 무조건 좋다라는 접근법 혹은 이런 방법을 적용하면 이 문제가 모두 해결된다는 은탄환을 기대하시는 분들에겐 아쉬운 이야기이지만... 현재로선 이정도 알고 접근하시면 좀 더 지금 상황에서 필요한게 무엇인지를 생각할 수 있을 것 같습니다.

자동등록방지

추천 비추천

21

고정닉 11

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
475377 정보/ 잠잘때 뇌 노폐물 청소? “딱히 그렇지 않아” [48] ㅇㅇ(182.230) 05.15 5850 27
475470 정보/ OpenAI 공동창립자 겸 과학자 "내 직업 대체? 5년정도 걸릴듯" [26] ㅇㅇ(59.17) 05.16 4643 28
475551 정보/ 돼지 뇌, 몸에서 분리된 채 5시간 동안 생존 [34] ㅇㅇ(182.230) 05.16 4758 35
475219 일반 챗GPT-4o 미친것같다 진심;;; [17] 불곰적위대갤로그로 이동합니다. 05.15 8000 44
475180 일반 gpt-4o 이년 진짜 미쳤네 [45] 도서관킬러갤로그로 이동합니다. 05.15 4350 26
475173 일반 GPT-4ㅇ한테 태양계 공전 시스템 코딩시켜봄 [47] ㅇㅇ(221.155) 05.15 5541 41
475023 일반 gpt4o으로 10분만에 만든 하노이탑 시뮬레이션 [14] et갤로그로 이동합니다. 05.15 4264 33
475017 일반 일리야와 초정렬팀이 근본인 이유...factos [15] ㅇㅇ(118.37) 05.15 3643 39
474896 일반 지금 특갤 상황보니까 완장들은 운영 이렇게해야할거같음 ㅇㅇ [25] ㅇㅇ(61.97) 05.15 2844 42
474882 일반 gpt-4o 개오져서 갤순위 높아지니까 유입 분탕충새끼들 개지랄을 하네 [9] ㅇㅇ(125.137) 05.15 2767 44
474787 정보/ Super Alignment 프로젝트 사실상 붕괴 [6] ㅇㅇ(119.77) 05.15 648 17
474775 일반 현재 특이점 갤러리 상황 요약.....jpg [15] ㅇㅇ(59.9) 05.15 5430 34
474618 정보/ 새로운 언어모델 벤치마크 MMLU-Pro [15] 특갤용갤로그로 이동합니다. 05.15 506 16
474562 일반 gpt4o 이거 코드 천줄 넘어가도 잘 인식 하는데 머임? [10] lightvector갤로그로 이동합니다. 05.15 4064 41
474535 정보/ Google I/O 2024에서 발표된 모든 것들 [6] 니지카엘갤로그로 이동합니다. 05.15 509 15
474343 일반 속보) 일리야 큰거온다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [8] ㅇㅇ(118.37) 05.15 5323 30
474294 일반 안전, 초정렬, 일리야 내치고도 점진적 발전 ㅇㅈㄹ ㅋㅋ [5] ㅇㅇ(115.22) 05.15 3488 37
474251 일반 Sam Altman 오늘자 인터뷰 요약 [42] ㅇㅇ(58.123) 05.15 5515 59
474137 정보/ OAI 안전 정렬 팀, 다수 퇴사 혹은 해고 [3] ㅇㅇ(119.77) 05.15 479 12
474088 정보/ 일리야, OAI와 결별 및 프로젝트 공개 예고 [12] ㅇㅇ(119.77) 05.15 3933 38
473930 일반 ??? : 흠.... [22] ㅇㅇ(211.200) 05.15 4569 50
473884 정보/ 오늘 공개된 '제미니 1.5 플래쉬'의 혁신성 [5] ㅇㅇ(119.77) 05.15 534 16
473681 일반 내가 느낀 openai와의 차이점 [24] ㅇㅇ(116.123) 05.15 4411 32
473461 일반 여기서 GPT-4o 메디컬 개 미친 성능 [18] Spark갤로그로 이동합니다. 05.15 5259 39
472895 일반 gpt4o이새끼 좀 지리는데 [6] ㅇㅇ(121.151) 05.15 2117 24
472667 일반 GPT-4o vs GPT-4 풍경 이미지 인식 비교 [18] elryiop갤로그로 이동합니다. 05.14 5457 37
472656 일반 gpt4o는 상상력도 풍부하네 [16] 친근한게이브갤로그로 이동합니다. 05.14 4763 43
472472 일반 진짜 나만 다른 세상인건가 4o 코딩성능 ㅈ되는거같은데 [11] ㅇㅇ(175.213) 05.14 5244 32
472439 일반 GPT4O 갓 패치 ㅇㅈ한다 ㅇㅇ(118.235) 05.14 3515 30
472362 정보/ 오픈AI 직원 : 사람들이 GPT-4o에 대해 오해하고 있다 [43] rtOS갤로그로 이동합니다. 05.14 7057 53
471494 정보/ 처음으로 mathvista에서 인간을 능가한 gpt4o [24] 특술람갤로그로 이동합니다. 05.14 4069 32
472057 정보/ OAI 이벤트 초대남이 우연히 들은 말 [10] ㅇㅇ(119.77) 05.14 612 16
472054 일반 "숨죽였던 치타가 달리기 시작한다" [19] ㅇㅇ(118.37) 05.14 4446 36
471541 일반 ■완장들은 특갤계엄령 선포해라 분탕들 좆지랄떠는거 안보이나 [24] ㅇㅇ(61.97) 05.14 2681 44
471512 일반 GPT-4o 실체.jpg (특슬람, 선형충 멸망) [13] ㅇㅇ(218.238) 05.14 7052 32
471475 일반 념글 사과문제 영어로 하니까 맞추는데? [14] ㅇㅇ(119.192) 05.14 3993 29
471384 일반 념글GPT4도 리롤하면 사과문제 못맞추잖아 [7] ㅇㅇ(121.184) 05.14 3147 17
471376 일반 4o에 왜 열광하는지 모르겠음 [61] 비닌갤로그로 이동합니다. 05.14 6526 37
471362 일반 gpt 4o 빠른대신 구리네 [24] ㅇㅇ(175.125) 05.14 6052 25
471328 토의 하도 근들갑 떨어대길래 공식영상 보고 왔는데 [21] ㅇㅇ(103.212) 05.14 3761 31
471293 일반 솔직히 살짝 짜치면 개추... [8] ㅇㅇ(183.98) 05.14 5512 40
471208 일반 gpt4o 이미지 인식 미쳤네 ㅋㅋㅋㅋ [27] 비오는날의개구리갤로그로 이동합니다. 05.14 6084 24
471167 정보/ 개쩌는 오픈AI, GPT-4o 음성 모델 영상 모음 [22] 월코존버갤로그로 이동합니다. 05.14 5279 37
471082 일반 ㄹㅇ TTS, stt 모델 갖다 버렸네 도약이노 [16] ㅇㅇ(220.71) 05.14 4183 21
471058 일반 오늘새벽 광란의 특갤 실전 요약.jpg [10] ㅇㅇ갤로그로 이동합니다. 05.14 4686 39
471035 일반 GPT-5 진행상황 곧 공개? [12] ㅇㅇ(59.5) 05.14 4609 24
470838 일반 이미지 인식능력 돌았다 [9] ㅇㅅㅇ(210.91) 05.14 3830 22
470819 일반 Gpt4o 이미지 인식능력 장난아니네 [7] ㅇㅅㅇ(210.91) 05.14 4136 19
470537 정보/ GPT-4o MMLU 88.7 [9] ㅇㅇ(61.82) 05.14 3193 19
470528 AI창 gpt4o로 만든거 gif로 쪄왔다 ㅋㅋㅋㅋ 싹 다 가속시켜!!! [18] ㅇㅇ(121.162) 05.14 2305 22
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2