디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] AI용어) Prompt vs Fine-tuning vs RAG

ㅇㅇ(182.230) 2024.05.03 00:07:05
조회 1364 추천 21 댓글 10
														

https://slashpage.com/haebom/dk58wg2en8xrvmnqevxz

 



7fee837fb78407f16a8fd9b707e22f05b83724e25ac2baacadaf29ef5477f3b49e90272eeb7fd70bbd



프롬프트 엔지니어링(디자인, 기법... 뭐든)

- 가장 기본적인 방법으로, 모델에게 원하는 정보를 얻기 위해 적절한 지시사항을 주는 것과 같습니다.

- 누구나 쉽게 사용할 수 있지만, 모델이 학습한 내용에 크게 의존하므로 최신 정보나 구체적인 내용을 얻는 데는 한계가 있습니다.


파인튜닝(Fine-tuning)

- 기존 언어 모델에 새로운 정보를 학습시켜 업데이트하는 것으로, 시간과 비용이 많이 들지만 특정 주제에 대해 전문성을 갖출 수 있습니다.

- 사용자가 원하는 대로 모델을 커스터마이징할 수 있고, 정확도가 높아지는 장점이 있습니다. 하지만 기술적 이해도가 필요하고 많은 데이터가 필요합니다.


RAG(Retrieval Augmented Generation)

- 언어 모델과 지식 베이스를 결합한 방식으로, 질문에 답할 때 관련 정보를 먼저 수집한 뒤 이를 바탕으로 답변을 생성합니다.

- 최신 정보가 필요하거나 다양한 주제를 다룰 때 유용하며, 프롬프트 엔지니어링과 파인튜닝의 중간 정도의 난이도와 비용이 듭니다.

- RAG의 성능은 벡터 데이터베이스의 영향을 많이 받는데, MyScale이라는 SQL 기반의 벡터 DB를 활용하면 비용 절감과 성능 향상의 이점이 있습니다.



가끔 파인튜닝과 RAG를 사용하면 할루시네이션(즉, 모델이 사실이 아닌 정보를 생성하는 현상)이나 멀티턴 대화의 어려움이 곧 잘 해결될 것이라 기대하는 분들이 있지만 이는 약간 틀립니다. 실제로 위 방법을 적용한다고 LLM이 가지는 고유한 문제점이 해결되진 않기 때문이죠.


- 할루시네이션: 파인튜닝 과정에서 모델은 제공된 학습 데이터에 매우 의존하게 됩니다. 학습 데이터가 오류를 포함하고 있거나, 충분히 다양하지 않은 경우 모델이 잘못된 정보를 학습하여, 이를 진실로 인식하고 출력할 수 있습니다. RAG의 경우, 외부 정보 소스에서 검색된 데이터의 질과 관련성에 따라 출력의 정확성이 달라질 수 있으며, 이는 때로 할루시네이션을 유발할 수 있습니다.


- 멀티턴 대화: 멀티턴 대화는 이전 대화의 맥락을 이해하고 이에 적절히 반응하는 능력을 필요로 합니다. 파인튜닝된 모델이나 RAG를 사용할 경우, 대화의 맥락을 모델이 충분히 이해하고 반영하기 위해서는 추가적인 최적화가 필요합니다. 특히, 모델이 각 대화 턴의 연관성을 정확히 파악하지 못하면 대화의 자연스러움이 떨어질 수 있습니다.


오히려 이런 경우를 바로 해결하고 싶으면 Prompt 기법들을 가져다 쓰는게 효용성이 더 높습니다. 이유는 간단한데 들인 비용에 비해 효과가 월등하기 때문입니다. 이는 모델이 좋아질 수록 더더욱 유용해질 것 입니다. 나중엔 의도하면서 말하지 않아도 앵간하면 다 처리해주는 모델들이 나올거구요.


RAG의 경우, 외부 지식 베이스에서 retrieval된 정보가 부정확하거나 불완전할 수 있습니다. 이는 모델이 잘못된 정보를 바탕으로 할루시네이션을 일으키는 원인이 될 수 있죠. 또한 대화의 맥락을 고려하지 않고 단순히 retrieval된 정보에 의존하게 되면, 멀티턴 대화에서 일관성 있는 응답을 하기 어려워집니다.


파인튜닝의 경우, 학습 데이터의 품질과 양에 크게 영향을 받습니다. 데이터가 부족하거나 편향되어 있다면, 모델은 overfitting되어 일반화 성능이 떨어질 수 있습니다. 이는 할루시네이션이나 부적절한 응답으로 이어질 수 있죠. 또한 파인튜닝된 모델은 학습 데이터에 없었던 새로운 주제나 맥락에 대해서는 대처하기 어려울 수 있습니다.


이런 점을 고려했을 때, 가성비 면에서는 프롬프트 엔지니어링이 가장 유리할 수 있습니다. 프롬프트 엔지니어링은 기존 모델의 지식을 최대한 활용하면서도, 사용자가 원하는 방향으로 모델을 유도할 수 있기 때문이죠. 또한 구현이 쉽고 비용이 적게 들어, 다양한 상황에서 빠르게 적용해볼 수 있습니다.


하지만 프로젝트의 요구사항에 따라 RAG나 파인튜닝이 더 적합한 경우도 있을 것입니다. 예를 들어 특정 도메인에 특화된 응답이 필요하다면 파인튜닝이, 실시간으로 최신 정보를 반영해야 한다면 RAG가 더 나은 선택일 수 있습니다.


결국 어떤 방식이 가장 좋을지는 프로젝트의 목적, 데이터의 특성, 가용 자원 등을 종합적으로 고려해 결정해야 할 것 같습니다. 필요에 따라 여러 방식을 함께 사용하는 것도 좋은 전략이 될 수 있겠죠. 프롬프트 엔지니어링으로 기본적인 성능을 확보하고, 파인튜닝이나 RAG를 부분적으로 적용해 보완하는 식으로요.


간단하게 비교하면 다음과 같이 비교할 순 있겠습니다.



a15714ab041eb360be3335625683746f0053452cd6a6e889d73563f69d10cd6ea07b70f91ddbcd55dfb242dc1a



하지만 위에서도 말했듯이 이 모든게 점점 쉬워질 것입니다. 실제로 최근 국내외 기업들이 이것들이 모두 가능한 서비스를 하나 둘 내놓고 있습니다. 


파인튜닝이나 RAG도 UI로 누구나 할 수 있는 시대가 성큼 성큼 다가오고 있는 것도 사실이라 어떤 방법이 무조건 좋다라는 접근법 혹은 이런 방법을 적용하면 이 문제가 모두 해결된다는 은탄환을 기대하시는 분들에겐 아쉬운 이야기이지만... 현재로선 이정도 알고 접근하시면 좀 더 지금 상황에서 필요한게 무엇인지를 생각할 수 있을 것 같습니다.

자동등록방지

추천 비추천

21

고정닉 11

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
479832 정보/ 캬 gpt4 초기 대비 가격 및 속도 개선폭 ㄷㄷㄷ [4] ㅇㅇ(119.77) 05.22 255 1
479800 정보/ phi-3 vision 벤치마크 성능 [12] ㅇㅇ(119.77) 05.22 388 6
479747 정보/ 오... phi-3 멀티모달 버전도 나왔네 [1] ㅇㅇ(119.77) 05.22 100 2
479729 정보/ Phi3-medium 가중치 공개 [1] ㅇㅇ(119.77) 05.22 182 2
479587 정보/ 앤트로픽 새로운 해석 가능성 논문 [6] ㅇㅇ(125.191) 05.22 348 4
479582 정보/ Microsoft 나머지 Phi-3 모델 출시 [1] ㅇㅇ(125.191) 05.22 180 1
479580 정보/ 95% 효율로 물을 전기 분해하는 새로운 기술 [2] ㅇㅇ(182.230) 05.22 269 2
479539 정보/ 젠슨 황 "AI 확장 중심은 'AI 공장'...델과 협력" [2] ㅇㅇ(182.230) 05.21 155 1
479537 정보/ 인터넷에 퍼지는 '새우 예.수'...AI만 가득한 '죽은 인터넷' 이론 [2] ㅇㅇ(182.230) 05.21 336 1
479521 정보/ MS, PC에서 일어난 모든 것 기억하는 '리콜' 출시 [2] ㅇㅇ(182.230) 05.21 413 1
479518 정보/ 바이트댄스, '두바오'로 중국 AI 챗봇 중 최고 인기...수익은 없어 [2] ㅇㅇ(182.230) 05.21 124 1
479513 정보/ 영국, 자율주행차 법 제정…”자율주행차 사고는 제조사 책임” [6] ㅇㅇ(182.230) 05.21 217 2
479498 정보/ OAI, AI 서밋 서울참가, 차세대 프론티어 모델 [4] ㅇㅇ(119.77) 05.21 278 1
479179 정보/ 룬붕이 "알트만은 잘못한 게 없다" [3] 선갤러(125.191) 05.21 369 5
479118 정보/ 클로드가 생각하는 스칼렛 요한슨 목소리 사건 [13] ㅇㅇ(211.109) 05.21 412 2
479090 정보/ 이것이 클로드님 외모시다. [1] ㅇㅇ(175.209) 05.21 258 1
479089 정보/ 미라 무라티 "스칼렛 요한슨처럼 들리도록 설계되지 않았다" [3] ㅇㅇ(125.191) 05.21 466 5
478929 정보/ 말하지 않고도 내면의 목소리를 해독하는 뇌 판독 장치 [30] ㅇㅇ(182.230) 05.21 4117 27
479079 정보/ 클로드님.. 저 밥먹고 와도 될까요.. [3] ㅇㅇ(211.109) 05.21 230 1
478979 정보/ 샘알트만 "Sky의 목소리는 스칼렛 요한슨의 것이 아니다" [11] ㅇㅇ(125.191) 05.21 468 1
478850 정보/ 삼성전자 DS 부문장 교체 [1] ㅇㅇ(59.26) 05.21 266 2
478806 정보/ 챗GPT '스카이' 목소리가 스칼렛 요한슨?…오픈AI "모방 아냐" [4] ㅇㅇ(125.191) 05.21 399 2
478793 정보/ DTW 무대 선 황성우 삼성SDS 대표 “생성형 AI로 업무자동화” [1] ㅇㅇ(124.56) 05.21 173 2
478104 정보/ '저작권 문제 없는' 그림 ai, 마침내 출시 [32] 한가운데갤로그로 이동합니다. 05.19 3036 21
478753 정보/ 속보) GPT-4o 음성 모드 출시 지연 (+수정) [32] Ad_Astra갤로그로 이동합니다. 05.21 961 3
478751 정보/ "최적의 프롬프트 단어 수는 21개" 제미니 가이드북 발간 [3] 디시콘발사대갤로그로 이동합니다. 05.21 247 4
478749 정보/ 앤트로픽은 ASL-3에 도달시 모델 학습,배포 중지 약속 [7] ㅇㅇ(119.77) 05.21 400 1
478748 정보/ 앤트로픽, claude 3 opus의 4배 컴퓨팅 모델 교육 중 [2] ㅇㅇ(119.77) 05.21 323 3
478747 정보/ 코파일럿(by gpt-4o)와 함께하는 마인크래프트 [5] ㅇㅇ(119.77) 05.21 397 4
478733 정보/ AI가 고래 통신을 해독하는 방법 : 단파 [3] ㅇㅇ갤로그로 이동합니다. 05.21 165 3
478729 정보/ Copilot, 최신 OAI 모델 지원 예정 [1] ㅇㅇ(119.77) 05.21 421 1
478655 정보/ 삼성전자 휴머노이드 AI 로봇개발 가속화 자율주행 우주항공에 주력할것 [2] ㅇㅇ(39.7) 05.20 401 6
478579 정보/ "최적의 프롬프트 단어 수는 21개"...구글, 프롬프트 가이드북 발간 [2] ㅇㅇ(182.230) 05.20 419 3
478497 정보/ 구글, LLM 내부 살펴볼 수 있는 '모델 익스플로러' 공개 [2] ㅇㅇ(182.230) 05.20 256 1
478496 정보/ "빅테크, 5년 내 AI 투자액 5배 증가 예상...연간 1360조" [2] ㅇㅇ(182.230) 05.20 236 1
478379 정보/ gpt-4o 주요 연구자, "얀르쿤 지겨워" [27] ㅇㅇ(119.77) 05.20 4901 34
478232 정보/ 양천구, 경로당 운영업무 자동화로 바꾼다…전국 최초 QR 코드 관리시스템 [2] ㅇㅇ(124.56) 05.20 206 1
478116 정보/ 누출 LLM 시스템프롬프트 몇가지 번역.txt [1] e/linear갤로그로 이동합니다. 05.20 263 4
478023 정보/ KISTEP, 비만치료제 브리프 [1] 슈퍼130클럽갤로그로 이동합니다. 05.19 256 3
478001 정보/ 머스크 "두뇌 칩 두번째 환자 신청 받아"...올해 11명 수술 목표 [2] ㅇㅇ(182.230) 05.19 336 2
477974 정보/ 얀 르쿤은 LLM의 창시자이자 AGI의 희망이나 마찬가지임 [6] ㅇㅇ(119.197) 05.19 323 3
477969 정보/ 영국, MS-미스트랄 AI 제휴 승인..."영향력 확보한 것 아니야" [1] ㅇㅇ(182.230) 05.19 167 2
477965 정보/ 바이두 "GPU 부족 돌파법 찾아내…중국산 칩 다수 조합 성공" [8] ㅇㅇ(182.230) 05.19 498 1
477954 정보/ 생성형 인공지능의 빛과 그림자 [1] ㅇㅇ갤로그로 이동합니다. 05.19 90 2
477923 정보/ '저탄고지' 키토제닉 다이어트, 세포 노화 유발 가능성 [6] ㅇㅇ(182.230) 05.19 408 1
477915 정보/ 허깅페이스, 오픈 소스 위한 무료 GPU 공유 프로젝트 추진 [4] ㅇㅇ(182.230) 05.19 275 3
477908 정보/ “GPT-4o로 스타트업 1천개 사라질 것”…오픈AI 직접 서비스 파장 [1] 연맛갤로그로 이동합니다. 05.19 326 1
477649 정보/ Gpt4o에 커스텀 영상통화 [2] 초존도초갤로그로 이동합니다. 05.19 243 1
477597 정보/ 제프리 힌튼 교수가 생각하는 GPT [8] 자연어프로그래밍(59.26) 05.19 2322 31
477570 정보/ 얀르쿤 "초지능 정렬? 꼴값떨지마셈 ㅇㅇ" [54] ㅇㅇ(59.17) 05.19 5656 46
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2