생성형 AI를 똑똑하게 해주는 검색증강생성(RAG)란?
검색 증강 생성 (RAG, Retrieval Augmented Generation)이란?
- 생성형 AI인 LLM이 참조할 수 있는 별도 정보원을 제공하여 환각 현상을 방지하고 답변 품질을 개선하는 기법이다.
- RAG를 적용하면 오픈 소스 LLM에 미세조정 없이도 성능 좋은 LLM의 보안과 성능을 개선할 수 있다.
벡터 DB와 프롬프트 엔지니어링
- RAG에서는 벡터 DB에 사전에 제공할 문맥을 저장하고, 프롬프트 엔지니어링을 통해 LLM에 원하는 답변을 유도할 수 있다.
- 벡터 DB는 문서를 실수로 바꾸어주는 임베딩 과정을 거친다.
LLM과의 연동
- RAG는 LLM과의 연동을 전제로 하며, GPT와 같은 성능 모델을 활용하거나 도메인에 특화된 LLM을 제작하여 연동할 수 있다.
- 다양한 아키텍처를 고려하여 sLLM을 추가적으로 연동할 수도 있다.
RAG의 활용 가치
- 외부 정보를 담은 벡터 DB를 활용하여 생성된 텍스트를 개선하는 기술로, 벡터 DB와 프롬프트 엔지니어링이 적용된다.
- GPU나 방대한 데이터 없이도 맞춤형 언어 모델을 개발하고 활용할 수 있다.
결론
- 검색과 생성 모델을 결합한 RAG는 다양한 분야에서 활용되며, 기존 접근법의 제약을 극복하고 다양한 사용 사례에서 응용될 수 있다.