articles channels tags spaces toolkit

Superb AI 기술 블로그May 8, 2024

생성형 AI를 똑똑하게 해주는 검색증강생성(RAG)란?

검색 증강 생성 (RAG, Retrieval Augmented Generation)이란?

생성형 AI인 LLM이 참조할 수 있는 별도 정보원을 제공하여 환각 현상을 방지하고 답변 품질을 개선하는 기법이다.
RAG를 적용하면 오픈 소스 LLM에 미세조정 없이도 성능 좋은 LLM의 보안과 성능을 개선할 수 있다.

벡터 DB와 프롬프트 엔지니어링

RAG에서는 벡터 DB에 사전에 제공할 문맥을 저장하고, 프롬프트 엔지니어링을 통해 LLM에 원하는 답변을 유도할 수 있다.
벡터 DB는 문서를 실수로 바꾸어주는 임베딩 과정을 거친다.

LLM과의 연동

RAG는 LLM과의 연동을 전제로 하며, GPT와 같은 성능 모델을 활용하거나 도메인에 특화된 LLM을 제작하여 연동할 수 있다.
다양한 아키텍처를 고려하여 sLLM을 추가적으로 연동할 수도 있다.

RAG의 활용 가치

외부 정보를 담은 벡터 DB를 활용하여 생성된 텍스트를 개선하는 기술로, 벡터 DB와 프롬프트 엔지니어링이 적용된다.
GPU나 방대한 데이터 없이도 맞춤형 언어 모델을 개발하고 활용할 수 있다.

결론

검색과 생성 모델을 결합한 RAG는 다양한 분야에서 활용되며, 기존 접근법의 제약을 극복하고 다양한 사용 사례에서 응용될 수 있다.