검색 증강 생성RAG (Retrieval-Augmented Generation)
한마디로
외부 문서를 검색해 그 내용을 근거로 답변을 생성하는 방식이에요. 환각을 줄이고 최신·사내 정보를 답에 반영할 수 있어요
RAG는 'AI에게 커닝 페이퍼를 쥐여주는' 방식이에요. 질문이 오면 ①관련 문서를 먼저 검색해서 ②그 내용을 모델에게 함께 주고 ③그걸 근거로 답하게 해요.
왜 필요하냐면, LLM은 학습 시점 이후의 최신 정보나 우리 회사 내부 데이터를 몰라요. RAG로 신뢰할 수 있는 문서를 붙여주면 ①환각이 줄고 ②최신·사내 정보를 반영하며 ③출처를 댈 수 있어요.
마케팅에선 '우리 제품 매뉴얼·정책 기반 고객 응대 챗봇'을 만들 때 핵심이에요. 모델을 새로 학습(파인튜닝)하지 않고도 우리 지식을 반영할 수 있거든요.
헷갈리는 용어 구분
관련 용어
- 임베딩텍스트를 의미를 담은 숫자 벡터로 변환한 것이에요. 의미가 비슷한 글은 벡터도 가까워서, 유사도 계산의 기반이 돼요
- 벡터 데이터베이스임베딩 벡터를 저장하고 빠르게 검색하는 DB예요. Pinecone, Supabase pgvector 등이 있고, RAG의 검색 엔진 역할을 해요
- 그라운딩(근거 연결)모델 답변을 신뢰 가능한 외부 근거에 묶는 거예요. '근거 없이 지어내기'를 막아 환각을 줄이는 핵심 장치예요
- 환각(할루시네이션)모델이 그럴듯하지만 틀린 정보를 사실처럼 생성하는 현상이에요. 생성형 AI의 구조적 한계라 사실 확인이 꼭 필요해요