RAG(Retrieval-Augmented Generation)는 LLM(대형 언어 모델)이 외부 문서를 검색해서 답변에 활용하는 기술입니다. 사내 매뉴얼, 규정집, 기술 문서 등을 학습시키지 않고도 AI가 참조하여 정확한 답변을 생성할 수 있습니다.
PDF, Word, 사내 위키 등 다양한 형태의 문서를 텍스트로 변환합니다. 이 과정에서 표, 이미지 속 텍스트(OCR) 처리가 필요할 수 있습니다.
전처리된 텍스트를 청크(chunk) 단위로 분할하고, 임베딩 모델로 벡터화하여 벡터 데이터베이스에 저장합니다. 청크 크기와 오버랩 설정이 검색 품질에 큰 영향을 미칩니다.
사용자 질문이 들어오면 벡터 유사도 검색으로 관련 문서를 찾고, 이를 LLM의 프롬프트에 포함시켜 답변을 생성합니다.
답변의 정확도를 측정하고, 검색 품질을 지속적으로 개선합니다. 환각(hallucination) 방지를 위한 출처 표시도 필수입니다.
RAG 시스템은 PoC(개념 증명)까지는 2~3주면 가능하지만, 프로덕션 수준의 정확도를 달성하려면 3~6개월의 튜닝이 필요합니다.
사내 문서 AI 검색 시스템은 업무 효율을 획기적으로 높일 수 있지만, 명확한 목표 설정과 단계적 접근이 성공의 열쇠입니다.