RAG는 왜 기대보다 자주 실망스러울까
RAG는 왜 검색을 붙였는데도 답이 흔들리는지 설명합니다. 검색 품질, chunking, retrieval mismatch, citation illusion, 평가 문제까지 운영 관점으로 정리합니다.
RAG는 왜 검색을 붙였는데도 답이 흔들리는지 설명합니다. 검색 품질, chunking, retrieval mismatch, citation illusion, 평가 문제까지 운영 관점으로 정리합니다.
RAG를 검색 기능에 LLM을 덧댄 정도로 보면 핵심을 놓치게 됩니다. 이 글은 원 논문 기준으로 RAG의 retrieval, 문맥 결합, generation 구조를 짧고 정확하게 정리하고, 왜 단순 검색과 다른지 설명합니다.
AI 에이전트 메모리를 context window, vector DB, tool state로 나눠 설명합니다. 무엇을 어디에 저장해야 하는지와 왜 memory가 시스템 문제인지 실무 흐름으로 정리했습니다.