Python LangChain RAG 구축 — 청킹 전략과 벡터DB 선택이 답변 품질을 갈랐다
사내 위키 800페이지를 검색하는 RAG 챗봇을 LangChain으로 구축했다. 벡터DB 선택에 2주를 쓴 뒤에야 청킹 전략이 답변 품질의 80%를 좌우한다는 걸 깨달았다. Chroma, Qdrant, Pinecone 비교와 리트리버 튜닝까지 기록한다.
사내 위키 800페이지를 검색하는 RAG 챗봇을 LangChain으로 구축했다. 벡터DB 선택에 2주를 쓴 뒤에야 청킹 전략이 답변 품질의 80%를 좌우한다는 걸 깨달았다. Chroma, Qdrant, Pinecone 비교와 리트리버 튜닝까지 기록한다.
Claude MCP 서버를 직접 만들면서 겪은 삽질을 TIL로 정리했다. stdio transport에서 막힌 이유, Python SDK 설정, SSE 배포까지 AI 에이전트 MCP 연동 실무에서 실제로 부딪히는 문제들을 다룬다.
프로덕션에서 LLM API 비용이 매달 불어나는 건 흔한 일이다. 시맨틱 캐싱, 모델 라우팅, Batch API 세 가지 전략으로 월 480만원을 95만원까지 줄인 3개월간의 과정을 시간순으로 풀었다.
같은 프롬프트를 Claude와 GPT-4에 넣으면 정확도가 20%p 이상 차이 난다. 각 모델이 잘 반응하는 프롬프트 구조가 다르기 때문이다. 실무 테스트 결과와 모델별 최적화 경험을 정리했다.
다들 AI 코딩 하면 GUI IDE를 떠올린다. Claude Code는 터미널에서 돌아가는데, 이게 오히려 백엔드 작업에선 빠르다. 3주간 실무에서 써보며 깨달은 통념과 현실의 차이를, CLAUDE.md 설정부터 Cursor 비교까지 정리했다.
Claude API를 Python에서 처음 연동하면서 겪은 시행착오를 기록했다. .env 파일의 따옴표 하나로 45분을 소모한 인증 에러, 스트리밍 응답에서 만난 AttributeError, 대화 맥락을 유지하는 챗봇 구현까지 실제 코드와 함께 정리했다.