PostgreSQL pgvector 벡터 검색 — 임베딩 저장부터 유사도 쿼리 최적화까지
프론트엔드에서 백엔드로 전환한 지 2년. 벡터 검색이 필요해졌을 때 별도 벡터 DB를 붙일지 PostgreSQL pgvector로 해결할지 고민했고, pgvector를 선택한 뒤 겪은 설정·인덱싱·쿼리 최적화 과정을 기록한다.
프론트엔드에서 백엔드로 전환한 지 2년. 벡터 검색이 필요해졌을 때 별도 벡터 DB를 붙일지 PostgreSQL pgvector로 해결할지 고민했고, pgvector를 선택한 뒤 겪은 설정·인덱싱·쿼리 최적화 과정을 기록한다.
RAG 파이프라인에 벡터DB를 붙여야 하는데 선택지가 너무 많다. Pinecone, Weaviate, pgvector 세 가지를 실제로 써보고 규모별로 어떤 게 맞는지 정리했다. 비용 계산까지 포함.
PostgreSQL과 MySQL 중 뭘 골라야 하는지, JSON 쿼리 성능·확장성·AI 인프라 연동까지 직접 써보고 비교한 기록이다. 통념과 다른 부분이 꽤 있었다.