OpenAI Assistants API로 RAG 구축하기 — 파일 검색부터 함수 호출까지
LangChain + ChromaDB 조합의 RAG 파이프라인을 OpenAI Assistants API로 교체한 경험이다. 벡터스토어 자동 관리, 파일 검색, 함수 호출까지 실제 코드와 함께 비교한다.
LangChain + ChromaDB 조합의 RAG 파이프라인을 OpenAI Assistants API로 교체한 경험이다. 벡터스토어 자동 관리, 파일 검색, 함수 호출까지 실제 코드와 함께 비교한다.
ChatGPT GPTs를 처음 만들 때 가장 많이 막히는 부분이 Actions 설정이다. OpenAPI 스키마 에러부터 CORS 문제까지, 직접 겪은 시행착오와 해결 과정을 코드와 함께 풀어냈다.
GPT-4o와 gpt-4o-mini의 토큰당 단가 차이는 16배다. 이 차이를 활용한 모델 라우팅, 프롬프트 압축, 시멘틱 캐싱 세 가지 전략으로 ChatGPT API 비용을 72% 절감한 과정을 코드와 함께 정리했다.
월 $180이던 LLM API 비용을 $72까지 줄인 Python LLM API 비용 최적화 실전기. 시멘틱 캐싱, OpenAI Batch API, 프롬프트 압축 세 가지를 조합해서 적용한 과정과 주의할 점을 다룬다.