Gemini API 시작하기 — Python으로 멀티모달 AI 앱 만들기
OpenAI Vision API에서 이미지 1장에 765토큰이 소모되던 프로젝트를 Gemini API로 전환한 과정을 기록했다. 신구 SDK 혼란부터 멀티모달 입력, 구조화된 출력, 비용 구조까지 실전에서 부딪힌 내용을 정리한다.
OpenAI Vision API에서 이미지 1장에 765토큰이 소모되던 프로젝트를 Gemini API로 전환한 과정을 기록했다. 신구 SDK 혼란부터 멀티모달 입력, 구조화된 출력, 비용 구조까지 실전에서 부딪힌 내용을 정리한다.
사내 외부 LLM API가 차단된 뒤 Ollama로 로컬 LLM 보안 운영 환경을 구축했다. 기본 설정의 보안 구멍부터 네트워크 격리, 접근 제어, 보안팀 승인까지 4일간의 구축 기록과 3개월 운영 경험을 정리했다.
주간 리포트를 자동화하려고 Python으로 AI 에이전트 파이프라인을 처음 만들었다. 한 덩어리 스크립트에서 시작해 작업 분해 → 툴 연동 → 오류 복구 순서로 다시 설계한 과정을 기록한다.
사내 위키 800페이지를 검색하는 RAG 챗봇을 LangChain으로 구축했다. 벡터DB 선택에 2주를 쓴 뒤에야 청킹 전략이 답변 품질의 80%를 좌우한다는 걸 깨달았다. Chroma, Qdrant, Pinecone 비교와 리트리버 튜닝까지 기록한다.
Claude MCP 서버를 직접 만들면서 겪은 삽질을 TIL로 정리했다. stdio transport에서 막힌 이유, Python SDK 설정, SSE 배포까지 AI 에이전트 MCP 연동 실무에서 실제로 부딪히는 문제들을 다룬다.
같은 프롬프트를 Claude와 GPT-4에 넣으면 정확도가 20%p 이상 차이 난다. 각 모델이 잘 반응하는 프롬프트 구조가 다르기 때문이다. 실무 테스트 결과와 모델별 최적화 경험을 정리했다.
다들 AI 코딩 하면 GUI IDE를 떠올린다. Claude Code는 터미널에서 돌아가는데, 이게 오히려 백엔드 작업에선 빠르다. 3주간 실무에서 써보며 깨달은 통념과 현실의 차이를, CLAUDE.md 설정부터 Cursor 비교까지 정리했다.
Claude API를 Python에서 처음 연동하면서 겪은 시행착오를 기록했다. .env 파일의 따옴표 하나로 45분을 소모한 인증 에러, 스트리밍 응답에서 만난 AttributeError, 대화 맥락을 유지하는 챗봇 구현까지 실제 코드와 함께 정리했다.