ArgoCD로 Kubernetes GitOps 배포 자동화 — Helm 연동부터 롤백까지 실전 구성
kubectl apply 스크립트를 ArgoCD GitOps로 전환하면서 겪은 일들을 정리했다. Helm Chart 연동, 자동 동기화 설정, 롤백 전략까지 Kubernetes 배포 자동화의 실전 구성 기록이다.
kubectl apply 스크립트를 ArgoCD GitOps로 전환하면서 겪은 일들을 정리했다. Helm Chart 연동, 자동 동기화 설정, 롤백 전략까지 Kubernetes 배포 자동화의 실전 구성 기록이다.
프론트엔드에서 백엔드로 넘어오고 나서 처음 맡은 컨테이너 보안 스캔 자동화. Trivy를 GitHub Actions에 붙이면서 겪은 시행착오와 최종 설정을 시간순으로 풀어본다.
Prometheus alerting rules 작성부터 Alertmanager Slack 웹훅 연동, group_wait·repeat_interval 튜닝, 라벨 기반 온콜 라우팅까지. 설정 파일 전문과 실제 에러 메시지 기반 트러블슈팅을 포함한다.
수동 배포 3개월 차에 터진 사고를 계기로 GitHub Actions CI/CD를 구축한 과정이다. YAML 문법 에러, 시크릿 설정 실수, Docker 빌드 캐시까지 실전에서 부딪힌 문제와 해결법을 기록했다.
GitHub Actions 무료 러너가 느려서 EC2에 자체 호스팅 러너를 구축했다. 월 $380이던 비용이 $95까지 내려간 과정과, 그 사이에 겪은 offline 장애, 디스크 풀, idle 과금 문제를 다룬다.
EKS 클러스터 월 비용이 $4,200을 찍었다. Spot 인스턴스를 성급하게 적용했다가 40분 장애를 겪고, Karpenter와 HPA를 단계적으로 조합해 최종 33% 절감까지 도달한 3주간의 과정을 기록했다.
팀에서 동시에 terraform apply를 실행해 상태 파일이 꼬인 경험에서 출발한 글이다. S3 백엔드 + DynamoDB 락 설정, 네이티브 S3 락, force-unlock 복구, CI/CD 예방 구조까지 Terraform 상태 파일 충돌 해결에 필요한 내용을 정리했다.