Shamir Secret Sharing으로 AWS 루트 키 5명 분산 3명 복원하기
AWS 루트 키를 한 사람에게 맡기지 않고 5명에게 쪼개 나눠준 뒤 3명이 모이면 복원하는 구조다. ssss CLI 실패담부터 SLIP-39로 갈아탄 경로까지 풀어본다.
AWS 루트 키를 한 사람에게 맡기지 않고 5명에게 쪼개 나눠준 뒤 3명이 모이면 복원하는 구조다. ssss CLI 실패담부터 SLIP-39로 갈아탄 경로까지 풀어본다.
CloudFront 캐시 TTL 설정은 콘솔의 숫자 세 개가 아니라 오리진 헤더와의 협상으로 결정된다. 적중률이 60%대에서 멈춘 이유와 89%까지 끌어올린 정책 조합을 정리한다.
Lambda에서 S3 SlowDown을 만나고 알게 된 AWS SDK 재시도 전략과 Jitter. boto3 standard·adaptive 모드와 Java SDK v2 설정을 코드로 정리한다.
정부 보안 기관도 GitHub에 클라우드 키를 올렸다. 5명 팀이 3개월간 secrets 관리 체계를 만들면서 마주친 시행착오와 우회 사건, 6개월 운영 결과를 시간순으로 정리한다.
Lambda 동시 실행 1000개와 PostgreSQL max_connections 87이 만나는 지점에서 'too many connections' 에러가 시작된다. RDS Proxy의 설정 방법, 연결 핀닝이라는 의외의 함정, 그리고 vCPU 시간당 과금의 실체를 본다.
2년 만에 다시 만진 AWS의 3개월 기록이다. RDS Performance Insights는 빛났고 NAT Gateway 청구서는 폭탄이었다. 떠난 이유가 왜 더 명확해졌는지 정리해본다.
Fargate는 비싸다는 말이 정설처럼 돈다. ephemeral runner 구조에서는 그 통념이 깨지는 지점이 있다. ECS Fargate 기반 self-hosted runner 설정과 실제 비용을 본다.
GCP에서 AWS로 옮긴 뒤 3개월 만에 짐을 다시 쌌다. 청구서가 두 배 넘게 찍히기까지의 시간순 기록과, 떠나기 전에 했어야 할 것들을 적어둔다.
FastAPI 워커에서 주간 47건씩 발생하던 OOMKilled를 Kubernetes VPA 설정으로 3건까지 줄였다. HPA·수동 튜닝과 비교한 기준과 EKS 환경에서의 helm 설치, Recommender 모드 활용까지 다룬다.
Intel 복귀가 AI 워크로드에서 실제로 의미 있는지 코드로 확인한 기록. Gaudi 3, llama.cpp SYCL, 18A 노드를 2026년 5월 시점에서 본다.
reCAPTCHA 다음 세대로 묶인 Google Cloud Fraud Defense는 단순 캡차가 아니라 계정 보호와 부정 결제 차단까지 포함한 묶음이다. Cloudflare, AWS와 어떻게 다른지 항목별로 본다.
단일 노드 ElastiCache로 버티다 메모리 한계를 만났다. 클러스터 모드 ON으로 전환하면서 샤드 슬롯, 키 해시태그, Failover 검증까지 거쳐온 3개월을 시간순으로 풀어본다. 처음부터 클러스터 모드로 갔어야 했다는 결론이다.