Google $40B Anthropic 투자, 결국 클라우드 종속 비용이다
Google의 $40B Anthropic 투자 보도가 나왔다. 현금이 아니라 컴퓨트 크레딧이 함께 묶이는 구조라, Vertex AI Claude를 운영하는 팀 입장에서 락인 비용이 단순 SDK 교체보다 훨씬 무겁다.
Google의 $40B Anthropic 투자 보도가 나왔다. 현금이 아니라 컴퓨트 크레딧이 함께 묶이는 구조라, Vertex AI Claude를 운영하는 팀 입장에서 락인 비용이 단순 SDK 교체보다 훨씬 무겁다.
HPA만으로 버티던 EKS 워커 클러스터에 KEDA를 도입한 3개월의 기록이다. SQS와 Kafka Lag 기반으로 스케일링을 다시 설계했더니 노드 평균 사용량이 30% 줄었다. 그 사이 IRSA 연결과 폴링 주기 때문에 헤맨 시간도 적지 않았다.
EKS 월 청구서가 세 배 가까이 뛴 뒤 Karpenter 전환, Spot 혼합, 리소스 요청 튜닝을 3단계로 적용해 약 40% 줄인 기록이다. Cluster Autoscaler와 Karpenter, EKS Auto Mode를 항목별로 비교한 기준도 담았다.
Blackmagic이 DaVinci Resolve에 Photo 페이지를 추가했다. 영상 색보정 강자가 Adobe Lightroom 영역까지 먹을 수 있는지, 항목별로 비교해봤다.
Next.js 배포 플랫폼이던 Vercel이 AI 에이전트 중심으로 수익 모델을 재편하고 IPO를 준비 중이다. v0 구독, AI SDK 생태계, 토큰 기반 과금까지 — 호스팅 회사가 어떻게 AI 기업이 됐는지 전환자 시점에서 분석한다.
GPT-4o와 gpt-4o-mini의 토큰당 단가 차이는 16배다. 이 차이를 활용한 모델 라우팅, 프롬프트 압축, 시멘틱 캐싱 세 가지 전략으로 ChatGPT API 비용을 72% 절감한 과정을 코드와 함께 정리했다.
월 $180이던 LLM API 비용을 $72까지 줄인 Python LLM API 비용 최적화 실전기. 시멘틱 캐싱, OpenAI Batch API, 프롬프트 압축 세 가지를 조합해서 적용한 과정과 주의할 점을 다룬다.