Lovable의 Google Cloud 5배 약속, 스타트업 클라우드 다년 계약의 실체

목차

클라우드 커밋먼트 딜은 향후 N년간 일정 금액 이상을 클라우드에 쓰겠다고 약속하는 대가로 단가 할인이나 GPU 할당 우선권을 받는 계약 구조다. Lovable이 최근 Google Cloud와 사용량 5배 증가를 골자로 하는 다년 계약을 맺었다는 보도(2025년 보도 기준)가 이 구조의 전형이다.

그런데, 뉴스 자체는 "AI 스타트업이 클라우드에 크게 베팅했다" 정도로 소비되지만, 백엔드 비용 구조를 직접 만지는 입장에서 보면 이 뉴스의 진짜 의미는 다른 곳에 있다. 5배라는 숫자가 약속인지, 예측인지, 아니면 최소 commit인지에 따라 회사가 짊어진 리스크의 성격이 완전히 달라진다.

클라우드 커밋먼트 딜이 정확히 뭔지부터 짚자

예를 들어, 대표적인 구조는 세 가지다. AWS의 Enterprise Discount Program(EDP), GCP의 Committed Use Discount(CUD) 위에 얹는 협상 계약, Azure의 Enterprise Agreement(EA). 이름은 다르지만 본질은 같다. "향후 N년간 최소 X달러어치 쓸 테니 Y% 깎아달라"가 기본 골격이다.

그런데, 여기서 자주 오해되는 게 약속한 사용량의 성격이다. "쓸 것 같으면 그 단가가 적용된다"가 아니라, 약속한 금액은 쓰든 안 쓰든 청구된다. GCP CUD의 경우 1년 또는 3년 단위로 vCPU·메모리·GPU 단위의 commit을 잡고, 미달분은 그대로 정산된다(출처: Google Cloud 공식 문서, Committed Use Discounts 페이지, 2026년 4월 확인).

Lovable의 5배라는 숫자도 같은 맥락에서 봐야 한다. 사용량이 자연 증가해서 5배가 된 게 아니라, 5배만큼의 commit을 사전에 묶었을 가능성이 더 크다. 자연 성장은 뉴스가 안 된다. commit을 묶은 시점이 뉴스가 된다.

사용량 5배가 약속이라는 게 무슨 뜻인가

그래서, 연 환산 클라우드 비용이 100만 달러였던 회사가 5배 commit을 묶으면, 다년간 매년 500만 달러를 쓰겠다고 사인한 셈이다. 그 금액에 도달하지 못해도 청구는 그대로 간다. 단가 할인율이 30%라고 가정하면, 약속한 사용량을 100% 채울 때 실효 비용은 350만 달러. 70%만 쓰면 500만 달러를 그대로 내면서 실제로 받은 가치는 350만 달러어치인 셈이다.

이 산수가 의외로 영업 자료에는 잘 안 나온다. 비교표에는 "30% 할인"만 큼지막하게 적혀 있다.

"AI 스타트업이면 다년 계약은 무조건 유리하다"는 통념

요즘 AI 스타트업 커뮤니티에서 자주 들리는 말이 있다. "어차피 사용량은 폭증할 거니까 미리 다년 계약 묶어서 단가 깎는 게 무조건 이득이다." Andreessen Horowitz가 2025년 초에 발표한 AI 인프라 비용 시리즈(The Cost of AI Compute)에서도 비슷한 톤의 권유가 나왔다.

특히, 기술적으로는 맞는 말이긴 하다. GPU 인스턴스 단가 차이는 무시 못한다. H100 기준으로 on-demand와 1년 commit, 3년 commit 간 단가 격차는 30~60% 수준이라고 알려져 있다(2026년 기준, 클라우드별·리전별로 편차 큼).

문제는 이 단가 계산이 "예측한 사용량이 맞을 때"만 성립한다는 점이다. 스타트업, 특히 AI 제품은 사용량 예측이 6개월 단위로도 100% 어긋난다. 내가 본 케이스 중 가장 인상적이었던 건, 시리즈 A 마치고 2년 commit으로 한 달 8만 달러씩 GCP를 약속한 팀이 6개월 뒤 PMF 피벗 들어가면서 실제 사용량이 1만 달러대로 떨어진 경우였다. 차액은 그대로 청구됐다.

단가 할인의 함정

게다가, 다년 계약 단가는 매력적이지만, 그 단가에 도달하려면 약속한 사용량을 다 써야 한다. 3년 30% 할인을 받았는데 사용량이 절반밖에 안 되면, 실효 단가는 오히려 on-demand보다 비싸진다. 절반만 쓰는데 100% 청구되니까 단위 비용이 2배로 뛰는 것과 같다.

게다가, 이 단순 산수가 자주 무시된다. 영업이 강조하는 건 "할인율 30%"고, 자료에 적힌 단가 비교만 보면 commit이 무조건 이득처럼 보인다. 락인은 단가만의 문제가 아니라 사용량 리스크의 문제다. 사용량이 흔들리는 단계에서 commit은 burn rate를 락인하는 거나 마찬가지다.

통념이 위험한 진짜 이유

결국, "AI 스타트업이면 무조건 commit"이라는 통념이 위험한 건, 회사 단계에 상관없이 한 줄로 권유된다는 점이다. 시드 단계의 월 5천 달러 쓰는 회사와 시리즈 C의 월 50만 달러 쓰는 회사는 다른 자산을 가지고 협상에 들어간다. 같은 구조의 계약이라도 의미가 완전히 다르다.

특히 시드~시리즈 A 단계에서 다년 commit을 받는 건, "유리한 단가"보다 "burn rate 가시성 확보"라는 이름으로 포장되는 경우가 많은데, 둘 다 실체와는 거리가 있다. 사용량이 예측대로 안 가면 가시성은 의미가 없다.

Lovable 케이스를 뜯어보면 보이는 것

Lovable이 Google Cloud 사용량을 5배로 늘리겠다고 약속한 것에는 두 가지 해석이 가능하다.

한편, 첫 번째는 단순 의역. "어차피 트래픽이 그만큼 늘 거라 자연스럽게 5배가 된다"는 시나리오. 이 경우 회사는 단가 할인을 받으면서 큰 리스크 없이 가는 셈이다. AI 코딩 도구의 사용량 곡선은 2024~2025년 가파르게 올랐기 때문에 이 시나리오가 비현실적이지는 않다.

한편, 두 번째는 commit 자체가 5배라는 해석. 이쪽이 훨씬 흥미롭다. 회사는 다년간 그 금액을 쓰겠다고 묶었고, 그 대신 GPU 할당 우선권, 단가 할인, GCP 측 마케팅 협력을 받는다. 클라우드 입장에서는 AI 워크로드의 안정적 수요를, 스타트업 입장에서는 GPU 공급 안정성을 확보하는 거래다.

즉, 개인적으로 두 번째에 가깝다고 본다. 보도가 "다년 계약"을 헤드라인에 올린 시점에 그렇게 잡히는 건 commit 구조 때문이지, 자연 성장 예측 때문은 아니다.

GPU 우선권이 진짜 자산이다

요즘 AI 스타트업이 클라우드 다년 계약을 맺는 진짜 이유는 단가가 아니라 GPU 할당량 보장일 가능성이 높다. H100, B200 같은 최신 GPU는 on-demand로 잡으려면 리전마다 며칠씩 기다려야 한다. 다년 commit이 있으면 "당신 quota는 따로 빼둔다"는 약속이 따라온다.

이건 비교표로 보여줄 수 있는 가치가 아니다. 다음 분기에 GPU 50대 더 필요해졌을 때 영업 담당자한테 바로 전화해서 다음날 받을 수 있느냐, 2주 기다려야 하느냐의 차이다. AI 제품을 운영해본 사람이라면 이 차이가 얼마나 크게 느껴지는지 안다. 출시 일정이 2주 밀리는 것과 안 밀리는 것의 차이는 단가 30%보다 훨씬 크다.

마케팅 협력이라는 보이지 않는 가치

게다가, 또 하나 자주 무시되는 게 클라우드 측 마케팅 협력이다. Google Cloud Next 같은 컨퍼런스 키노트에 소개되거나, "Built on Google Cloud" 케이스 스터디로 들어가면 그 자체로 다음 투자 라운드 톤이 달라진다. 시리즈 B 이상에서는 "어떤 하이퍼스케일러가 우리 편인가"가 실제 평가 항목이다.

반면, 이 가치를 수치로 환산하긴 어렵지만, 영업 파이프라인이 한 분기 이상 앞당겨질 수 있다. 다년 계약은 단순한 인프라 거래가 아니라 일종의 GTM 파트너십 계약에 가깝다. 5배라는 숫자에는 이 가치도 포함되어 있다고 보는 게 합리적이다.

5배라는 숫자의 또 다른 해석

기술적으로 보면 이런 가능성도 있다. 향후 N년간 합산 사용량이 현재 연 사용량의 5배라는 의미. 3년 계약이라면 연 평균 1.67배 정도의 사용량이 약속된 셈이다. 이쪽이라면 commit 부담은 훨씬 가볍다.

정확한 구조는 공개 안 됐기 때문에 추정에 머무를 수밖에 없다. 다만 어느 해석을 따르든 핵심은 같다. 약속 사용량과 실제 사용량의 갭이 회사의 진짜 리스크다.

프론트엔드에서 백엔드로 넘어와서야 보인 비용 곡선

프론트 작업할 때는 클라우드 비용이 그냥 "월말에 누가 청구서 보내는 것" 정도였다. Vercel 요금, S3 트래픽, CDN 비용 정도가 의식 범위였다. 백엔드로 넘어오면서 가장 충격적이었던 건 비용 곡선이 사용량과 선형이 아니라는 사실이었다.

특히 LLM API와 벡터DB를 같이 쓰는 구조에서는, 트래픽 1.5배가 되면 비용은 2.5배가 되는 식의 비대칭이 생긴다. 캐시 미스율, 컨텍스트 길이, 임베딩 재계산 빈도가 같이 움직이기 때문이다. 처음엔 이걸 몰라서 월 결산 때마다 예측이 빗나갔다.

이런 비대칭이 있는 워크로드에 다년 commit을 묶으면 어떻게 되겠나. 사용량 5배라고 가정해도 실제 비용은 7~8배까지 튀어오를 수 있다. 반대로 캐싱을 잘 도입해서 효율이 좋아지면 commit 대비 실사용이 70%로 떨어진다. 양쪽 다 commit 단가의 의미가 흐려진다.

백엔드 비용은 트래픽보다 아키텍처에 좌우된다

그래서, 전환 2년차쯤 되니까 명확해진 게 있다. 클라우드 비용은 사용자 수보다 아키텍처 결정에 훨씬 더 좌우된다. 같은 트래픽이라도 캐시 전략, 배치 처리, 리전 선택에 따라 비용이 3배 차이 난다.

프론트에서는 사용자 1명당 자원 비용이 거의 일정했다. 백엔드에선 같은 사용자 1명이 어떤 기능을 쓰는지에 따라 비용 단위가 100배 차이 난다. AI 기능이 들어가면 이 격차는 더 벌어진다.

그래서 다년 계약을 검토할 때 "현재 사용량 × 5"로 미래를 추정하는 건 거의 무의미하다. 그동안 아키텍처가 어떻게 진화할지가 더 큰 변수다. 이걸 6개월 앞도 예측 못하면서 3년 commit을 묶는 건 솔직히 도박에 가깝다.

캐싱 한 줄로 commit이 의미를 잃는다

반면, 실제 경험한 케이스 하나. LLM 요청에 프롬프트 캐싱을 도입했더니 한 달 만에 LLM 비용이 60% 줄었다. 트래픽은 그대로였다. 만약 그 직전에 3년 commit을 묶었다면 단가 할인을 받았어도 절대 금액은 commit 그대로 청구됐을 거다.

이런 종류의 효율 개선은 백엔드에서 계속 발생한다. 모델이 바뀌면, 캐시 전략이 바뀌면, 워크로드 스케줄링이 바뀌면, 비용은 단계적으로 떨어진다. commit은 이 효율 개선의 인센티브를 죽인다. "어차피 청구되는 금액이니까 효율 안 챙겨도 된다"는 사고가 팀에 스며들면 6개월 후엔 돌이키기 어렵다.

크레딧, 커밋먼트, EA는 완전히 다른 게임이다

이처럼, 스타트업 클라우드 혜택을 한 묶음으로 생각하는 사람이 많은데, 실은 성격이 완전히 다르다. 적어도 세 단계로 나누는 게 맞다.

구분 성격 리스크 주 대상 단계
스타트업 크레딧 무상 지급, 만료 있음 거의 없음 시드~프리A
Committed Use Discount 사용량 약속, 단가 할인 미달 시 차액 청구 시리즈 A 이후
Enterprise Agreement 다년 + 대규모 + 협상 패키지 페널티, 락인 시리즈 B+

크레딧은 받을 수 있으면 받는 게 맞다. AWS Activate, Google for Startups Cloud Program, Microsoft Founders Hub 모두 받아도 별 리스크가 없다. 만료되기 전에 다 쓰면 그만이고, 못 써도 손해는 없다. 다만 크레딧이 만료되는 시점에 워크로드를 다른 클라우드로 옮기는 게 현실적으로 가능한지는 미리 봐둬야 한다. 크레딧으로 시작했다가 만료 후 청구서 폭탄을 맞고 헤매는 케이스가 적지 않다.

물론, CUD부터는 다른 게임이다. 단가 할인을 받지만 약속한 사용량을 못 채우면 차액이 그대로 청구된다. GCP의 경우 1년 또는 3년 옵션이 있고, 3년 commit의 할인율이 가장 크지만 리스크도 그만큼 크다. 1년 commit으로 시작해서 사용량 안정화 후 3년으로 갈아타는 게 현실적인 경로다.

즉, EA 또는 그에 준하는 협상 계약은 보통 연 100만 달러 이상 쓰는 회사가 들어가는 영역이다. 이쪽은 단순 단가가 아니라 GPU 할당, 지원 SLA, 마케팅 협력까지 패키지로 협상한다. Lovable의 다년 계약은 이 영역에 가깝다고 봐야 한다.

단계별로 들어가는 순서

전환 시점 기준으로 정리하면 이렇다. 크레딧은 시드부터, CUD는 사용량이 6개월 이상 안정화되고 월 1~2만 달러 이상 쓸 때부터, EA는 월 10만 달러 이상 쓰면서 다년간 그 수준이 유지될 거라는 확신이 있을 때부터.

이 순서를 건너뛰는 게 가장 흔한 실수다. 시리즈 A 직후 영업을 만나서 바로 3년 EA로 가는 케이스를 몇 번 봤는데, 결과가 좋았던 적이 거의 없다. 사용량 예측이 빗나가면 다음 라운드 burn rate에 직접 영향을 준다.

특히 한국 스타트업 중에는 "글로벌 영업 미팅" 자체가 처음이라 협상 자리에서 단가 표만 보고 사인하는 경우가 보인다. 들어가기 전에 회사가 가진 협상 카드(매출 성장률, 다른 클라우드 옵션, 미디어 노출 가능성)를 정리해두지 않으면 일방적으로 끌려간다.

그래서 언제 다년 계약이 맞고 언제 안 맞는지

그래서, 판단 기준은 단가 할인율이 아니라 사용량 예측 가능성과 GPU 의존도다.

실제로, 다년 계약이 맞는 상황:

  • 사용량이 12개월 이상 일관되게 증가했고, 다음 12개월 예측이 ±20% 안에 들어온다는 확신이 있을 때
  • GPU 같은 공급 제약 자원에 의존하는 워크로드일 때 (할당 보장 가치가 단가 할인보다 크다)
  • 클라우드 마케팅 협력이 시리즈 B+ 라운드에 실제 영향을 줄 수 있는 단계일 때
  • 아키텍처가 안정화되어 캐싱·배치 최적화 여지가 크게 남지 않은 시점

그러나, 다년 계약을 받지 말아야 하는 상황:

  • 사용량 곡선이 6개월 단위로 50% 이상 흔들리는 시점
  • PMF 검증이 끝나지 않은 단계 (피벗 가능성이 있다면 commit은 burn rate에 부담)
  • 캐시·배치·리전 최적화로 비용을 30% 이상 줄일 여지가 있는 상태
  • 다른 클라우드로 옮길 가능성이 0이 아닌 상황 (멀티 클라우드 전략을 검토 중이라면 commit은 락인이다)

이 기준에서 보면 Lovable이 다년 계약을 한 건 합리적인 타이밍에 가깝다. 사용량 곡선이 명확하고, GPU 공급 제약이 크고, 마케팅 협력의 가치가 큰 단계다. 5배라는 숫자가 진짜 약속이든 자연 성장 예측이든, 회사 단계가 그 베팅을 감당할 위치에 있다.

반대로 시리즈 A 직후, 월 사용량이 2만 달러 정도이고 PMF가 흔들리는 팀이 같은 구조를 따라 하면 위험하다. 같은 다년 계약이라도 회사 단계가 다르면 의미가 완전히 다르다. "Lovable이 했다더라"가 우리 회사 협상의 근거가 될 수는 없다.

당장 실행할 수 있는 액션 세 가지다.

  1. 현재 클라우드 비용 곡선을 월 단위로 12개월치 그려보고 사용량 분산을 계산한다. 표준편차를 평균으로 나눈 값(변동계수)이 0.3 이상이면 다년 commit은 보류하는 게 맞다.
  2. 무상 크레딧 프로그램은 받을 수 있는 만큼 받아두되, 만료 시점 6개월 전에 마이그레이션 비용을 한 번 계산해본다. 락인은 commit에만 있는 게 아니다.
  3. CUD나 EA 협상 제안이 들어오면, 영업이 제시하는 "할인율"이 아니라 "약속 사용량을 70%만 채울 때의 실효 단가"를 직접 계산해본다. 이 숫자가 on-demand보다 비싸면 그 계약은 들어가지 않는 게 맞다.

관련 글