목차
- 매출과 비용을 한 줄에 놓고 비교해보면
- ‘AI는 절대 수익 못 낸다’는 통념의 함정
- 개발자가 매달 결제하는 단가를 인건비랑 비교하면
- 부숴먹어 본 곳에서 본 진짜 비용 구조
- 그래서 Daniela Amodei가 짚은 지점은
- IPO를 앞두고 풀어야 할 진짜 숙제
- 개발자 입장에서 봐야 할 시그널
- 그래서 어떻게 할 건가
매출과 비용을 한 줄에 놓고 비교해보면
보도 기준 추정치를 잠깐 펼쳐보자. 2025년 말 시점 OpenAI의 연환산 매출은 약 100억 달러대, Anthropic은 약 30억~40억 달러대라는 분석이 여러 매체에 등장했다 (출처: The Information, Reuters 등 2025년 12월~2026년 1월 보도, 정확한 수치는 분기마다 갱신된다). 같은 기간 두 회사의 운영·R&D 비용은 매출을 상회한다는 평가가 따라붙는다.
따라서, 수치만 보면 "이 회사 망하는 거 아니냐"는 반응이 자연스럽다. 백엔드 개발자 입장에서 Claude API를 매월 결제하는 사람이라면 더 그렇다. 한 달 청구서 끝자리 0이 늘어날 때마다 ‘이 돈이 어디로 가나’ 생각하게 된다.
다만 매출과 비용을 한 줄에 놓고 적자라고 결론 내리는 방식은 SaaS나 클라우드 회사 평가하던 습관에 가깝다. 모델 학습이라는 항목이 끼면 그림이 달라진다.
| 항목 | 일반 SaaS | 프론티어 AI 회사 |
|---|---|---|
| 매출원가 | 인프라·서버 | 추론(서빙) 인프라 |
| 핵심 R&D | 제품 개발 | 차세대 모델 학습 |
| R&D 회수 기간 | 분기~연 단위 | 모델 1세대당 18~24개월 |
| 적자 해석 | 성장 단계 비용 | 학습 투자 + 운영 비용 혼합 |
학습 비용을 매년 비용 처리하면 매년 손실이 나게 생겼다. 그런데 학습된 모델은 다음 1~2년 동안 매출을 만든다. 회계와 현금 흐름이 분리돼서 움직인다는 뜻이다.
‘AI는 절대 수익 못 낸다’는 통념의 함정
기술 커뮤니티에서 자주 보는 주장이 있다. "추론 비용이 너무 비싸서 토큰 단가가 떨어질수록 적자가 깊어진다." 직관적으로 맞는 말처럼 들린다.
그런데 토큰 단가가 떨어진 만큼 사용량이 폭증하는 측면을 빼면 절반짜리 분석이다. Claude API 가격은 첫 출시 이후 동일 모델 기준 점진적으로 내려왔지만, 같은 기간 호출량은 자릿수가 바뀌었다는 게 업계 보도의 일관된 흐름이다.
예를 들어, (여담이지만 이건 클라우드 초기와 비슷한 패턴으로 보인다.)
이처럼, 여기에 운영비와 학습비를 구분하는 게 중요하다. 단순화해서 보면 운영비는 추론 서빙에서 발생하고 매출 발생 시점에 같이 일어난다. 토큰 단가 안에 녹아 있는 비용이라는 뜻이다. 반면 학습비는 한 번에 큰 금액이 들어가고, 매출은 다음 모델이 출시되고 18~24개월 동안 나눠서 회수된다.
회의론이 자주 빠지는 함정은 두 비용을 한 항목으로 묶어보는 것이다. 운영 단위 마진을 따로 보면 적자가 아닌 경우가 있다는 분석이 The Information 등 일부 보도에 등장했다 (2026년 1분기 기준).
개발자가 매달 결제하는 단가를 인건비랑 비교하면
게다가, 여기서 잠깐 현장 얘기를 해보자. Claude Sonnet 시리즈를 백엔드 자동화에 쓰는 환경 기준이다. 코드 리뷰 자동화, 로그 분석, 문서 요약 같은 잡일을 맡긴다.
월 청구액은 팀 규모 작은 곳 기준 보통 수십만 원 단위에서 시작한다. 처음엔 비싸다고 느꼈다. 그런데 다음 두 개를 같이 놓고 보니 인상이 달라졌다.
| 항목 | 대략 수치 |
|---|---|
| 백엔드 개발자 1명 시급 (시장 평균) | 약 4만~6만 원/시간 |
| 자동화로 대체된 작업의 사람 환산 시간 | 약 40~60시간/월 |
| 실제 API 청구액 | 약 30만~80만 원/월 |
이 환산은 정확하지 않다. 사람이 하는 일과 모델이 하는 일이 1:1로 대응되지도 않는다. 다만 "현장 개발자 입장에서 비싸다고 느낀 청구액"이 사람 시급으로 환산하면 며칠 분이라는 점은 부정하기 어렵다.
그러나, 이 시점에서 "AI 회사가 절대 돈 못 번다"는 명제는 약간 의심스러워진다. 토큰 단가가 더 내려가면 안 쓰던 사람이 쓰기 시작한다. 쓰던 사람은 더 무거운 워크플로우를 맡긴다. 매출 자릿수가 한 번 더 올라간다.
수요 곡선이 가격 인하에 어떻게 반응하는지가 핵심 변수다. 이 곡선이 가파르면 수익성 시나리오는 빠르게 개선된다. 완만하면 시간이 더 걸린다.
부숴먹어 본 곳에서 본 진짜 비용 구조
또한, 3년차로 매주 뭔가를 부숴먹고 고친다. AI API도 예외가 아니다. 처음 RAG 파이프라인 구축할 때 토큰 카운트를 제대로 안 잡아서 한 달치 예산을 사흘 만에 다 쓴 적이 있다 (anthropic.RateLimitError: rate limit exceeded for tokens 메시지가 콘솔에 깔리던 순간을 잊지 못한다).
또한, 그때 깨달은 게 있다. AI 회사들이 모델 단가만 받고 끝나는 구조가 아니라는 거다. 캐싱 기능, 배치 API, 프롬프트 캐싱 같은 기능이 단가를 직접 깎아준다.
프롬프트 캐싱이 양쪽 모두에 이득인 이유
# 프롬프트 캐싱 사용 예 (Anthropic SDK)
response = client.messages.create(
model="claude-sonnet-4", # 모델 이름은 시점에 따라 다름
max_tokens=1024,
system=[
{
"type": "text",
"text": large_context, # 긴 시스템 프롬프트
"cache_control": {"type": "ephemeral"} # 캐시 적용
}
],
messages=[{"role": "user", "content": user_query}]
)
그 외에도, 이런 기능을 잘 쓰면 비용이 큰 폭으로 줄어든다는 게 공식 문서의 설명이다 (출처: Anthropic 공식 프롬프트 캐싱 문서, 2026년 6월 기준). 사용자 입장에서 단가가 떨어지지만, Anthropic 입장에서도 GPU 시간을 덜 쓰니까 운영비가 같이 떨어진다. 양쪽 모두 이득인 구조다.
(캐싱 적용 후 청구액이 체감 1/3로 줄어든 게 가장 인상적이었다.)
운영 단위 효율이 계속 좋아진다는 신호
따라서, 이 구조를 보면 "AI 추론이 본질적으로 적자 사업"이라는 단순화는 무리가 있어 보인다. 운영 단위 효율은 매 분기 개선되는 중이다. 모델 증류(distillation), 양자화, 추측 디코딩(speculative decoding) 같은 기법이 추론 비용을 계속 깎고 있다는 보도가 이어졌다.
회의론자의 가정 — 추론 비용이 고정 — 자체가 이미 흔들린다는 뜻이다.
그래서 Daniela Amodei가 짚은 지점은
Anthropic의 사장(President)인 Daniela Amodei가 IPO 시즌 즈음 수익성 회의론에 답한 발언이 여러 매체에 보도됐다 (정확한 인용은 원문 기사를 확인하라). 핵심은 두 가지로 요약되는 것 같다.
첫째, 모델 한 세대(generation)의 단위 경제학(unit economics)은 손익분기를 넘어선 상태라는 점이다. 현재 출시된 모델을 운영하는 데 들어가는 비용 대비 매출은 흑자라는 주장이다.
특히, 둘째, 회사 전체가 적자인 이유는 다음 세대 모델 학습에 매출을 다시 투자하기 때문이라는 설명이다. 이건 회사가 선택한 전략이지, 사업 모델이 본질적으로 적자라는 의미가 아니라는 논지다.
이 논리가 처음 듣는 얘기는 아니다. 클라우드 초기에 AWS도 비슷한 설명을 반복했다. 그때도 "절대 안 된다"는 회의론이 있었다. 결과는 알려진 대로다.
결국, 그렇다고 똑같이 흘러간다고 단정할 순 없다. AI 모델 학습은 분기 단위로 들어가는 자본 규모가 훨씬 크다. 자본 시장의 인내심이 어디까지 갈지가 변수로 남는다.
IPO를 앞두고 풀어야 할 진짜 숙제
따라서, 수익성 자체보다 더 까다로운 숙제가 있다고 본다. 백엔드 개발자 시각에서 보면 다음 세 가지가 핵심이다.
추론 비용 곡선의 안정성
모델 한 세대가 시장에 풀린 뒤 가격이 어디까지 내려갈지는 경쟁 환경에 달려있다. 단가가 너무 빨리 떨어지면 매출 자릿수 증가가 따라잡지 못할 가능성이 있다. 반대로 단가 하락이 느리면 사용자 이탈 위험이 커진다. 균형점을 찾는 게 사업의 핵심 능력이다.
학습 자본의 회수 시점
그래서, 차세대 모델 학습에 들어가는 GPU 클러스터 비용은 공개된 보도 기준 한 번에 수십억 달러 단위로 추정된다. 이 금액이 다음 세대에서 회수되려면 시장 점유율이 일정 수준 유지돼야 한다. 다른 회사가 비슷한 성능 모델을 절반 가격에 풀면 회수 곡선이 무너진다.
전환 비용을 만들어내는 락인
API 사용자 입장에서 솔직히 말하면, Claude에서 GPT로 갈아타는 비용이 그렇게 크지 않다. 프롬프트 일부 조정과 응답 파싱 코드 약간이면 된다. AI 회사들이 단가 외에 가져갈 락인 요소를 만드는 게 IPO 이후 장기 과제로 보인다.
거기에, MCP(Model Context Protocol), Claude Agent SDK, Computer Use 같은 기능이 그 락인 후보로 보인다 (출처: Anthropic 공식 문서, 2026년 상반기 기준). 도구 생태계가 두꺼워질수록 전환 비용이 올라간다.
개발자 입장에서 봐야 할 시그널
투자 관점에서 글을 쓰는 건 아니다. 매일 API를 호출하면서 봐야 할 사업 신호 몇 개를 짚어보자.
첫째, 단가 변동 폭이다. 분기마다 같은 모델 단가가 계속 떨어진다면 운영 단위 마진이 확보됐다는 뜻이다. 반대로 단가가 정체하면 인프라 비용 압박이 있다는 시그널로 보인다.
게다가, 둘째, 모델 출시 간격이다. 차세대 모델 출시 주기가 18~24개월보다 짧아지면 R&D 투자 회수 사이클이 짧아지고 있다는 뜻이다. 반대로 주기가 늘어나면 학습 비용 회수에 시간이 걸린다는 신호다.
셋째, API 외 매출원이 늘어나는지다. Claude Code, MCP 생태계, 엔터프라이즈 계약 같은 비-API 매출이 얼마나 차지하는지가 장기 안정성과 직결된다. 단일 채널 매출은 가격 압박에 약하다.
그러나, 이 세 가지를 분기별로 체크하면 회의론이 맞는지 아닌지 판단하는 데 도움이 된다.
특히, (여담이지만 이건 클라우드 초기 AWS 분석할 때 쓰던 프레임이랑 거의 같다. 다른 점은 모델이라는 비용 항목 하나뿐이다.)
그래서 어떻게 할 건가
당장 IPO 청약을 한다거나 그런 얘기를 하려는 건 아니다. 개발자로서 할 수 있는 구체적인 액션은 세 가지다.
- 프롬프트 캐싱과 배치 API를 실제로 적용해서 비용 곡선을 직접 측정해보기. 이게 잘 작동하면 회사의 운영 마진 가설이 맞다는 간접 증거가 된다.
- 분기마다 같은 모델의 토큰 단가 변화를 기록해두기. 6개월치 데이터가 쌓이면 패턴이 보인다.
- Claude 외 한두 개 모델을 같이 운영해서 락인 비용을 측정해두기. 갈아타기가 쉬운지 어려운지가 사업 분석에 직접 쓰인다.
수익성 회의론이 맞는지 틀린지는 결국 데이터로 확인할 일이다. 매달 청구서가 답을 준다.
반면, 다음엔 프롬프트 캐싱 적용 전후 6개월치 청구 데이터를 정리해서 비용 곡선을 직접 그려볼 생각이다.
관련 글
- MS-DOS 소스 공개 — Microsoft가 GitHub에 올린 진짜 이유와 Claude로 읽는 법 – Microsoft가 MS-DOS 1.25, 2.0, 4.0 소스를 GitHub에 푼 흐름을 짚는다. 직접 받아서 Claude로 어셈블리를 …
- xAI 연 7조 태우는데 Anthropic은 월 1조 내며 쓰는 이유 – 프론트엔드 할 땐 ‘API가 좀 느리네’ 정도로 끝났던 게, 백엔드 와서는 회사가 컴퓨트에 얼마를 태우는지까지 알아야 했다. xAI 6.4…
- Nvidia not-acqui-hire 전략, 200억 달러에 칩 스타트업 인재만 사간 배경 – Nvidia의 200억 달러 not-acqui-hire 거래를 3개월간 추적해 분석한다. 인수가 아닌 라이선스+인재 영입 구조가 왜 빅테크…