The Brief
심층분석

AI 비용 전가의 시대, Tokenpocalypse와 구독료 전쟁이 동시에 오는 이유

AI 서비스의 수익화 압박이 만든 가격 인상과 가격 인하의 양극화, 그리고 실무 비용 관리 전략

한마디로

GitHub Copilot의 토큰 기반 과금 전환, Google Gemini의 구독료 인하, Anthropic의 1조 달러 IPO 추진이 같은 시기에 터졌어요. 겉보기엔 따로 노는 뉴스처럼 보이지만, 실은 'AI 생태계가 투자금 소진 단계를 지나 진짜 돈을 벌어야 하는 국면'으로 진입했다는 하나의 신호예요. 이 흐름이 실무 비용과 도입 전략에 어떤 영향을 주는지 풀어볼게요.

무슨 일이 일어나고 있나

최근 며칠 사이 AI 시장에서 방향이 정반대처럼 보이는 사건들이 동시에 터졌어요. 한쪽에서는 가격을 올리고, 다른 한쪽에서는 가격을 내립니다.

먼저 비용 인상 쪽이에요. Microsoft가 GitHub Copilot을 토큰 사용량 기반 과금으로 바꾸면서 AI 서비스 비용이 급증했어요. TechCrunch는 이 현상을 'Tokenpocalypse'라고 부르는데요, Uber 같은 대형 기업조차 AI 예산을 빠르게 소진해 사용량 제한을 두기 시작했습니다. 그동안 투자금으로 굴러가던 AI 생태계가 이제 실제 비용을 고객에게 전가하기 시작했다는 거예요.

반대쪽에서는 Google이 Google AI Plus 월정액을 7.99달러에서 4.99달러로 내리고 스토리지를 200GB에서 400GB로 두 배 늘렸어요. 인도 같은 신흥시장에서 벌어지던 구독료 경쟁이 미국 시장까지 번진 신호인데요, 개인·학생 사용자를 겨냥한 저가 포지셔닝을 한층 강하게 했습니다.

그리고 이 모든 흐름의 배경에는 Anthropic이 있어요. Claude를 만든 Anthropic이 SEC에 Form S-1을 비공개 제출하며 1조 달러 이상 기업가치를 노리는 IPO 절차에 들어갔거든요. 직전 시리즈 H로 650억 달러를 조달해 post-money 9,650억 달러를 인정받은 뒤의 행보예요. 같은 해 OpenAI도 ChatGPT를 코딩 도구와 AI Agent를 통합한 'Super App'으로 개편해 비즈니스 고객을 확보하고 IPO 전 수익성을 끌어올리려 하고 있습니다.

왜 중요한가 — 양극화는 같은 원인에서 나와요

가격 인상과 인하가 동시에 일어나는 건 모순이 아니에요. 둘 다 '수익성 압박'이라는 하나의 뿌리에서 갈라진 가지예요.

IPO를 앞둔 AI 기업들은 더 이상 '성장만 보여주면 되는' 단계가 아니에요. 시장에 상장하려면 수익성 스토리가 필요한데요, 그 압박이 두 방향으로 표출됩니다. 하나는 실제 사용량에 따라 비용을 청구하는 토큰 과금(B2B·헤비유저 대상 수익 확보), 다른 하나는 저가 구독으로 대규모 사용자 기반을 선점하는 전략(시장 점유율 확보)이에요.

Google의 가격 인하는 'AI 인프라가 결국 상품화될 것'이라는 업계 예측과 맞아떨어져요. 기반 모델 성능이 평준화되면 가격이 승부처가 되는데요, 인프라를 자체 보유한 Google은 출혈 경쟁을 버틸 체력이 있습니다. 반면 모델을 빌려 쓰는 서비스(GitHub Copilot처럼)는 토큰 비용을 고객에게 넘길 수밖에 없어요. 같은 시장이지만 위치에 따라 전략이 정반대로 갈리는 거예요.

OpenAI의 Super App 전략과 Anthropic의 IPO 추진은 이 경쟁의 본질을 보여줍니다. '챗은 죽었다'며 챗봇을 넘어선 개인 Agent 경험으로 무료 사용자를 유료 코딩 제품(Codex)으로 유도하겠다는 건데요, 결국 단발성 응답이 아니라 '지속적으로 일을 해주는 에이전트'에서 돈이 나온다는 판단이에요. 사용량이 쌓일수록 청구액도 커지는 구조인 거죠.

실무에 주는 함의

첫째, AI 비용을 '고정비'가 아니라 '변동비'로 재설계해야 해요. 토큰 과금 시대에는 사용량이 곧 비용입니다. 마케팅·데이터 팀이 LLM을 콘텐츠 생성이나 분석 자동화에 쓴다면, 호출 횟수와 토큰 소비를 모니터링하고 상한선을 두는 거버넌스가 필수예요. Uber조차 사용량 제한을 두기 시작했다는 사실을 가볍게 보면 안 됩니다.

둘째, 효율형 모델을 적극 검토하세요. 모든 작업에 최상위 모델을 쓸 필요는 없어요. 코히어의 North Mini Code처럼 300억 파라미터 규모에 실제 3억 활성 파라미터만 쓰면서 SWE-Bench 80% 이상을 달성하는 경량 모델이 나오고 있거든요. 작업 난이도에 따라 모델을 분기하는 '라우팅' 설계만으로도 비용을 크게 줄일 수 있어요.

셋째, ROI 증명에 집중하세요. 런던증권거래소그룹(LSEG)이 ChatGPT Enterprise와 OpenAI API를 전사 배포해 제품 출시 주기를 3~6개월에서 2주로, 고객 요청에서 본운영까지를 약 4주로 단축한 사례가 좋은 기준점이에요. 핵심은 '거버넌스를 처음부터 내장하고 워크플로우 전체를 재설계'했다는 점인데요, 도구 몇 개 붙이는 수준이 아니라 일하는 방식을 바꿔야 비용을 정당화할 효과가 나온다는 뜻이에요.

넷째, 협상력을 확보하세요. Snowflake Cortex AI에 Claude Fable 5가 통합되는 것처럼, 클라우드·데이터 플랫폼 안에서 모델을 쓰는 선택지가 늘고 있어요. 특정 벤더에 락인되지 않도록 멀티 모델 전략을 세워두면, 가격이 흔들릴 때 대응 여지가 생깁니다.

리스크·한계

저가 구독이 계속 유지될 거라 단정하면 안 돼요. 지금의 가격 인하는 점유율 확보를 위한 출혈일 가능성이 큰데요, 시장이 정리되고 IPO 이후 수익 압박이 커지면 가격이 다시 오를 수 있어요. 신흥시장에서 시작된 경쟁이 미국까지 번졌듯, 인하 국면은 영원하지 않습니다. 저렴할 때 의존도를 키워뒀다가 인상기에 비용 충격을 받는 시나리오를 경계하세요.

또한 토큰 과금은 예측 불가능성이 큰 비용 구조예요. 예산을 세우기 어렵고, 사용량이 폭증하는 워크플로우에서는 한 달 만에 예산을 태울 수 있습니다. 도입 초기에 반드시 파일럿으로 실제 소비량을 측정하고, 상한·알림 체계를 갖춘 뒤 확장하는 게 안전해요.

마지막으로, 가격이 매력적이라고 검증을 건너뛰면 안 돼요. AI 시스템 도입은 보안 검증과 짝을 이뤄야 하는데요, Meta AI의 버그가 인스타그램 계정 탈취 위험을 만든 사례, 그리고 Frontier AI가 암호화폐의 심각한 보안 취약점을 찾아내는 능력에 비해 업계 대비가 부족하다는 경고를 떠올리면 됩니다. 비용 최적화에만 매몰되면 보안·거버넌스라는 더 큰 비용을 나중에 치르게 돼요. 결국 'AX 시대의 비용 관리'는 단가 협상이 아니라, 사용량·모델 선택·보안·ROI를 함께 보는 통합 설계의 문제예요.

태그