🎹바이브 코딩 마스터
Chapter 16

📈사용량과 제한

구독과 토큰 관리

각 플랫폼의 사용량 확인법, 제한 대처법, 토큰 절약 팁을 알아봅니다.

15

Chapter 16: 사용량과 제한 이해하기 — 구독과 토큰 관리

AI 코딩 도구를 사용하다 보면 "사용량 제한에 걸렸습니다"라는 메시지를 만나게 됩니다. 이 장에서는 각 플랫폼의 사용량 구조를 이해하고, 제한에 걸렸을 때 대처하는 방법, 그리고 토큰을 절약하는 실전 팁을 배웁니다.

🎼 음악으로 비유하면

사용량 제한은 녹음 스튜디오 예약 시간과 같습니다. 무료 연습실은 하루 2시간만 사용 가능하고, 유료 스튜디오는 월정액에 따라 사용 시간이 달라집니다. 시간이 부족하면 더 비싼 플랜으로 업그레이드하거나, 녹음 시간을 효율적으로 사용하는 기술을 익혀야 합니다. 이 장에서 배우는 것은 바로 그 "효율적 사용 기술"입니다.


16.1 토큰이란? — 기본 개념

AI 사용량은 토큰(token) 단위로 측정됩니다. 먼저 토큰이 무엇인지 이해해야 합니다.

토큰의 정의

토큰 이해하기text
# 영어에서:
"Hello, world!" → 4 토큰 (Hello, ',', world, '!')

# 한국어에서 (토큰이 더 많이 소모됨):
"안녕하세요" → 약 3-5 토큰 (문자 단위로 분할)

# 코드에서:
"function add(a, b) { return a + b; }" → 약 15 토큰

# 대략적인 환산:
# 영어: 1 토큰 ≈ 4글자 ≈ 0.75단어
# 한국어: 1 토큰 ≈ 1-2글자
# 코드: 1줄 ≈ 10-20 토큰

AI 요청의 토큰 구조

토큰 구조text
하나의 AI 요청에 소모되는 토큰:

┌─────────────────────────┐
│  입력 토큰 (Input)       │ ← 여러분이 보내는 것
│  - 시스템 프롬프트       │   (CLAUDE.md, 설정 등)
│  - 대화 히스토리         │   (이전 대화 내용)
│  - 현재 질문             │   (지금 보낸 메시지)
│  - 파일 컨텍스트         │   (AI가 읽은 파일들)
├─────────────────────────┤
│  출력 토큰 (Output)      │ ← AI가 생성하는 것
│  - AI의 응답 텍스트      │
│  - 생성된 코드           │
│  - 도구 호출 결과        │
└─────────────────────────┘

총 비용 = 입력 토큰 비용 + 출력 토큰 비용
(출력 토큰이 보통 3-5배 비쌈)
🎼 음악으로 비유하면

토큰은 악보의 마디(bar) 수와 비슷합니다. 곡이 길수록 마디가 많듯이, 대화가 길어질수록 토큰이 많이 소모됩니다. 그리고 오케스트라 총보(여러 파트)가 피아노 솔로 악보보다 마디당 더 많은 정보를 담듯이, 코드 파일을 많이 포함한 요청은 토큰 소모가 큽니다.


16.2 플랫폼별 사용량 구조

GPT Codex (OpenAI)

항목GPT CodexClaude CodeGemini CLI
플랜ChatGPT PlusChatGPT ProAPI 종량제
월 가격$20/월$200/월사용한 만큼
Codex 사용량제한적 접근 (느린 모델 우선)우선 접근 300-1,500 메시지/5시간토큰당 과금
사용량 단위메시지 수메시지 수 (복잡도에 따라 변동)토큰 수
리셋 주기월별 리셋5시간마다 롤링 리셋없음 (잔액 차감)
초과 시 동작느린 모델로 전환일시 대기 후 사용 가능잔액 소진 시 중단
ℹ️ ChatGPT Pro의 '복잡도에 따라 변동'이란?

GPT Pro 플랜에서 5시간당 메시지 수가 300-1,500으로 범위가 넓은 이유는, 질문의 복잡도에 따라 소모되는 "계산량"이 다르기 때문입니다. 간단한 질문은 1 메시지 = 소량 소모, 복잡한 코드 분석은 1 메시지 = 대량 소모입니다. 음악으로 치면, 단선율 멜로디 녹음과 60트랙 오케스트라 녹음의 스튜디오 비용이 다른 것과 같습니다.

Claude Code (Anthropic)

항목GPT CodexClaude CodeGemini CLI
플랜Claude ProClaude Max 5xClaude Max 20x
월 가격$20/월$100/월$200/월
사용량기본 사용량 (토큰 기반 제한)Pro의 5배Pro의 20배
사용량 단위토큰 (입력+출력)토큰 (입력+출력)토큰 (입력+출력)
모델 접근Sonnet 4 (기본) Opus 4.6 (제한적)Opus 4.6 (여유)Opus 4.6 (충분)
리셋 주기일별 롤링일별 롤링일별 롤링
초과 시 동작사용 일시 중단 또는 경량 모델 전환사용 일시 중단 (곧 리셋)사용 일시 중단 (곧 리셋)

Gemini CLI (Google)

항목GPT CodexClaude CodeGemini CLI
플랜무료 티어Gemini AdvancedAPI 종량제
월 가격무료$20/월 (Google One AI)사용한 만큼
사용량일 1,000회 요청 (Gemini Flash)향상된 사용량 (2.5 Pro 접근)토큰당 과금
사용량 단위요청 수요청 수 + 토큰토큰 수
모델 접근Gemini 2.0 Flash만Gemini 2.5 Pro모든 모델
리셋 주기일별 리셋일별 리셋없음 (잔액 차감)
초과 시 동작사용 중단 (다음 날 리셋)일시 대기잔액 소진 시 중단

16.3 전체 가격 비교표

항목GPT CodexClaude CodeGemini CLI
무료 사용불가불가가능 (일 1,000회)
$20/월ChatGPT Plus (제한적 Codex)Claude Pro (기본 사용량)Google One AI Premium
$100/월해당 없음Claude Max 5x (Opus 4.6 여유)해당 없음 (API 종량제 별도)
$200/월ChatGPT Pro (최대 사용량)Claude Max 20x (최대 사용량)해당 없음
월 $20 가성비보통 (Codex 접근 제한적)좋음 (하루 수십 회 작업 가능)좋음 (무료 티어도 있음)
헤비 유저 추천ChatGPT Pro $200Claude Max $100-200API 종량제

16.4 사용량 확인 방법

각 플랫폼에서 현재 사용량을 확인하는 방법입니다.

Claude Code 사용량 확인

Claude Code 사용량 확인bash
# 방법 1: CLI 상태바 확인
# Claude Code 실행 중 하단 상태바에 현재 모델과
# 남은 사용량이 표시됩니다.
# 예: "Opus 4.6 · 78% remaining"

# 방법 2: /cost 명령어
/cost
# → 현재 세션에서 소비한 토큰 수와 비용을 표시

# 방법 3: 세션 시작 시 자동 표시
# Claude Code는 세션 시작 시 구독 플랜과 
# 남은 사용량을 자동으로 보여줍니다.
# 제한에 가까워지면 경고 메시지가 나타납니다.
# 예: "⚠️ You're approaching your daily usage limit"

# 방법 4: 웹 대시보드
# https://console.anthropic.com/
# → Settings → Usage 탭에서 일별 토큰 사용 그래프 확인
# (API 종량제 사용자에게 가장 유용)

GPT Codex 사용량 확인

Codex 사용량 확인bash
# 방법 1: ChatGPT 웹에서 확인
# https://chatgpt.com/ → 설정 → 사용량

# 방법 2: API 대시보드
# https://platform.openai.com/usage
# → 일별/월별 토큰 사용량 그래프

# 방법 3: CLI에서
# Codex는 세션 중 사용량 표시기 제공

Gemini CLI 사용량 확인

Gemini 사용량 확인bash
# 방법 1: Google AI Studio
# https://aistudio.google.com/
# → 사용량 탭

# 방법 2: CLI에서 표시
# 무료 티어의 경우 남은 요청 수 표시

# 방법 3: Google Cloud Console (API 종량제)
# https://console.cloud.google.com/
# → API & Services → Usage

16.5 제한에 걸렸을 때 — 증상과 대처법

증상: 이런 메시지가 보이면 제한에 걸린 것입니다

사용량 제한 에러 메시지들text
# Claude Code 제한 메시지 예시:
"You've reached your usage limit. 
Your limit will reset in approximately 2 hours."

"Rate limit exceeded. Please wait before making 
another request."

# Codex 제한 메시지 예시:
"You've reached your message limit for this period.
Your limit resets in 3h 24m."

"Switching to a smaller model due to usage limits."

# Gemini CLI 제한 메시지 예시:
"Daily quota exceeded. Please try again tomorrow."

"Rate limit: 1,000 requests per day on free tier.
Upgrade for more."
🎼 음악으로 비유하면

사용량 제한은 연습실 시간 만료 알림과 같습니다. "연습실 사용 시간이 끝났습니다. 다음 예약 시간은 2시간 후입니다." 갑자기 연주를 멈춰야 하는 상황입니다. 이런 상황을 미리 대비하는 방법을 알아봅시다.

대처법 1: 기다리기

ℹ️ 가장 간단한 방법

대부분의 제한은 시간이 지나면 자동으로 리셋됩니다. Claude Code는 몇 시간, Gemini 무료 티어는 다음 날 리셋됩니다. 급하지 않다면 쉬었다가 다시 시작하세요. 쉬는 시간에 프로젝트 방향을 정리하거나 문서를 읽는 것도 좋습니다.

대처법 2: 다른 플랫폼으로 전환

플랫폼 전환 전략bash
# Claude Code 제한 걸림 → Gemini CLI로 전환
gemini
> "이전에 Claude Code에서 작업하던 프로젝트야.
> CLAUDE.md를 읽어서 프로젝트 맥락을 파악하고,
> src/components/HandTracker.tsx를 수정해줘."

# CLAUDE.md에 프로젝트 정보가 잘 정리되어 있으면
# 다른 AI도 바로 작업을 이어갈 수 있습니다!
💡 멀티 플랫폼 전략의 핵심

지침 파일(CLAUDE.md, AGENTS.md 등)을 잘 작성해두면, 어떤 AI 플랫폼으로 전환해도 프로젝트 맥락을 빠르게 파악할 수 있습니다. 이것이 지침 파일이 중요한 또 다른 이유입니다.

대처법 3: 경량 모델로 전환

경량 모델 전환bash
# Claude Code에서 경량 모델 사용
claude --model claude-sonnet-4-20250514
# Sonnet은 Opus보다 토큰 소모가 적음

# Codex에서 경량 모델 사용
# config.toml에서:
model = "o4-mini"
# o4-mini는 GPT-5.4보다 빠르고 저렴

# Gemini에서 경량 모델 사용
# Flash 모델은 Pro보다 훨씬 저렴
# 무료 티어에서도 Flash 사용 가능

대처법 4: 플랜 업그레이드

중요한 프로젝트 마감이 있다면, 일시적으로 상위 플랜으로 업그레이드하는 것도 방법입니다. 대부분의 플랫폼은 언제든 플랜 변경이 가능합니다.


16.6 토큰 절약 팁 — 효율적으로 사용하기

사용량 제한 내에서 최대한 많은 작업을 하기 위한 실전 팁입니다.

팁 1: /compact 활용하기

/compact 사용bash
# Claude Code에서 대화가 길어지면:
/compact

# 이 명령은 현재까지의 대화를 요약하여
# 토큰 사용량을 크게 줄여줍니다.
# 
# 적용 시점:
# - 대화가 20-30턴 이상 진행됐을 때
# - "토큰이 부족합니다" 경고가 보일 때
# - 새로운 주제로 넘어가기 전
🎼 음악으로 비유하면

/compact는 **녹음 트랙 바운싱(bouncing)**과 같습니다. 10개의 드럼 트랙을 하나의 스테레오 트랙으로 바운싱하면 CPU 부하가 줄어들듯이, 긴 대화를 요약하면 토큰 소모가 줄어듭니다. 디테일은 약간 줄어들지만, 전체 흐름은 유지됩니다.

팁 2: 짧고 명확한 프롬프트 작성

프롬프트 효율성 비교text
# 나쁜 예시 (불필요하게 긴 프롬프트):
"안녕하세요, 제가 지금 MediaPipe를 사용해서 
프로젝트를 만들고 있는데요, 아시다시피 
MediaPipe는 Google이 만든 건데, 음... 
제가 하고 싶은 것은 손 인식을 하고 싶은 건데,
혹시 코드를 좀 봐주실 수 있을까요?
잘 안 되는 것 같아서요..."
# → 약 100 토큰 소모

# 좋은 예시 (간결하고 명확):
"HandTracker.tsx의 onResults 콜백에서
landmarks가 undefined일 때 에러 발생.
null check 추가해줘."
# → 약 30 토큰 소모
💡 프롬프트 작성 공식

[대상 파일] + [문제/작업] + [원하는 결과] 형식으로 작성하세요.

  • "HandTracker.tsx에서(대상) null check가 없어서 에러남(문제). 방어 코드 추가해줘(결과)."
  • 배경 설명, 인사말, 모호한 표현은 토큰 낭비입니다.

팁 3: 단계별 요청 (한 번에 너무 많이 요청하지 않기)

단계별 요청 전략text
# 나쁜 예시 (한 번에 모든 것을 요청):
"MediaPipe 손 인식 + OSC 전송 + Ableton 제어 +
UI 디자인 + 에러 처리 + 테스트 코드까지 
전부 만들어줘"
# → 매우 많은 출력 토큰 소모
# → 결과물 품질도 낮아질 수 있음

# 좋은 예시 (단계별 요청):
# 요청 1: "MediaPipe 손 인식 모듈만 만들어줘"
# 요청 2: "잘 됐어. 이제 OSC 전송 모듈 추가해줘"
# 요청 3: "두 모듈을 연결하는 코드 작성해줘"
# → 각 단계에서 검증 가능
# → 총 토큰은 비슷하지만 품질이 높음
🎼 음악으로 비유하면

한 번에 "교향곡 전체를 작곡해줘"라고 하면 품질이 떨어집니다. "1악장의 주제 멜로디를 먼저 만들어줘" → "좋아, 이걸 발전부로 확장해줘" → "이제 재현부를 작성해줘"처럼 단계별로 진행하면 각 부분의 품질이 높아지고, 방향 수정도 쉬워집니다.

팁 4: 불필요한 파일 컨텍스트 제거

불필요한 컨텍스트 줄이기text
# AI가 읽는 파일이 많을수록 입력 토큰이 증가합니다.

# 나쁜 예시:
# 프로젝트에 node_modules, .git, 빌드 파일이 포함되어
# AI가 불필요한 파일까지 읽음

# 좋은 예시:
# .gitignore가 잘 설정되어 있으면 AI도 불필요한 파일을 건너뜀

# .gitignore에 추가해야 할 것들:
node_modules/
.next/
dist/
build/
*.log
.env
⚠️ 큰 파일 주의

AI에게 매우 큰 파일(수천 줄)을 읽게 하면 입력 토큰이 급증합니다. "이 파일 전체를 분석해줘" 대신 **"이 파일의 150-200번째 줄에서 에러가 나는데 봐줘"**처럼 범위를 지정하면 토큰을 크게 절약할 수 있습니다.

팁 5: 간단한 작업은 가벼운 모델 사용

작업별 모델 선택text
# 작업별 추천 모델:

# 간단한 작업 (경량 모델로 충분):
# - 오타 수정
# - 간단한 함수 작성
# - 파일 이름 변경
# - 주석 추가
# → Claude Sonnet, o4-mini, Gemini Flash

# 복잡한 작업 (고급 모델 필요):
# - 전체 아키텍처 설계
# - 여러 파일에 걸친 리팩토링
# - 복잡한 버그 디버깅
# - 성능 최적화
# → Claude Opus, GPT-5.4, Gemini 2.5 Pro
🎼 음악으로 비유하면

메트로놈을 확인하는 데 풀 오케스트라가 필요 없듯이, 간단한 코드 수정에 최고급 AI 모델을 사용할 필요가 없습니다. 적재적소에 맞는 도구를 사용하면 비용도 절약되고 속도도 빨라집니다.

팁 6: 새 세션 시작 타이밍

새 세션 시작 가이드text
# 새 대화를 시작해야 할 때:
# 1. 주제가 완전히 바뀔 때
#    (MediaPipe 작업 → CSS 디자인 → 새 세션)
#
# 2. 대화가 30턴 이상 진행됐을 때
#    (오래된 맥락이 토큰을 소모)
#
# 3. AI가 이전 지시사항을 잊어버릴 때
#    ("아까 말했잖아"를 반복하게 되면 새 세션)
#
# 새 세션 시작 전 체크리스트:
# ✓ 중요한 결정사항이 CLAUDE.md에 기록되었는가?
# ✓ 현재 작업 상태가 Git에 커밋되었는가?
# ✓ 다음 세션에서 이어갈 작업이 명확한가?

16.7 구독 플랜 선택 가이드

학습 단계별 추천

입문 단계 (1-2주차) — 무료/최소 비용

입문 단계 추천text
추천 조합:
- Gemini CLI 무료 티어 (일 1,000회)
- VS Code (무료) + GitHub Copilot (학생 무료)

월 비용: $0
충분한 이유: 기초 학습, 간단한 예제에는 무료 티어로 충분

실습 단계 (3-4주차) — 기본 구독

실습 단계 추천text
추천 조합 A: Claude Pro ($20/월)
- 이 커리큘럼의 메인 도구
- CLAUDE.md, MCP 등 배운 기능 활용 가능
- 하루 수십 회 작업 가능

추천 조합 B: ChatGPT Plus ($20/월)
- Codex CLI 사용 가능
- 웹 ChatGPT도 함께 사용

월 비용: $20

프로젝트 단계 (5주차~) — 필요에 따라 업그레이드

프로젝트 단계 추천text
MediaPipe + Ableton 프로젝트를 본격적으로 만든다면:

추천: Claude Max 5x ($100/월)
- Opus 4.6 모델을 여유롭게 사용
- 복잡한 멀티파일 작업에 충분한 사용량
- MCP 도구를 적극 활용

또는: ChatGPT Pro ($200/월)
- Codex에서 거의 무제한 사용
- 다른 GPT 기능도 포함

월 비용: $100-200
(프로젝트 마감 시 일시 업그레이드 → 이후 다운그레이드)

비용 최적화 전략

💡 스마트한 구독 관리
  1. 무료 티어로 시작 — Gemini CLI 무료 + VS Code + Copilot 학생 무료
  2. 필요할 때만 업그레이드 — 프로젝트 마감 전 한 달만 상위 플랜 사용
  3. 여러 플랫폼 분산 — Claude + Gemini 무료를 번갈아 사용
  4. 토큰 절약 팁 적용 — /compact, 간결한 프롬프트, 경량 모델 활용
  5. 학생 혜택 최대 활용 — GitHub Education, Google Education 등

16.8 사용량 관리 체크리스트

마지막으로, 일상적으로 사용량을 관리하는 체크리스트입니다.

사용량 관리 체크리스트text
매일 확인:
□ 오늘 남은 사용량 확인 (대시보드 또는 CLI)
□ 중요한 작업을 먼저 처리 (사용량 여유 있을 때)

세션 시작 시:
□ 프로젝트 지침 파일(CLAUDE.md) 최신 상태 확인
□ 이전 세션의 작업이 Git에 커밋되었는지 확인
□ 오늘의 작업 목표 명확히 정리

세션 중:
□ 대화가 길어지면 /compact 사용
□ 간단한 작업은 경량 모델로 전환
□ 한 번에 하나씩 단계별로 요청

세션 종료 시:
□ 작업 결과 Git 커밋
□ 중요한 결정사항 지침 파일에 기록
□ 다음 세션 작업 계획 메모
🎼 음악으로 비유하면

사용량 관리는 연습 시간 관리와 같습니다. 하루 연습 시간이 제한되어 있다면, 가장 어려운 패시지를 먼저 연습하고, 쉬운 스케일은 나중에 하는 것이 효율적입니다. AI 사용량도 마찬가지 — 가장 복잡하고 중요한 작업에 고급 모델의 토큰을 집중하고, 단순 작업은 경량 모델이나 직접 처리하세요.

🔥 이 장의 핵심

사용량 제한은 불편하지만, 효율적인 AI 사용 습관을 기르는 기회입니다. 토큰을 아끼려고 노력하다 보면 자연스럽게 프롬프트 작성 실력이 늘고, AI와의 협업 방식이 세련되어집니다. 예산에 맞는 플랜을 선택하되, 무엇보다 토큰을 효율적으로 사용하는 기술을 기르는 것이 장기적으로 가장 중요합니다.