OpenAI Codex 요금표 변경: 토큰 기반 크레딧 계산법과 비용 체크포인트
입력·캐시 입력·출력 토큰별 크레딧 구조로 바뀐 Codex 비용을 실무 관점에서 점검합니다.
OpenAI Codex 요금표 변경, 무엇을 다시 봐야 하나
Codex 요금표는 대부분의 플랜에서 메시지 평균이 아니라 입력 토큰, 캐시 입력 토큰, 출력 토큰별 크레딧으로 계산되는 구조로 바뀌었습니다. 한국 개발자와 팀은 모델 선택, 출력량, Fast mode, code review 사용량을 기준으로 예산을 다시 점검해야 합니다.
Codex를 업무에 붙여 쓰는 사람에게 이번 업데이트는 단순한 가격표 변경이 아닙니다. 예전처럼 “대략 몇 번 요청했는가”만 보는 방식으로는 월말 크레딧 소모를 설명하기 어려워졌습니다.
OpenAI Help Center의 Codex rate card는 2026년 5월 25일 확인 기준 `Updated: 3 days ago`로 표시되어 있었고, OpenAI Codex token based pricing rate card의 적용 범위와 legacy rate card 예외를 함께 설명합니다. 그래서 이 글의 기준은 공식 문서에 두되, 초점은 숫자 자체보다 실제로 무엇을 계산해야 하는지에 맞췄습니다.
제가 보기에는 Codex를 많이 쓰는 팀일수록 “좋은 모델을 골랐는가”보다 “어떤 작업이 긴 출력을 만들고, 어떤 자동화가 반복 실행되는가”를 먼저 봐야 합니다. 내 플랜에 새 요금표가 적용되는지, 어떤 모델이 비용에 민감한지, 첫 테스트를 어떻게 설계할지까지 한 번에 확인하는 흐름이 필요합니다.
적용 일정: 4월 2일과 4월 23일
2026년 4월 2일에는 Plus, Pro, Business, 신규 Enterprise에 토큰 기반 Codex pricing이 적용됐고, 2026년 4월 23일에는 기존 Enterprise와 Edu, Health, Gov, Teachers까지 확대됐습니다. 단, 일부 Enterprise 고객은 마이그레이션 전까지 legacy rate card를 계속 써야 할 수 있습니다.
날짜를 나눠 보는 이유는 간단합니다. 팀 안에서 누군가는 Plus나 Pro로 Codex를 쓰고, 다른 사람은 Business 또는 Enterprise 워크스페이스에서 쓰는 경우가 많기 때문입니다. 같은 Codex라도 어떤 계정·워크스페이스로 로그인했는지에 따라 확인해야 할 화면이 달라집니다.
공식 rate card 기준으로 새 방식은 2026년 4월 2일 Plus, Pro, Business 및 신규 Enterprise에 적용됐고, 2026년 4월 23일 기존 Enterprise, Edu, Health, Gov, ChatGPT for Teachers로 확대됐습니다. 다만 모든 Enterprise 고객이 같은 날 같은 방식으로 정리됐다고 단정하면 안 됩니다. OpenAI는 일부 Enterprise 고객에게 legacy rate card가 남아 있을 가능성을 안내합니다.
한국 사용자 입장에서는 이 부분이 특히 중요합니다. 회사 계정으로 Codex를 쓰고 있다면 개인 구독 화면이 아니라 워크스페이스의 계약·청구 조건을 확인해야 합니다. 비용 문의를 받을 팀 리더라면 `우리 워크스페이스가 새 token rate인지, legacy rate인지`부터 먼저 확인하는 편이 안전합니다.
메시지당 평균에서 토큰 유형별 크레딧으로
새 구조에서는 작업 1회나 메시지 1개 평균이 아니라 실제 입력 토큰, 캐시 입력 토큰, 출력 토큰의 조합이 크레딧 사용량을 결정합니다. 그래서 같은 Codex 작업도 프롬프트 크기, 컨텍스트, 생성 코드량에 따라 비용이 달라집니다.
OpenAI Codex token based pricing rate card를 읽을 때 먼저 볼 단어는 세 가지입니다. `input tokens`, `cached input tokens`, `output tokens`입니다. 입력 토큰은 프롬프트와 첨부된 컨텍스트에 가깝고, 출력 토큰은 Codex가 답변·코드·설명을 생성하면서 쓰는 분량입니다. 캐시 입력 토큰은 재사용되는 대화·컨텍스트 토큰으로, 일반 입력보다 낮은 요율로 계산되는 항목입니다.
이 구조에서는 긴 `AGENTS.md`, 넓은 저장소 컨텍스트, 불필요하게 켜 둔 MCP 서버, 반복적인 대규모 코드 생성이 모두 비용 감도에 들어옵니다. 특히 “짧게 질문했는데 왜 많이 썼지?”라는 상황은 실제로 Codex가 읽은 파일 범위와 생성한 코드량을 같이 봐야 설명됩니다.
> 비용을 줄이는 첫 단계는 모델을 낮추는 것이 아니라, Codex가 읽고 쓰는 범위를 눈에 보이게 만드는 일입니다.
반복 작업을 하나 정하고, 실행 전후 Usage 화면이나 CLI 상태를 비교해 보십시오. 그다음 같은 작업을 더 작은 모델, 더 좁은 컨텍스트, Fast mode off 상태로 반복하면 됩니다. 이 비교가 있어야 “우리 팀의 Codex 비용이 어디서 생기는가”를 말할 근거가 생깁니다.
모델별 크레딧 표에서 먼저 볼 숫자
출력 토큰 요율은 입력 토큰보다 훨씬 높기 때문에 긴 코드 생성, 대규모 리팩터링, 반복 수정 작업은 먼저 출력량을 봐야 합니다. GPT-5.5, GPT-5.4, GPT-5.4-Mini, GPT-5.3-Codex를 같은 표에서 비교하고 Spark는 research preview라 확정 요율로 쓰지 않는 편이 안전합니다.
공식 rate card의 숫자는 아래처럼 줄여 볼 만합니다. 단위는 모두 100만 토큰당 크레딧입니다.
| 모델 | 입력 | 캐시 입력 | 출력 | 해석 |
|---|---|---|---|---|
| GPT-5.5 | 125 | 12.50 | 750 | 복잡한 설계·고난도 코드 작업에 제한적으로 배정할 후보입니다. |
| GPT-5.4 | 62.50 | 6.250 | 375 | GPT-5.5보다 낮지만 출력이 길면 비용 차이가 빨리 커집니다. |
| GPT-5.4-Mini | 18.75 | 1.875 | 113 | routine edit, 작은 수정, 초안 생성에서 먼저 시험해 볼 후보입니다. |
| GPT-5.3-Codex | 43.75 | 4.375 | 350 | Code Review 기준 모델로 안내됩니다. 리뷰 자동화 비용을 따로 봐야 합니다. |
| GPT-5.2 | 43.75 | 4.375 | 350 | GPT-5.3-Codex와 같은 rate로 제시됩니다. |
| GPT-5.3-Codex-Spark | 미확정 | 미확정 | 미확정 | research preview로 표시되어 예산표에 확정값처럼 넣으면 안 됩니다. |
여기서 눈에 띄는 것은 출력 요율입니다. 예를 들어 GPT-5.5는 입력 100만 토큰당 125 credits인데 출력은 750 credits입니다. 단순 질문보다 긴 코드 생성, 여러 파일 수정, 설명이 붙은 리팩터링이 더 민감해지는 이유입니다.
OpenAI Codex token based pricing rate card를 비용표로만 보면 모델 순위만 남습니다. 하지만 실제 팀 운영에서는 “어느 모델을 기본값으로 둘 것인가”와 “어떤 작업에서 큰 모델을 허용할 것인가”가 더 중요합니다. 제가 팀 규칙을 만든다면, 작은 수정과 테스트 보완은 Mini 계열로 먼저 돌리고, 설계 변경이나 난도가 높은 디버깅에만 상위 모델을 열어두겠습니다.
한국 개발팀이 비용 예측을 다시 해야 하는 이유
이 변경은 월 구독료 안에서 몇 번 쓰는가보다 어떤 모델로 얼마나 많은 토큰을 쓰는가를 더 중요하게 만듭니다. 특히 여러 Codex 인스턴스, 자동화, GitHub code review, Fast mode를 쓰는 팀은 월별 사용량 편차가 커집니다.
OpenAI는 Codex의 평균 사용 비용을 개발자 1명당 월 100~200달러 수준으로 설명합니다. 다만 이 숫자를 청구서 예측값처럼 쓰면 위험합니다. 공식 문서는 실제 비용이 모델, 인스턴스 수, 자동화, Fast mode 사용에 따라 크게 달라진다고 덧붙입니다.
팀에서 Codex를 도입할 때 자주 빠지는 함정은 “사람이 직접 입력한 요청”만 세는 것입니다. 하지만 GitHub code review, 클라우드 작업, 반복 자동화, 긴 리팩터링 요청은 사람이 체감하는 횟수보다 더 많은 토큰을 만들 가능성이 있습니다. 반대로 작은 모델과 좁은 컨텍스트로 잘 나눠 쓰면 같은 월간 작업량도 낮은 크레딧으로 처리될 여지가 있습니다.
한국 팀이라면 환율과 내부 승인 절차도 같이 봐야 합니다. 달러 기준 평균치를 그대로 예산으로 잡기보다, 대표 작업 3가지를 골라 월간 반복 횟수와 출력량을 측정하는 방식이 낫습니다. 예산 회의에서 필요한 것은 추상적인 AI 도구비가 아니라 `리뷰 자동화 1회`, `로컬 리팩터링 1회`, `대규모 테스트 보완 1회`의 실제 사용량입니다.
도입 시뮬레이션: 첫 테스트부터 운영 모델까지
대표 Codex 작업 하나를 정해 Usage 패널 또는 CLI /status로 전후 사용량을 기록한 뒤, 모델 변경과 Fast mode off 조건을 비교하면 팀의 실제 비용 감도가 보입니다. 운영 모델은 local task, cloud task, GitHub code review, automation을 나누어 기록하는 방식이 좋습니다.
새 요금표를 읽고 바로 예산표를 만드는 것보다, 작은 실험을 먼저 하는 편이 정확합니다. 아래는 OpenAI Codex token based pricing rate card를 팀에 적용하기 전에 해볼 만한 최소 테스트입니다.
1. 대표 작업을 하나 고릅니다. 예: 작은 버그 수정, 테스트 추가, PR code review, 문서 기반 리팩터링.
2. Codex settings > Usage 또는 CLI 세션의 `/status`로 시작 전 상태를 기록합니다.
3. 평소 쓰려는 모델과 standard speed로 한 번 실행합니다.
4. 같은 작업을 더 작은 모델 또는 Fast mode off 조건으로 다시 비교합니다.
5. `AGENTS.md` 범위, MCP 서버 사용 여부, 생성된 코드량, 재시도 횟수를 함께 적습니다.
Fast mode도 별도 항목으로 빼야 합니다. OpenAI Developers 문서는 Fast mode가 지원 모델에서 속도를 1.5배 높이며, GPT-5.5는 standard rate의 2.5배, GPT-5.4는 2배 credit multiplier를 쓴다고 설명합니다. CLI에서는 `/fast on`, `/fast off`, `/fast status`로 확인하고, `config.toml`에 `service_tier = "fast"` 및 `[features].fast_mode = true`를 설정해 유지합니다.
다만 지연 시간이 병목이 아닌 작업에 Fast mode를 기본값으로 두는 것은 조심해야 합니다. 코드 리뷰처럼 반복 실행되는 자동화에 빠른 모드를 켜두면, 사람이 느끼는 편의보다 크레딧 차이가 더 크게 남습니다.
같이 확인할 도구와 건너뛸 조건
호환 도구는 Codex usage dashboard, CLI /status, OpenAI token 설명 문서, AGENTS.md scoping, MCP server hygiene, GitHub code review 워크플로입니다. 지연이 병목이 아니면 Fast mode 기본값을 피하고, routine edit에는 작은 모델을 먼저 시험하는 편이 좋습니다.
이번 업데이트는 설치형 도구처럼 무언가를 새로 깔아야 하는 변화는 아닙니다. 대신 운영 습관을 바꿔야 합니다. Business 워크스페이스라면 owner가 Settings > Billing에서 pooled credits를 구매할 수 있고, Enterprise와 Edu는 OpenAI account team을 통해 계약에 포함된 credit을 다루는 방식으로 안내됩니다.
실무 체크리스트는 다음 정도면 충분합니다.
- 개인 Plus/Pro인지, Business/Enterprise 워크스페이스인지 구분합니다.
- 워크스페이스가 새 rate card인지 legacy rate card인지 확인합니다.
- PR code review, local task, cloud task, automation을 분리해 기록합니다.
- `AGENTS.md`가 불필요하게 넓은 저장소 설명을 담고 있지 않은지 봅니다.
- 쓰지 않는 MCP 서버가 매 작업마다 컨텍스트를 늘리지 않는지 확인합니다.
- routine edit은 GPT-5.4-Mini 같은 작은 모델부터 테스트합니다.
- Fast mode는 지연 시간이 실제 병목인 작업에만 켭니다.
OpenAI Codex token based pricing rate card를 예산에 반영할 때 건너뛸 조건도 분명히 두는 편이 좋습니다. 워크스페이스가 legacy Enterprise로 확인됐거나, API key mode 사용량을 ChatGPT credit rate card와 섞어 계산해야 하는 상황이라면 먼저 기준을 분리해야 합니다. Speed 문서는 API key 사용이 standard API pricing을 따른다고 설명하므로, ChatGPT 로그인 기반 Codex 크레딧과 같은 표에 두면 혼동됩니다.
주의할 해석: 비용 상승 단정 금지
이번 변경이 모든 사용자에게 비용 상승이나 절감을 의미한다고 단정하면 안 됩니다. 작업 조합, 모델, 자동화, Fast mode, 출력량에 따라 실제 크레딧 소모가 달라집니다.
개인 블로그 글에서 가장 조심해야 할 부분은 “요금이 올랐다” 또는 “싸졌다”처럼 한 문장으로 끝내는 해석입니다. 토큰 기반 구조는 더 정밀한 계산을 가능하게 하지만, 그 결과가 누구에게나 같은 방향으로 움직인다는 뜻은 아닙니다.
예를 들어 짧은 수정과 반복 캐시가 많은 작업은 예상보다 낮게 나올 수 있고, 긴 코드 생성과 여러 번의 재시도가 많은 작업은 빠르게 커질 가능성이 있습니다. Fast mode를 항상 켠 팀과 필요할 때만 켠 팀의 월간 크레딧도 다르게 보입니다.
마지막으로, GPT-5.3-Codex-Spark는 research preview로 표시되어 확정 요율처럼 다루면 안 됩니다. 예산표에 넣어야 한다면 별도 행을 만들고 “확정 전”이라고 표시하는 편이 낫습니다. 이 정도 선을 지키면 OpenAI Codex token based pricing rate card를 과장 없이 실무에 붙일 수 있습니다.
자주 묻는 질문
Q. Codex token-based rate card는 기존 메시지 기반 요금표와 무엇이 다른가?
A. 메시지 1개 평균이 아니라 입력 토큰, 캐시 입력 토큰, 출력 토큰별로 100만 토큰당 크레딧이 계산됩니다. 그래서 같은 요청 횟수라도 컨텍스트 크기와 생성 코드량에 따라 비용이 달라집니다.
Q. 내 Plus, Pro, Business, Enterprise, Edu, Health, Gov, Teachers 플랜에도 적용됩니까?
A. 공식 rate card는 2026년 4월 2일 Plus, Pro, Business, 신규 Enterprise에 적용됐고, 2026년 4월 23일 기존 Enterprise, Edu, Health, Gov, Teachers까지 확대됐다고 설명합니다. 다만 일부 Enterprise 고객은 마이그레이션 전까지 legacy rate card를 계속 사용할 수 있습니다.
Q. 입력 토큰과 출력 토큰 중 무엇을 먼저 봐야 합니까?
A. 비용 민감도는 보통 출력 토큰에서 먼저 확인하는 편이 좋습니다. 공식 표에서 GPT-5.5의 출력 요율은 입력 요율보다 훨씬 높기 때문에 긴 코드 생성, 리팩터링, 반복 수정 작업은 출력량을 따로 기록해야 합니다.
Q. Fast mode를 켜면 비용이 얼마나 달라집니까?
A. OpenAI Developers Speed 문서는 Fast mode가 지원 모델에서 1.5배 속도를 제공하고, GPT-5.5는 standard rate의 2.5배, GPT-5.4는 2배 credit multiplier를 쓴다고 안내합니다. CLI에서는 `/fast status`로 상태를 확인한 뒤 필요한 작업에만 켜는 방식이 안전합니다.
Q. Codex code review 비용은 어떤 모델 기준으로 봐야 합니까?
A. Help Center는 Code Review가 GPT-5.3-Codex를 사용한다고 안내합니다. PR 리뷰 자동화를 자주 돌리는 팀은 일반 대화형 Codex 작업과 code review 작업을 분리해 사용량을 기록하는 편이 좋습니다.
Q. API key mode의 Codex 사용도 ChatGPT credit rate card를 따릅니까?
A. 아닙니다. OpenAI Developers Speed 문서는 API key 사용이 standard API pricing을 따른다고 설명합니다. ChatGPT 로그인 기반 Codex 크레딧과 API key 기반 사용량은 예산표에서 분리해야 합니다.
Q. GPT-5.3-Codex-Spark 요율을 예산에 넣어도 됩니까?
A. 확정값처럼 넣지 않는 편이 좋습니다. 공식 rate card는 GPT-5.3-Codex-Spark를 research preview로 표시하고 credit rates are not final이라고 설명합니다.
함께 읽으면 좋은 글
참조 링크
- Codex rate card — 토큰 기반 Codex credit rate, 적용 일정, legacy 예외, 모델별 rate, code review 기준의 1차 근거입니다.
- Pricing - Codex — CLI /status, usage limits, AGENTS.md·MCP·모델 선택을 통한 사용량 절감 포인트를 확인하기 위해 참고했습니다.
- Speed - Codex — Fast mode의 지원 방식, /fast 명령, config.toml 설정, credit multiplier를 확인한 공식 문서입니다.
- Flexible pricing for the Enterprise, Edu, and Business plans — Business·Enterprise·Edu의 pooled credits, credit 구매 경로, 워크스페이스 결제 맥락을 확인하기 위해 참고했습니다.
- What are tokens and how to count them? — input, output, cached token 개념을 설명하는 공식 토큰 가이드입니다.