본문 바로가기

AI NEWS

DeepSeek V4-Pro 75% price cut와 영구 가격 인하: 한국 개발자의 AI API 비용 체크

 

DeepSeek V4-Pro 75% 영구 가격 인하: AI 모델 가격 전쟁이 한국 개발자에게 미치는 영향

장문맥, 코딩 에이전트, 문서 분석 서비스의 토큰 예산을 다시 계산해야 하는 이유

 

DeepSeek V4-Pro 75% 가격 인하가 남기는 질문

 

DeepSeek는 V4-Pro API의 75% 할인 가격을 프로모션 이후에도 유지해 기존 가격의 1/4 수준으로 조정한다고 안내했습니다. 한국 개발자에게는 장문맥 AI와 에이전트형 서비스의 토큰 예산을 다시 계산하게 만드는 AI 뉴스입니다.

AI 기능을 제품에 붙여 본 팀이라면 모델 성능보다 먼저 막히는 지점이 있습니다. 바로 월말 API 비용입니다. 특히 문서 전체를 넣고 묻는 장문맥 QA, 코딩 에이전트, 고객지원 지식 검색처럼 입력과 출력이 길어지는 서비스는 토큰 단가가 곧 제품 원가가 됩니다.

Reuters는 2026년 5월 23일 DeepSeek가 V4-Pro의 75% 가격 인하를 영구화한다고 보도했습니다. DeepSeek 공식 가격 문서도 2026년 5월 31일 15:59 UTC 프로모션 종료 뒤 V4-Pro API 가격이 기존의 1/4로 조정된다고 설명합니다. 그래서 이번 DeepSeek V4-Pro 75% price cut은 단순 할인 소식보다, 장문맥·에이전트 제품의 원가표를 다시 열어 보게 만드는 뉴스에 가깝습니다.

제가 먼저 확인할 부분은 네 가지입니다. 공식 가격이 실제로 얼마인지, 캐시 히트와 출력 토큰이 내 서비스에서 얼마나 나오는지, 낮은 단가가 벤더 협상에서 어떤 기준선이 되는지, 그리고 보안·계약 조건 때문에 애초에 쓰면 안 되는 경우가 있는지입니다. '싸니까 바로 바꾸자'보다 이 순서가 더 현실적입니다.

 
어두운 서버 랙 앞의 API 비용 대시보드에 입력 토큰, 출력 토큰, 캐시 히트 비용 막대가 나뉘어 보이는 편집 이미지
 

날짜로 보면 헷갈리지 않는 흐름

 

2026년 4월 V4 Preview 공개, 캐시 가격 조정, 5월 Reuters 보도, 프로모션 종료 후 가격 조정 안내가 순서대로 이어졌습니다.

2026년 4월 24일, DeepSeek는 V4 Preview를 공개하면서 API에서 V4-Pro와 V4-Flash를 지원한다고 알렸습니다. 같은 시점의 변경 로그에는 두 모델이 OpenAI ChatCompletions 인터페이스와 Anthropic 인터페이스 양쪽에서 제공된다고 적혀 있습니다.

2026년 4월 26일에는 전체 모델의 입력 캐시 히트 가격 조정이 공식 가격 문서에 반영됐습니다. 이어 2026년 5월 23일 Reuters 보도가 나오면서 V4-Pro 75% 가격 인하가 시장 뉴스로 확산됐습니다.

실제로 확인할 날짜는 2026년 5월 31일 15:59 UTC입니다. 공식 문서는 이 프로모션 종료 이후에도 V4-Pro 가격이 원래 가격의 1/4로 조정된다고 안내합니다. 다만 DeepSeek는 가격 변동 가능성도 고지합니다. 여기서 말하는 '영구'는 현재 공지된 가격 정책이지, 앞으로 절대 바뀌지 않는다는 보증은 아닙니다.

 

V4-Pro 공식 API 가격: 입력, 출력, 캐시 히트 기준

 

DeepSeek 공식 가격표 기준 V4-Pro는 100만 토큰당 캐시 히트 입력 $0.003625, 캐시 미스 입력 $0.435, 출력 $0.87로 표시됩니다. 이 숫자는 원래 가격 $0.0145, $1.74, $3.48 대비 75% 낮은 수준입니다.

가격표에서 가장 조심할 부분은 입력 가격을 하나로 뭉뚱그리지 않는 일입니다. DeepSeek API 가격은 캐시 히트 입력, 캐시 미스 입력, 출력 토큰이 따로 계산됩니다.

구분 V4-Pro 현재 가격 원래 가격 해석
캐시 히트 입력 $0.003625 / 100만 토큰 $0.0145 반복 prefix가 재사용될 때 의미가 큼
캐시 미스 입력 $0.435 / 100만 토큰 $1.74 새로 처리되는 입력의 기준 단가
출력 $0.87 / 100만 토큰 $3.48 코딩 에이전트와 긴 답변 서비스에서 중요

DeepSeek V4-Pro 가격 인하를 평균 단가처럼 말하면 실제 예산이 어긋납니다. 문서 QA처럼 동일한 시스템 프롬프트, 도구 설명, 지식 base prefix가 반복되는 구조라면 캐시 히트 가격이 의미를 가집니다. 반대로 매번 다른 짧은 요청을 보내는 서비스라면 캐시 히트 가격을 기대 비용으로 잡기 어렵습니다.

한국 사용자 입장에서는 원화 환산보다 토큰 구성이 먼저입니다. 환율, 카드 수수료, 세금, 결제 조건은 팀마다 달라지지만, 캐시 미스 입력과 출력 비중은 제품 설계 단계에서 바로 측정할 수 있습니다.

 
캐시 히트 입력, 캐시 미스 입력, 출력 토큰 비용을 세 막대로 비교하는 깔끔한 API 비용 대시보드 이미지
 

가격 전쟁으로 읽히는 이유와 선을 그을 부분

 

Reuters는 이번 조치가 중국 AI 업체와 미국 빅테크 간 가격 경쟁 압박을 키울 수 있다고 보도했습니다. 다만 V4-Pro가 경쟁 모델보다 성능이 높다거나 가격 인하 원인이 특정 칩 공급 때문이라고 단정할 근거는 아직 부족합니다.

이번 DeepSeek V4-Pro 75% price cut이 크게 보도된 이유는 가격표 하나가 아니라 방향 때문입니다. 프런티어급 모델과 장문맥 모델은 그동안 높은 출력 비용 때문에 에이전트형 제품의 실험 횟수를 제한했습니다. 한 공급자가 가격을 크게 낮추면, 다른 공급자와의 협상에서도 '우리 워크로드 기준 단가'를 다시 묻기 쉬워집니다.

Reuters는 이 가격 인하가 중국 AI 기업과 미국 빅테크 사이의 가격 경쟁 압박을 키울 수 있다고 봤습니다. 이 문장은 시장 맥락으로는 중요하지만, 제품 선택의 결론은 아닙니다. 실제 서비스에서는 모델 품질, 도구 호출 안정성, latency, 데이터 처리 조건, 지역별 가용성까지 같이 봐야 합니다.

다만 여기서 선을 그어야 합니다. Huawei Ascend 칩 공급 같은 이야기는 시장 해석으로 언급될 수 있지만, DeepSeek가 가격 인하의 직접 원인으로 공식 확인한 것은 아닙니다. 성능 비교도 마찬가지입니다. 벤치마크 표 하나가 아니라 내 데이터와 내 프롬프트에서의 PoC 결과가 필요합니다.

 

한국 팀의 비용표에서 바뀌는 칸

 

출력 토큰이 많은 코딩 에이전트, 문서 분석, 장문맥 QA에서는 월간 비용 바닥선이 낮아졌습니다. 이 가격은 모델 교체 결정뿐 아니라 벤더 협상표의 비교 기준으로도 쓸 수 있습니다.

여기서 볼 부분은 세 가지입니다. 첫째, 우리 서비스의 출력 토큰 비중입니다. 코딩 에이전트나 리포트 생성 기능은 입력보다 출력 비용이 더 크게 느껴질 때가 많습니다. V4-Pro 출력 가격이 100만 토큰당 $0.87로 내려간 점은 이런 워크로드에서 먼저 계산해 볼 가치가 있습니다.

둘째, 반복 prefix 비율입니다. 고객지원 지식 검색, 사내 문서 QA, 코드베이스 분석처럼 공통 지침과 긴 문맥이 반복되는 서비스는 캐시 히트율이 높아질 여지가 있습니다. 반대로 랜덤한 단발 질문이 대부분인 챗봇이라면 캐시 히트 가격만 보고 예산을 낮게 잡으면 안 됩니다.

셋째, 협상 언어입니다. 한국 스타트업이 모델 공급자와 이야기할 때 '월 1억 토큰'처럼 총량만 말하는 것보다 캐시 미스 입력, 출력, p95 latency, 429 비율, 데이터 처리 조건을 나눠 비교해야 합니다. DeepSeek V4-Pro 가격 인하는 이 표의 한 줄을 낮추지만, 전체 표를 대신하지는 않습니다.

> 제 판단으로는 이 뉴스의 실무 가치는 모델 교체보다 비용 실험의 기준선을 다시 세우는 데 있습니다.

 
 
 

도입 시뮬레이션: 첫 테스트부터 운영 모델까지

 

첫 테스트는 DEEPSEEK_API_KEY 발급 후 OpenAI 호환 base_url에서 model을 deepseek-v4-pro로 지정해 시작합니다. 운영 판단은 가격표가 아니라 품질, 평균 출력 토큰, 캐시 히트율, p95 latency, 오류율, 429 발생률을 함께 본 뒤 내려야 합니다.

가장 작은 실험은 기존 OpenAI SDK 기반 테스트 코드에서 base_url을 https://api.deepseek.com 으로 바꾸고 model을 deepseek-v4-pro로 지정하는 방식입니다. DeepSeek 문서는 OpenAI 호환 엔드포인트와 Anthropic 호환 엔드포인트를 모두 안내합니다.

PoC는 작게 잡아도 됩니다. 같은 프롬프트 3종을 후보 모델별로 실행하고, 결과 품질을 사람이 채점한 뒤 다음 숫자를 같이 기록하면 충분합니다.

  • 평균 입력 토큰, 출력 토큰, 캐시 히트 토큰, 캐시 미스 토큰
  • p50/p95 latency, 오류율, HTTP 429 발생률
  • 같은 작업을 하루 예상 호출량으로 확장한 비용
  • 민감 데이터 포함 여부와 고객 계약상 외부 API 제한

DeepSeek 공식 rate limit 문서는 V4-Pro 계정별 동시성 한도를 500으로 안내합니다. 트래픽이 몰리는 제품이라면 큐잉, 재시도, 지수 백오프를 넣고 429를 정상적인 운영 이벤트로 다뤄야 합니다. 장시간 요청에서는 non-streaming 빈 줄이나 streaming keep-alive 처리도 HTTP 클라이언트에서 확인해야 합니다.

이 방식이면 DeepSeek V4-Pro 가격 인하가 내 서비스에 실제로 의미 있는지 하루 안에 대략적인 답을 얻습니다. 반대로 PoC에서 출력 품질이나 latency가 흔들리면 낮은 단가만으로 프로덕션 이전을 밀어붙일 이유가 없습니다.

 

어떤 도구와 함께 실험하고, 언제 멈춰야 하나

 

DeepSeek API는 OpenAI SDK, Anthropic SDK, Claude Code 같은 도구와 연결해 비용 PoC를 해볼 수 있습니다. 민감 데이터, 강한 SLA, 고객 계약상 중국 기반 API 제한, 캐시 히트가 거의 없는 짧은 요청에는 바로 바꾸지 않는 편이 안전합니다.

DeepSeek V4 Preview 발표와 API 문서를 보면 개발자가 기존 코드를 크게 바꾸지 않고 실험할 길이 있습니다. OpenAI SDK 기반 코드는 base_url과 model을 바꿔 테스트할 수 있고, Anthropic 호환 경로는 Claude 생태계 도구의 대체 backend 실험에 맞습니다. DeepSeek 문서는 Claude Code 연동 방법도 따로 제공합니다.

먼저 실험해 볼 만한 분야는 장문맥 문서 요약, 코딩 에이전트, 고객지원 지식 검색, 사내 지식 base 반복 질의, 비용 민감한 스타트업 MVP입니다. 토큰 사용량이 크고 반복 prefix가 생길 가능성이 있어 DeepSeek API 가격 구조를 검증할 이유가 있습니다.

반대로 법률, 의료, 금융 판단 자동화처럼 결과 책임이 큰 영역은 별도 검증 없이 옮기면 안 됩니다. 데이터 이전 제한이 있거나 고객 계약에서 중국 기반 API 사용을 제한한다면 가격표와 무관하게 제외해야 합니다. 이미 특정 provider의 tool calling, 파일 처리, web search, MCP 메시지 variant에 깊게 묶인 제품도 호환 subset만으로 기능이 깨질 수 있습니다.

 
 
 

자주 묻는 질문

 

Q. DeepSeek V4-Pro 75% 가격 인하는 일시 할인인가요?
A. 공식 가격 문서 기준으로는 2026년 5월 31일 15:59 UTC 프로모션 종료 후에도 V4-Pro API 가격이 기존의 1/4로 조정된다고 안내되어 있습니다. 다만 DeepSeek가 가격 변동 가능성을 고지하므로 미래 가격이 절대 바뀌지 않는다는 뜻은 아닙니다.

Q. DeepSeek V4-Pro API의 공식 입력/출력 가격은 얼마인가요?
A. DeepSeek 공식 가격표 기준 V4-Pro는 100만 토큰당 캐시 히트 입력 $0.003625, 캐시 미스 입력 $0.435, 출력 $0.87입니다. 비용 계산에서는 캐시 히트와 캐시 미스를 반드시 나눠 봐야 합니다.

Q. DeepSeek V4-Pro는 GPT나 Claude보다 무조건 저렴한가요?
A. 단가만 놓고 보면 낮게 보이는 구간이 있습니다. 그래도 같은 입력/출력 토큰, 캐시 히트율, 품질 기준, latency, 실패율을 함께 비교해야 합니다. DeepSeek V4-Pro 75% price cut을 성능 우위 주장으로 연결하면 근거가 부족합니다.

Q. AI 에이전트 개발 비용은 이번 가격 인하로 얼마나 달라질 수 있나요?
A. 출력 토큰이 많고 같은 system prompt나 도구 설명이 반복되는 코딩 에이전트라면 먼저 비교할 만합니다. 실제 차이는 usage.prompt_cache_hit_tokens, usage.prompt_cache_miss_tokens, 평균 출력 토큰을 로깅한 뒤 계산해야 합니다.

Q. 한국 스타트업은 이 가격을 벤더 협상에 어떻게 활용하면 좋나요?
A. 총 토큰량 하나만 제시하지 말고 캐시 미스 입력, 출력 토큰, p95 latency, 429 발생률, 데이터 처리 조건을 나눠 비교표를 만들면 좋습니다. DeepSeek V4-Pro 가격 인하는 그 표에서 비용 기준선을 낮추는 참고점으로 쓸 수 있습니다.

Q. DeepSeek V4-Pro를 바로 프로덕션에 써도 되나요?
A. 바로 이전하기보다 같은 작업 3종으로 품질, latency, 오류율, 429, 캐시 히트율, 데이터 거버넌스 조건을 확인하는 PoC를 먼저 권합니다. 민감 데이터나 산업별 규제가 있는 서비스는 가격과 별개로 보안·계약 검토가 필요합니다.

함께 읽으면 좋은 글

 

참조 링크