본문 바로가기

AI NEWS

Perplexity API Platform 출시: AI 검색 회사가 풀스택 개발자 플랫폼으로 전환한 이유

 

Perplexity API Platform 출시 — 검색 엔진이 개발자 플랫폼이 된 이유와 실무 체크리스트

Agent·Search·Embeddings·Sandbox 4개 API를 하나의 키로 통합한 전략과 도입 시 확인할 사항

Perplexity, AI 검색에서 풀스택 개발자 플랫폼으로 전환
 

Perplexity API Platform이란? AI 검색에서 풀스택 개발자 플랫폼으로

 

Perplexity API Platform은 Agent·Search·Embeddings·Sandbox 4개 API를 하나의 API 키로 제공하는 풀스택 AI 개발자 플랫폼입니다. 2026년 3월에 정식 출시됐습니다.

Perplexity를 AI 검색 엔진으로만 알고 있었다면, 이번 발표는 성격 자체가 다릅니다. 2026년 3월 13일, Perplexity는 Agent API, Search API, Embeddings API, Sandbox API 네 가지를 API 키 하나로 묶은 Perplexity API Platform을 정식 출시했습니다.

제가 보기에 이 발표의 핵심은 단순한 기능 추가가 아닙니다. '검색 서비스'에서 '개발자 인프라'로 사업의 축을 옮기겠다는 선언에 가깝습니다. 지금까지 LLM은 OpenAI, 검색은 SerpAPI, 임베딩은 Pinecone, 에이전트 오케스트레이션은 또 별도로 붙여야 했는데, 이 조합을 한 플랫폼에서 해결하겠다는 구조입니다.

4월에는 Product Hunt에 등록되면서 개발자 커뮤니티에 본격적으로 알려졌고, 5월에는 Sandbox API의 기술 상세까지 공식 블로그로 공개했습니다.

 
Perplexity API 콘솔을 연상시키는 다크 테마 대시보드가 표시된 개발자 모니터. API 호출 로그와 사용량 차트가 보이는 워크스테이션 클로즈업
 

8개월 만에 풀스택 전환? Perplexity API 출시 타임라인

 

2025년 9월 Search API를 시작으로, 8개월 만에 Embeddings·Agent·Sandbox까지 4개 API를 갖춘 개발자 플랫폼으로 확장했습니다.

8개월 사이에 API 4개를 순차적으로 쌓아올린 셈입니다.

시점 발표 내용
2025년 9월 Search API 최초 출시 — 200억+ URL 실시간 검색
2026년 2월 pplx-embed-v1 임베딩 모델 공개 (MIT 라이선스, HuggingFace)
2026년 3월 11일 Agent API 정식 출시 — 멀티스텝 워크플로우 오케스트레이션
2026년 3월 13일 Perplexity API Platform 통합 발표
2026년 4월 Product Hunt 론칭
2026년 5월 Sandbox API 기술 블로그 공개 (private beta)

한국 사용자 입장에서 눈여겨볼 부분은 임베딩 모델을 MIT 라이선스로 오픈소스 공개한 점입니다. pplx-embed는 HuggingFace에서 바로 다운로드할 수 있어, API를 쓰지 않더라도 자체 인프라에서 활용 가능합니다.

 

Agent·Search·Embeddings·Sandbox, 각각 무엇을 하나?

 

Agent API는 멀티스텝 에이전트 오케스트레이션, Search API는 200억 URL 실시간 웹 검색, Embeddings API는 벡터 임베딩 생성, Sandbox API는 격리된 코드 실행을 담당합니다.

이름만 보면 비슷해 보이지만, 각 API가 담당하는 레이어가 다릅니다.

API 역할 핵심 사양 상태
Agent API 멀티스텝 에이전트 오케스트레이션 POST /v1/agent, 4개 프리셋, 멀티모델 라우팅 정식
Search API 실시간 웹 검색 200억+ URL 인덱스, $5/1,000건 정식
Embeddings API 벡터 임베딩 생성 pplx-embed, INT8 양자화, 4배 스토리지 절감 정식
Sandbox API 격리 코드 실행 Python·JS·SQL, Kubernetes 포드 기반 private beta

Agent API는 용도에 따라 모델과 검색 깊이를 선택하는 프리셋 구조를 제공합니다.

프리셋 모델 스텝 수 용도
fast-search xAI Grok 1 빠른 단일 검색
pro-search GPT-5.1 3 중간 복잡도 리서치
deep-research GPT-5.2 10 심층 리서치
advanced-deep-research Claude Opus 4.6 10 최고 수준 분석

위 프리셋에 배정된 모델은 2026년 5월 기준이며, Perplexity가 내부적으로 라우팅하므로 시점에 따라 변경될 수 있습니다. 개발자는 프리셋만 지정하면 됩니다.

다만 Sandbox API는 아직 private beta입니다. 기술 블로그에서 Python·JavaScript·SQL 지원과 Kubernetes 포드 기반 격리 실행 구조를 공개했지만, 정식 출시 시점과 가격은 확정되지 않았습니다.

 
Agent, Search, Embeddings, Sandbox 네 개의 API 레이어가 단일 파이프라인으로 연결된 아키텍처 다이어그램. 다크 배경에 각 API 노드가 색상으로 구분된 와이드 모니터 화면
 

분산 AI 스택을 하나의 키로 통합하면 실무에서 뭐가 달라지나?

 

API 키 관리, 과금 모니터링, 장애 대응 포인트가 4-5개에서 1개로 줄어듭니다. 다만 Perplexity가 OpenAI를 대체하는 것은 아니며, 검색 특화 플랫폼과 범용 생성 모델은 보완 관계입니다.

기존에 RAG 파이프라인을 만들려면 대부분 이런 조합을 사용했습니다:

  • LLM: OpenAI API (GPT 계열)
  • 웹 검색: SerpAPI 또는 Google Custom Search Engine
  • 임베딩: OpenAI ada-002 + Pinecone 또는 Weaviate
  • 에이전트: LangChain 또는 자체 오케스트레이션 코드

Perplexity API Platform은 이 네 가지 역할을 API 키 하나로 커버합니다. 운영 측면에서 API 키 관리, 개별 과금 추적, 각 프로바이더의 장애 대응이 한 곳으로 단순화됩니다.

> 실제로 확인할 부분은 비용 구조입니다. Search API는 $5/1,000건 고정 가격이고, Agent API는 각 모델 프로바이더의 직접 가격에 웹 검색 호출 $0.005/건, URL 페치 $0.0005/건이 추가됩니다.

여기서 짚고 넘어갈 부분이 있는데, 이 플랫폼이 OpenAI를 '대체'하지는 않습니다. Perplexity는 검색 특화 플랫폼이고, fine-tuning이나 범용 텍스트 생성이 필요한 작업에서는 여전히 OpenAI나 Anthropic을 직접 사용하는 것이 맞습니다. 용도가 다른 도구이며, 관계는 경쟁보다 보완에 가깝습니다.

 
왼쪽에 OpenAI·SerpAPI·Pinecone 등 여러 프로바이더가 복잡하게 연결된 구조, 오른쪽에 Perplexity 하나로 정리된 단순한 구조를 나란히 비교하는 화이트보드 다이어그램
 

pplx-embed 임베딩 모델, 기존 대비 어떤 차이가 있나?

 

Qwen3 기반 양방향 인코더에 INT8 네이티브 양자화를 적용해 기존 대비 4배 스토리지를 절감하면서, MTEB 벤치마크에서 Google gemini-embedding-001을 넘는 성능을 기록했습니다.

Embeddings API의 핵심인 pplx-embed 모델은 설계 방식부터 일반적인 임베딩 모델과 다릅니다. 보통은 처음부터 양방향 인코더로 설계하지만, Perplexity는 Qwen3 causal LLM을 diffusion continued pretraining 방식으로 양방향 인코더로 전환했습니다.

0.6B와 4B 파라미터 두 가지 크기로 제공됩니다. 학습 과정에서 INT8 양자화를 네이티브로 적용해, 사후 양자화 방식보다 품질 손실 없이 스토리지를 4배 줄였습니다.

벤치마크 수치를 비교하면:

모델 MTEB Multilingual v2 (nDCG@10) 제공사
pplx-embed-v1-4B (INT8) 69.66% Perplexity
Qwen3-Embedding-4B 69.60% Alibaba
gemini-embedding-001 67.71% Google

문맥 기반 임베딩에서는 격차가 더 벌어집니다. pplx-embed-context-v1-4B가 ConTEB 벤치마크에서 81.96%를 기록해, voyage-context-3(79.45%)와 Anthropic Contextual(72.4%)를 모두 넘었습니다.

제가 보기에 실무적으로 더 의미 있는 부분은 INT8 양자화입니다. 같은 수준의 검색 품질을 훨씬 작은 스토리지로 운영할 수 있다는 뜻이고, 벡터 DB 운영 비용이 프로덕션에서 무시하기 어려운 비중을 차지하는 만큼 이 차이가 실무에서 체감됩니다.

MIT 라이선스로 HuggingFace에 공개돼 있어 Perplexity API 없이 자체 서버에서 구동할 수도 있습니다. 약 250억 토큰, 30개 언어로 학습됐기 때문에 한국어에도 활용 가능하지만, 한국어 특화 벤치마크 결과는 아직 공개되지 않았습니다. 실제 한국어 검색 품질은 직접 테스트가 필요합니다.

 

Perplexity API를 처음 사용하려면 어떻게 시작하나?

 

console.perplexity.ai에서 API 키를 발급받고, 기존 OpenAI API 코드에서 base URL과 모델명만 변경하면 바로 사용할 수 있습니다.

Perplexity API Platform은 OpenAI 호환 형식을 따릅니다. 기존에 OpenAI SDK를 쓰던 프로젝트라면 전환이 비교적 간단합니다.

1. console.perplexity.ai에서 계정 생성 및 API 키 발급
2. 기존 코드에서 base URL을 `https://api.perplexity.ai`로 변경
3. 모델명을 Perplexity 지원 모델로 교체
4. Agent API를 쓰려면 POST `/v1/agent` 엔드포인트에 프리셋 지정

Pro 구독과 API 사용은 별개입니다. Pro 구독 없이도 API 키를 발급받을 수 있고, 사용량 기반 과금입니다.

실무 도입 팁을 하나 드리면, 처음에는 fast-search 프리셋으로 API 연결과 응답 구조를 확인한 뒤, 복잡도에 따라 pro-search나 deep-research로 단계를 높이는 방식이 안전합니다.

 
 
 

도입 전 반드시 확인해야 할 비용 구조와 리스크는?

 

검색 결과 원문이 입력 토큰에 포함되는 숨은 비용 구조, Sandbox API의 private beta 상태, 벤더 록인 가능성 세 가지를 미리 확인해야 합니다.

첫째, 검색 결과 원문이 입력 토큰에 포함됩니다. 공식 pricing 페이지에 명시돼 있지만, 비용 견적을 낼 때 빠뜨리기 쉬운 부분입니다. 짧은 질문을 보내더라도 Perplexity가 웹에서 가져온 기사 본문이 컨텍스트에 추가되면서 입력 토큰이 급증합니다. 응답의 토큰 사용량을 반드시 모니터링해야 합니다.

둘째, Sandbox API는 아직 private beta입니다. 각 세션이 독립 Kubernetes 포드에서 격리 실행되는 구조와 Python·JavaScript·SQL 지원은 공개됐지만, 정식 출시 일정과 과금 체계는 확정되지 않았습니다. 프로덕션 파이프라인에 Sandbox를 포함하기에는 아직 이릅니다.

셋째, 통합 플랫폼의 벤더 록인 가능성입니다. 4개 API를 한 곳에서 쓰면 편리하지만, 특정 API의 가격이나 성능이 기대에 못 미칠 때 부분 전환이 어려워집니다. OpenAI 호환 형식 덕분에 기본적인 전환 비용은 낮지만, Agent API 프리셋이나 pplx-embed에 깊이 의존하면 마이그레이션 복잡도가 올라갑니다.

 

자주 묻는 질문

 

Q. Perplexity API를 쓰려면 Pro 구독이 필요한가?
A. 필요하지 않습니다. API와 Pro 구독은 별개 상품입니다. console.perplexity.ai에서 Pro 구독 없이도 API 키를 발급받을 수 있고, 사용한 만큼만 과금됩니다.

Q. 기존 OpenAI API 코드를 Perplexity로 전환하려면 어디를 수정해야 하나?
A. base URL을 https://api.perplexity.ai로 변경하고, 모델명을 Perplexity 지원 모델로 교체하면 됩니다. OpenAI 호환 형식을 사용하므로 SDK 수준의 코드 변경은 최소화됩니다.

Q. Agent API 프리셋 4개 중 처음 테스트할 때 어떤 것이 적합한가?
A. fast-search 프리셋이 적합합니다. xAI Grok 모델로 1스텝 검색을 수행하며 빠르게 결과를 반환하므로 API 연결과 응답 구조를 확인하기 좋습니다. 이후 pro-search, deep-research로 단계를 높이면 됩니다.

Q. Sandbox API는 지금 프로덕션에서 사용할 수 있나?
A. 아직 사용할 수 없습니다. 2026년 5월 현재 private beta 단계이며, 정식 출시 시점과 과금 체계는 확정되지 않았습니다. 프로덕션 파이프라인에 포함하기보다는 정식 출시 공지를 기다리는 것이 안전합니다.

참조 링크

 
Perplexity, AI 검색에서 풀스택 개발자 플랫폼으로 전환 이 글은 실제 사례를 바탕으로 작성되었습니다