Microsoft MAI 모델군 공개: Foundry에서 reasoning·이미지·음성 모델을 어떻게 쓰나
Build 2026 공식 발표 기준으로 본 MAI 모델, Foundry Toolkit, Toolboxes, Voice Live 체크포인트
Microsoft MAI 모델 Foundry 프리뷰, 무엇이 달라졌나
Microsoft는 2026년 6월 2일 Build 2026에서 MAI 모델군과 Foundry 업데이트를 공개했습니다. Microsoft MAI 모델 Foundry 프리뷰에서 볼 부분은 Azure 기반 AI 앱 개발자가 reasoning, 이미지, 전사, 음성 모델을 Foundry 안에서 비교하고 배포 흐름까지 점검할 여지가 커졌다는 점입니다.
한국 시간 2026년 6월 3일 기준으로는 단순한 발표 요약보다 '내 Azure 개발 환경에서 무엇을 확인해야 하나'가 더 중요합니다. Microsoft는 Build 2026 공식 발표에서 Microsoft AI Superintelligence Team의 신규 in-house MAI 모델을 소개했고, Foundry 블로그는 MAI 모델, VS Code Toolkit, Toolboxes, Voice Live, Memory를 개발자 기능 묶음으로 정리했습니다.
먼저 볼 질문은 세 가지입니다. MAI-Thinking-1을 Foundry에서 지금 호출할 권한이 있는지, 이미지·음성 모델은 어떤 업무에 맞는지, preview 기능을 내부 PoC와 운영 시스템 사이에서 어디까지 다룰지입니다.
제가 보기에는 이번 발표를 'Microsoft가 외부 모델을 모두 대체한다'로 읽으면 과합니다. 더 정확한 해석은 Foundry 안에서 Microsoft first-party 모델과 에이전트 운영 도구를 함께 비교할 선택지가 늘었다에 가깝습니다.
> 지금 필요한 일은 모델 우열 판정이 아니라, 같은 입력 세트로 MAI 모델과 기존 Foundry 모델을 비교할 준비입니다.
2026년 3월부터 6월까지 이어진 MAI 발표
MAI 흐름은 3월 이미지 모델, 4월 Foundry preview, 5월 MAI-Image-2.5, 6월 Build 2026의 모델군 확장으로 이어졌습니다. 날짜를 붙이면 이번 발표는 하루짜리 뉴스가 아니라 자체 모델 라인업을 Foundry에 연결하는 단계적 움직임으로 보입니다.
2026년 3월 19일에는 Microsoft AI가 MAI-Image-2를 공개했습니다. 4월 2일에는 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2의 Foundry public preview가 TechCommunity에 올라왔습니다. 이어 5월 26일에는 MAI-Image-2.5가 Arena text-to-image 리더보드 3위 모델로 발표됐고, Foundry와 MAI Playground 제공 계획도 언급됐습니다.
6월 2일 Build 2026에서는 범위가 더 넓어졌습니다. Microsoft AI는 MAI-Thinking-1을 reasoning 모델로 따로 소개했고, Foundry 블로그는 MAI-Thinking-1, MAI-Image-2.5, MAI-Transcribe-2, MAI-Voice-2를 Build에서 공개된 first-party 모델 흐름으로 정리했습니다.
| 날짜 | 확인된 발표 | 독자가 볼 포인트 |
|---|---|---|
| 2026-03-19 | MAI-Image-2 | Microsoft 자체 이미지 모델 계열의 시작점 |
| 2026-04-02 | Transcribe·Voice·Image Foundry preview | Foundry 안에서 MAI 모델 실험 경로가 열리기 시작 |
| 2026-05-26 | MAI-Image-2.5 | 이미지 생성·편집 성능과 제품 적용 사례 확인 |
| 2026-06-02 | Build 2026 MAI·Foundry 업데이트 | reasoning, 이미지, 전사, 음성, 에이전트 운영 기능이 함께 부각 |
이 타임라인은 검색 결과에서 놓치기 쉬운 '왜 지금인가'를 설명해 줍니다. 6월 발표만 보면 제품 홍보처럼 보일 수 있지만, 3월부터 6월까지의 흐름을 보면 Microsoft가 자체 모델을 Foundry 개발자 플랫폼에 점진적으로 넣고 있다는 해석이 더 자연스럽습니다.
MAI-Thinking-1은 어떤 reasoning 모델인가
MAI-Thinking-1은 Microsoft AI가 reasoning과 coding 목적의 첫 reasoning 모델로 소개한 모델입니다. 다만 Microsoft AI 발표는 Foundry private preview를 말하고, Foundry Build 정리는 public preview 모델 목록에 포함하므로 접근 상태는 제한적일 가능성을 남겨야 합니다.
Microsoft AI 발표 기준 MAI-Thinking-1은 35B active, 약 1T total parameters의 sparse Mixture of Experts 모델입니다. 256K context window와 Chat Completions API 호환성도 함께 언급됐습니다. 장문 문서와 코드베이스를 다루는 agent나 assistant 실험에서는 이 스펙이 먼저 눈에 들어옵니다.
다만 availability 표현은 조심해야 합니다. 모델 발표문은 Foundry private preview를 말하고, Foundry Build Edition은 Build에서 public preview로 들어온 first-party 모델 목록에 MAI-Thinking-1을 함께 적었습니다. 이 차이를 '모든 Azure 고객이 즉시 사용 가능'으로 바꾸면 사실 범위를 넘습니다.
Microsoft MAI 모델 Foundry 프리뷰를 테스트하려는 팀은 먼저 Foundry 모델 카탈로그에서 실제 배포 가능 여부를 봐야 합니다. 접근 권한이 없다면 같은 prompt와 eval set을 기존 모델로 먼저 준비해 두고, MAI-Thinking-1 접근이 열렸을 때 같은 조건으로 다시 비교하는 방식이 낫습니다.
이미지·전사·음성 MAI 모델은 어디에 맞나
MAI-Image-2.5는 이미지 생성과 편집, MAI-Voice-2는 다국어 음성 생성과 voice matching, MAI-Transcribe 계열은 음성 전사 워크플로에 맞춰 소개됐습니다. 버전명, 언어 지원, 가격 단위는 출처별 확인 범위를 유지해야 합니다.
MAI-Image-2.5는 PowerPoint에 적용됐고 OneDrive로 확대 중이며, Foundry와 MAI Playground에서도 개발자가 시험할 수 있다고 Microsoft AI가 설명했습니다. 이미지 생성뿐 아니라 이미지 편집 모델로도 소개됐기 때문에 발표 자료, 마케팅 시안, 제품 이미지 변형 같은 업무에서 먼저 관심을 받을 만합니다.
음성 쪽은 더 조심스럽게 읽어야 합니다. MAI-Voice-2 모델 페이지는 15개 언어, multilingual voice cloning, 짧은 reference clip 기반 voice matching, 1M characters당 0.22달러 가격 단위를 제시합니다. MAI-Transcribe-1.5 모델 페이지는 43개 언어, domain-specific terminology 적응, 시간당 0.36달러 가격 단위를 보여줍니다.
여기서 볼 부분은 표기입니다. Foundry Build Edition에는 MAI-Transcribe-2가 등장하고, Microsoft AI 모델 페이지와 조사된 모델 페이지에는 MAI-Transcribe-1.5가 확인됩니다. 두 이름을 같은 모델이라고 합쳐 쓰기보다, 'Foundry 블로그는 MAI-Transcribe-2, 모델 페이지는 MAI-Transcribe-1.5를 확인할 수 있다'고 분리하는 편이 정확합니다.
한국 사용자 입장에서는 한국어 품질, 한국 리전, 실제 Azure 과금, 기업 계약 조건을 따로 확인해야 합니다. 언어 수가 많다는 발표가 곧 한국어 업무 품질이나 국내 데이터 residency 보장을 뜻하지는 않습니다.
Foundry에서 처음 확인할 순서: 설치, 첫 테스트, 운영 모델
첫 테스트는 Azure 계정과 Foundry 프로젝트 권한 확인에서 시작합니다. 그다음 VS Code Foundry Toolkit, 모델 카탈로그, Playground 호출, trace 확인, Agent Service 배포 가능성을 차례로 봐야 Microsoft MAI 모델 Foundry 프리뷰를 무리 없는 PoC로 다룰 수 있습니다.
공식 문서 기준으로 개발자는 VS Code에서 Microsoft Foundry Toolkit 확장을 설치하고 Azure 계정으로 로그인한 뒤 Foundry 프로젝트를 엽니다. 문서는 Model Catalog, Model Playground, Agent Playgrounds, Deploy Hosted Agents 같은 작업 경로를 VS Code 안에서 다룬다고 안내합니다.
실제로 확인할 부분은 설치 자체보다 작은 검증 루프입니다.
1. Azure 계정, active subscription, Foundry 프로젝트 접근 권한을 확인합니다.
2. VS Code에 Microsoft Foundry Toolkit for Visual Studio Code를 설치하고 Azure sign in을 마칩니다.
3. Foundry Model Catalog에서 Hosted by, Publisher, Feature, Model type 필터로 MAI 모델 노출 여부를 봅니다.
4. Playground에서 같은 prompt를 기존 모델과 MAI 후보 모델에 넣고 latency, 실패 응답, 출력 품질을 기록합니다.
5. Agent 실험이라면 trace visualization, Toolboxes 연결, Foundry Agent Service 배포 가능성을 분리해 점검합니다.
운영 모델은 네 단계로 나누는 편이 낫습니다. preview 실험에서는 호출 가능 여부와 비용 단위를 기록하고, 내부 PoC에서는 같은 eval set으로 기존 모델과 비교합니다. 제한 배포에서는 quota, logging, fallback 모델을 준비하고, GA 이후에야 SLA와 장기 호환성을 기준으로 확대 여부를 판단합니다.
Azure 개발자에게 중요한 이유: 대체보다 선택지 확장
이번 업데이트는 OpenAI, Anthropic, Google 모델을 전부 밀어내는 발표라기보다 Foundry 안의 first-party 모델 선택지가 늘어난 사건으로 보는 편이 정확합니다. Azure, Microsoft 365, Copilot, 내부 보안 정책을 이미 쓰는 조직일수록 모델 비교와 배포 전략에 영향이 큽니다.
Build 2026 발표는 MAI 모델만 따로 떼어 말하지 않습니다. Foundry, GitHub, Windows, Azure, Copilot 흐름과 함께 개발자가 업무 안에서 AI 앱과 에이전트를 만들도록 하는 큰 그림 안에 배치합니다. 그래서 모델 성능만의 뉴스로 보면 절반만 읽게 됩니다. 개발 도구, 배포, 도구 연결, 메모리, 음성 인터페이스가 같이 움직입니다.
Foundry 블로그가 강조한 Toolboxes는 에이전트가 여러 도구와 MCP 클라이언트를 managed endpoint로 연결하고 인증, lifecycle, governance를 Foundry가 다루는 방향입니다. Voice Live는 prompt agents가 GA이고 hosted agents with Voice Live는 public preview입니다. Memory public preview는 반복 작업에서 procedural, user, session memory를 나누어 다루는 흐름으로 읽힙니다.
한국 개발자에게 남는 질문은 'MAI가 최고인가'보다 '우리 Azure 환경에서 모델, 도구, 권한, 로그, 비용을 같은 관리면에서 비교할 수 있는가'입니다. 내부 규정 때문에 클라우드와 권한 경계를 중시하는 팀이라면 이 질문이 더 실무적입니다.
도입 전에 확인할 제한: preview, 리전, 비용, 권리 문제
Microsoft MAI 모델 Foundry 프리뷰를 GA 서비스처럼 쓰면 안 됩니다. 가격, 한국 리전, quota, SLA, 장기 호환성, 음성 복제 동의, 이미지 생성물 검수는 실제 도입 전에 따로 확인해야 합니다.
아직 확인되지 않은 부분은 빈칸으로 남겨 두는 편이 좋습니다. MAI-Thinking-1 접근 상태는 출처별 표현 차이가 있고, public preview 기능은 GA 수준의 안정성이나 지원 범위를 보장하지 않습니다. 실제 Azure 청구 금액과 한국 리전 제공 여부도 이 조사 범위에서는 확정되지 않았습니다.
음성 모델은 특히 권리 문제가 앞섭니다. MAI-Voice-2가 reference clip 기반 voice matching을 제공한다고 해서 아무 음성이나 넣어도 된다는 뜻은 아닙니다. 동의, 권리 증빙, 내부 정책, 저장 기간을 확인해야 합니다.
이미지 생성과 편집도 마찬가지입니다. 발표 자료 시안처럼 위험이 낮은 내부 작업은 좋은 첫 테스트가 될 수 있지만, 뉴스 이미지, 의료·금융·법률 판단, 신원 확인처럼 사실성과 책임이 큰 영역에는 사람이 검수하는 절차를 붙여야 합니다.
제가 보기에는 이번 업데이트의 안전한 적용선은 '운영 시스템 교체'가 아니라 '같은 테스트 세트로 비교 가능한 내부 실험'입니다. 품질, 비용, 지연 시간, 실패 모드가 기존 모델보다 낫다는 내부 근거가 쌓일 때 다음 단계로 넘어가는 편이 현실적입니다.
누가 먼저 써보고, 누가 기다려야 하나
Azure와 Foundry를 이미 쓰고 있고 내부 PoC를 만들 수 있는 개발팀은 먼저 확인할 가치가 있습니다. 반대로 한국 리전, SLA, 고정 단가, voice cloning 권리 검토가 선결 조건인 팀은 Microsoft MAI 모델 Foundry 프리뷰를 바로 운영에 넣기보다 공식 문서와 계약 조건을 더 기다리는 편이 낫습니다.
먼저 써볼 만한 쪽은 명확합니다. Azure 기반 enterprise agent prototype을 만들고 있거나, VS Code에서 Foundry Toolkit으로 모델 카탈로그와 배포 흐름을 비교하려는 팀입니다. 장문 문서와 코드베이스를 함께 다루는 reasoning assistant, PowerPoint·OneDrive 중심 이미지 워크플로, 회의록·콜센터 전사, 다국어 음성 에이전트 실험도 후보입니다.
기다려야 하는 경우도 분명합니다. production SLA가 필요하거나, 국내 데이터 residency가 계약상 확정돼야 하거나, 음성 샘플 권리 증빙을 아직 만들지 못한 팀은 서두를 이유가 적습니다. 독립 벤치마크가 필요한 의사결정에서 Microsoft 발표 수치만으로 모델 선택을 확정하는 것도 위험합니다.
개인 블로그 독자에게 권하고 싶은 체크는 작습니다. Foundry 모델 카탈로그에서 실제로 보이는 모델을 확인하고, 기존 모델과 같은 prompt 10개를 비교하며, 실패 사례를 기록해 두는 것입니다. 이 작은 로그가 있으면 다음 발표가 나왔을 때 '좋아 보인다'가 아니라 '우리 워크플로에서 달라졌다'고 판단할 근거가 생깁니다.
자주 묻는 질문
Q. MAI-Thinking-1은 어떤 reasoning 모델인가?
A. Microsoft AI가 reasoning과 coding 목적의 첫 reasoning 모델로 소개한 모델입니다. 발표 기준 35B active, 약 1T total parameters MoE 구조, 256K context window, Chat Completions API 호환성이 언급됐지만, 접근 상태는 preview 또는 제한적 접근 가능성으로 봐야 합니다.
Q. Microsoft Foundry에서 MAI 모델을 지금 바로 쓸 수 있나?
A. 모델별로 다릅니다. Foundry Build Edition은 MAI 모델 public preview 흐름을 설명하지만, MAI-Thinking-1 모델 발표는 Foundry private preview를 말합니다. 먼저 Foundry 모델 카탈로그에서 본인 계정과 리전에 실제 배포 가능한지 확인해야 합니다.
Q. MAI-Image-2.5와 MAI-Voice-2는 각각 어디에 맞나?
A. MAI-Image-2.5는 이미지 생성과 편집, PowerPoint·OneDrive·Foundry 실험 흐름에 맞습니다. MAI-Voice-2는 다국어 음성 생성과 reference clip 기반 voice matching에 맞지만, 동의와 권리 검토가 먼저입니다.
Q. MAI-Transcribe-1.5와 MAI-Transcribe-2 표기는 어떻게 봐야 하나?
A. Foundry Build Edition은 MAI-Transcribe-2를 언급하고, Microsoft AI 모델 페이지에서는 MAI-Transcribe-1.5 정보를 확인할 수 있습니다. 같은 모델이라고 단정하지 말고 출처별 표기로 분리해 읽는 편이 안전합니다.
Q. Azure 기반 AI 앱 개발자는 무엇부터 테스트해야 하나?
A. VS Code Foundry Toolkit 설치, Azure sign in, Foundry 프로젝트 접근, 모델 카탈로그 확인, Playground에서 같은 prompt 비교, trace와 Toolboxes 연결 확인 순서가 좋습니다. Microsoft MAI 모델 Foundry 프리뷰는 작은 내부 PoC로 먼저 검증하는 편이 맞습니다.
Q. 아직 도입을 미루는 편이 나은 경우는 언제인가?
A. GA SLA, 한국 리전, 데이터 residency, 고정 청구 조건, 음성 권리 증빙, 독립 벤치마크가 의사결정의 필수 조건이면 기다리는 편이 낫습니다. preview 기능을 곧바로 고객-facing production에 넣는 것은 리스크가 큽니다.
함께 읽으면 좋은 글
참조 링크
- Microsoft Build 2026: Be yourself at work — Build 2026 전체 발표와 MAI 모델군, Foundry, GitHub, Windows, Azure 업데이트의 공식 출처
- What's new in Microsoft Foundry | Build Edition — Foundry에서 MAI 모델, Toolkit, Toolboxes, Voice Live, Memory의 preview 또는 GA 상태를 확인한 출처
- Building a hill-climbing machine: Launching seven new MAI models — Microsoft AI의 MAI 모델군 전략과 모델 분류를 확인한 출처
- Introducing MAI-Thinking-1 — MAI-Thinking-1의 reasoning 목적, 모델 스펙, context window, availability를 확인한 출처
- MAI-Image-2.5 launches at No. 2 for image editing on Arena — MAI-Image-2.5의 이미지 생성·편집 용도, 제품 적용, Foundry 제공 정보를 확인한 출처
- MAI-Transcribe-1.5 — MAI-Transcribe-1.5의 언어 지원, 전사 기능, 가격 단위를 확인한 모델 페이지
- MAI-Voice-2 — MAI-Voice-2의 언어 지원, voice matching, 가격 단위를 확인한 모델 페이지
- Work with the Microsoft Foundry Toolkit for Visual Studio Code extension — VS Code에서 Foundry Toolkit을 설치하고 프로젝트, 모델 카탈로그, Playground, hosted agent 배포를 확인하는 공식 문서
- Prepare your development environment — Azure 계정, subscription, VS Code, Azure CLI 또는 Azure Developer CLI, Git 준비 경로를 확인한 문서
'AI UPDATES' 카테고리의 다른 글
| GitHub Copilot 100만 토큰 컨텍스트: reasoning level과 큰 코드베이스 작업 기준 (0) | 2026.06.05 |
|---|---|
| GitHub Copilot evaluation models auto model selection: Copilot Auto 평가 모델 끄는 방법과 주의점 (0) | 2026.06.04 |
| JetBrains Mellum2 12B MoE model 공개: 개발자 AI 워크플로에 주는 의미 (0) | 2026.06.02 |
| MiniMax M3 1M context API 출시: 1M 컨텍스트와 멀티모달 코딩 에이전트가 의미하는 것 (0) | 2026.06.02 |
| OpenAI Codex Windows Computer Use: 코딩 에이전트가 PC 앱을 직접 조작한다 (0) | 2026.06.01 |