MAI-Code-1-Flash - Microsoft의 첫 자체 코딩 모델

github.blog

Copilot이 토큰 청구 시작한 다음날 — Microsoft 첫 자체 코딩 모델의 137B 설계

MAI-Code-1-Flash, GitHub Copilot 코딩 모델, MoE 구조, 토큰 효율, Microsoft AIAI 도구 실전기

Introducing MAI-Code-1-Flash

MAI-Code-1-Flash is now available for GitHub Copilot

MAI-Code-1-Flash available on more Copilot surfaces

GitHub Copilot의 토큰 청구가 시작된 건 6월 1일이에요. Microsoft가 자체 코딩 모델을 공개한 건 그 다음날인 6월 2일이고요. 하루 차이. 우연일 수도 있어요. 근데 이 모델의 설계를 보면 생각이 좀 달라져요.

3초 요약

137B/5B MoE → Copilot 현장 훈련 → Claude Haiku 대비 +16점 → 토큰 60% 절약 → 일상 코딩 기본 모델

137B라는데 왜 싸고 빠른 거예요?

MAI-Code-1-Flash는 전체 파라미터는 137B이지만 추론할 때 활성화되는 건 5B뿐이에요. 이게 Mixture-of-Experts(MoE) 구조예요.

MoE는 마치 전문의 팀처럼 동작해요. 환자가 오면 담당 전문의 한두 명만 실제로 진료하듯, 모델도 각 토큰마다 137B 중 가장 관련 있는 5B만 활성화해서 처리해요. 나머지 132B는 그 토큰 처리에 개입하지 않아요. 결과적으로 연산량은 5B 모델 수준이면서도, 다양한 작업 유형에 특화된 전문가 영역 지식을 폭넓게 갖출 수 있어요.

빠르고 저렴하면서 스마트한 이유가 바로 MoE 구조예요. 비용으로 따지면 입력 1M 토큰당 $0.75, 출력 1M 토큰당 $4.50이에요. 같은 작업에 토큰도 60% 덜 쓰니까요.

137B

전체 파라미터

추론 시 활성 파라미터

256K

컨텍스트 윈도우 (토큰)

벤치마크가 아니라 Copilot 현장에서 훈련됐다

대부분의 코딩 모델은 SWE-Bench 같은 벤치마크에서 잘 나오도록 훈련돼요. MAI-Code-1-Flash는 방향이 달라요. 실제 GitHub Copilot 생산 환경에서 벌어지는 작업들 — 파일 편집, 터미널 호출, 멀티턴 대화 — 그 흐름 자체에서 훈련됐어요.

그리고 하나 더: OpenAI나 다른 회사 모델에서 지식을 추출(distillation)하지 않았어요. Microsoft가 직접 수집한 깨끗하고 추적 가능한 엔터프라이즈급 데이터로만 만든 첫 자체 모델이에요. Microsoft의 OpenAI 의존을 끊겠다는 선언이기도 하죠.

	일반 코딩 모델	MAI-Code-1-Flash
훈련 환경	코딩 벤치마크 최적화	Copilot 실제 생산 환경
데이터 출처	다양 (증류 포함 가능)	자체 수집, 제3자 증류 없음
SWE-Bench Pro	35.2% (Claude Haiku 4.5)	51.2% (+16점)
SWE-Bench Verified	66.6% (Claude Haiku 4.5)	71.6%
토큰 효율	기준	어려운 문제에서 최대 60% 절약

명령어 수행 능력(IF Bench)에서는 Claude Haiku 4.5 대비 28.9점 차이로 앞섰어요. 적대적 추론 테스트(186문항, 34개 카테고리)에서는 85.8% 정확도를 기록했고요. 숫자만 놓고 보면 경량 모델이라고 무시하기 어려운 수준이에요.

Copilot 청구서와의 연결고리

GPT-5.5는 입력 1M 토큰당 $5, 출력 $30이에요. MAI-Code-1-Flash는 입력 $0.75, 출력 $4.50이고요. 토큰도 60% 덜 쓰니까, 같은 작업 대비 실제 청구서 차이는 상당해요.

Copilot 모델 피커에서 MAI-Code-1-Flash 세팅하는 법

VS Code + Copilot 확장 업데이트
최신 버전에서만 모델 피커가 나타나요. VS Code Extensions 탭에서 GitHub Copilot 확장을 최신으로 업데이트하세요.
모델 피커에서 선택 또는 Auto 활용
Copilot Chat 패널에서 드롭다운을 클릭하면 모델 목록이 나와요. MAI-Code-1-Flash를 직접 선택하거나, Auto를 선택하면 작업 유형에 따라 Copilot이 자동 라우팅해줘요.
업무 유형별 추천 라우팅
인라인 편집, 리팩터, 짧은 버그 픽스, 레포 Q&A, 반복 작업 → MAI-Code-1-Flash. 복잡한 아키텍처 설계, 심층 보안 리뷰, 대규모 자율 구현 → 프런티어 모델(MAI-Thinking-1, Claude Opus 등).
Business/Enterprise 사용자라면
2026년 6월 26일부터 Business·Enterprise 플랜도 일반 출시됐어요. 아직 피커에 안 보인다면 며칠 기다리거나 GitHub Community Discussions를 확인하세요.
사용량 대시보드 모니터링
Copilot 설정의 Usage Dashboard에서 모델별 토큰 소비를 확인할 수 있어요. MAI-Code-1-Flash 절감 효과를 직접 숫자로 검증해보세요.

이런 작업에는 다른 모델을 쓰세요

대규모 아키텍처 결정, 장기 자율 구현, 복잡한 멀티시스템 디버깅에는 MAI-Code-1-Flash가 최선이 아닐 수 있어요. 일상 코딩의 빠른 첫 번째 응답자 역할에 최적화된 모델이에요.

MAI-Code-1-Flash가 지원되는 환경을 정리하면요.

1/3

IDE

VS Code, Visual Studio, JetBrains IDEs, Eclipse, Xcode

2/3

GitHub 서비스

Copilot Chat on GitHub, GitHub Mobile, Copilot cloud agent

3/3

CLI

Copilot CLI (터미널에서 직접 사용 가능)

🔗

더 깊이 파고 싶다면

Introducing MAI-Code-1-Flash

Microsoft Superintelligence 팀의 공식 발표. 훈련 방법론, MoE 구조, 전체 벤치마크 수치가 자세히 나와 있어요.

MAI-Code-1-Flash is now available for GitHub Copilot

최초 출시 공지. Copilot Free~Max 단계적 배포 일정과 모델 피커 사용법 안내.

MAI-Code-1-Flash available on more Copilot surfaces

JetBrains, Eclipse, Xcode, 모바일, CLI 등 9개 추가 플랫폼 지원 확장 공지.

MAI-Code-1-Flash for Copilot Business and Enterprise

기업 플랜 일반 출시 공지. Business/Enterprise 팀 접근 일정 확인.

Microsoft MAI-Code-1-Flash in GitHub Copilot: Availability, Pricing, and Performance

가격 구조와 실제 사용 케이스 비교 분석.

MAI-Code-1-Flash: Microsoft's Copilot-Native Coding Model

실전 개발자 관점 분석. 모델 라우팅과 실제 사용 케이스 비교.

GitHub Copilot's Token Billing Backlash Hits as Microsoft Build 2026 Opens With MAI

Copilot 청구제 전환과 MAI 출시 타이밍의 전략적 맥락 심층 분석.

자주 묻는 질문

Auto 피커를 쓰면 MAI-Code-1-Flash가 자동으로 선택되나요?

Copilot의 Auto 라우터가 작업 유형을 분석해서 MAI-Code-1-Flash를 포함한 여러 모델 중 적합한 것을 자동 선택해요. 물론 피커에서 직접 MAI-Code-1-Flash를 선택할 수도 있어요. 어떤 모델이 선택됐는지는 Copilot 설정의 Usage Dashboard에서 확인 가능합니다.

JetBrains나 Xcode에서도 쓸 수 있나요?

네, 2026년 6월 18일부터 JetBrains IDEs, Eclipse, Xcode, Visual Studio, GitHub Mobile, Copilot CLI 등 9개 추가 환경에서 지원돼요. Business/Enterprise 플랜은 6월 26일부터 일반 출시됐어요.

MAI-Code-1-Flash는 모든 Copilot 플랜에서 쓸 수 있나요?

Free, Student, Pro, Pro+, Max 전 티어에서 사용 가능해요. AI Credits 종량제 안에서 동작하므로 사용량에 따라 크레딧이 소비되지만, 토큰 효율이 60% 높아서 같은 크레딧으로 더 많이 쓸 수 있어요.

MAI-Code-1-Flash와 MAI-Thinking-1의 차이는 뭔가요?

MAI-Code-1-Flash는 인라인 편집, 리팩터, 짧은 버그 픽스에 특화된 빠르고 효율적인 모델이에요. MAI-Thinking-1은 복잡한 아키텍처 설계나 장기 자율 구현에 적합한 추론 전문 모델이에요. 역할이 달라서 상황에 맞게 골라 쓰는 게 좋아요.

이 모델이 정말 OpenAI 데이터를 안 썼나요?

Microsoft가 공식적으로 깨끗하고 추적 가능하며 라이선스가 정리된 데이터를 사용했고, 제3자 모델로부터의 증류는 없었다고 밝혔어요. OpenAI 모델에서 지식 추출(knowledge distillation)을 하지 않은 Microsoft 순수 자체 모델이에요.

Written by 러쉬

비즈니스와 AI가 만나는 접점을 추적합니다.

이 레퍼런스가 도움이 되셨나요?

매주 엄선된 레퍼런스를 메일로 받아보세요

이 레퍼런스 공유하기

다음 읽을 레퍼런스

6개월 만에 혼자 $80M에 팔았다 — 도구가 아니라 이 원칙이 달랐다

Maor Shlomo는 6개월 동안 혼자 Base44를 만들어 Wix에 $80M에 팔았어요. AI 1인 기업 성패를 가르는 건 도구가 아니라 잠재 수요 원칙이었습니다. Flash Team 구조와 30일 플레이북까지.

이런 가이드도 추천해요

비슷한 주제의 AI 활용 가이드를 더 살펴보세요

"최고의 광고는 답변이다" — Google AI Mode 신규 광고 4종과 94% 무클릭 시대

aisparkup.com

marketingGoogle AI Mode 광고, GML 2026, AI Mode 무클릭, Conversational Discovery Ads, Business Agent for Leads

"최고의 광고는 답변이다" — Google AI Mode 신규 광고 4종과 94% 무클릭 시대

Google AI Mode 광고 4종 완전 해부 — 94% 무클릭 시대에 살아남는 마케터 체크리스트. GML 2026 발표 내용과 지금 당장 해야 할 3가지.

techcrunch.com

AI 조직 전환Snap Dotmo 분사, AI 개발 비용, Bobby Murphy 투자, Specs Inc., AI 스핀아웃 전략

해고도 유지도 아니다 — Snap이 6개월에 두 번 쓴 AI 분사 공식

Snap이 1,000명을 자른 지 두 달 만에 AI 영상 팀을 분사해 Dotmo를 만들었어요. 비용은 넘기고 업사이드는 지분으로 보존하는 세 번째 길 — Snap의 Dotmo·Specs Inc. 분사 구조를 분석합니다.

contently.com

ChatGPT가 클릭을 5.7배 더 팔아준다 — AEO·GEO 도구 3계층 선택법

ChatGPT 인용 전환율(15.9%)이 구글 유기 검색(2.8%)의 5.7배인 지금, AEO/GEO 도구 시장은 엔터프라이즈·미드마켓·SMB 3계층으로 나뉜다. 팀 규모와 예산에 맞는 도구를 고르는 3가지 기준.

다음 →6개월 만에 혼자 $80M에 팔았다 — 도구가 아니라 이 원칙이 달랐다