MAI-Code-1-Flash - Microsoft의 첫 자체 코딩 모델

github.blog

CopilotがToken課金を開始した翌日——Microsoftの自社初コーディングモデルの137B設計

MAI-Code-1-Flash、GitHub Copilotコーディングモデル、MoEアーキテクチャ、Token効率、Microsoft AI開発

Introducing MAI-Code-1-Flash

MAI-Code-1-Flash is now available for GitHub Copilot

MAI-Code-1-Flash available on more Copilot surfaces

GitHub CopilotのToken課金が始まったのは6月1日です。MicrosoftがGitHub Copilot向けに自社初コーディングモデルを公開したのはその翌日、6月2日。たった1日の差。偶然かもしれません。でも、このモデルの設計を知ると、少し見方が変わります。

3秒サマリー

137B/5B MoE → 本番環境で学習 → Claude Haiku比+16点 → Token60%削減 → 日常コーディングの新標準

137Bなのに、なぜ速くて安いんですか？

MAI-Code-1-Flashは総パラメーター数は137Bですが、推論時に実際に活性化するのは5Bだけなんです。これがMixture-of-Experts（MoE）アーキテクチャです。

専門医チームのように考えてみてください。患者が来たとき、実際に診察するのは担当の専門医1〜2人だけ。同じように、モデルも各Tokenの処理に137Bの中から最も関連する5Bだけを活性化させます。残りの132Bはその処理には関与しません。5Bモデルの速さとコストで、137B分の幅広い知識が使えるわけです。

速くて安くてスマート——その秘密がMoE構造にあります。価格は入力1Mトークンあたり$0.75、出力1Mトークンあたり$4.50です。しかもToken使用量も60%少なくて済むんです。

137B

総パラメーター数

推論時の活性パラメーター

256K

コンテキストウィンドウ（Token）

ベンチマークではなく、Copilotの本番環境で学習した

多くのコーディングモデルはSWE-Benchなどのベンチマークで高スコアを出すように学習されています。MAI-Code-1-Flashは違います。実際のGitHub Copilot本番環境で行われる作業——ファイル編集、ターミナル呼び出し、マルチターン会話——その流れ自体で直接学習されています。

もう一つ重要なこと：OpenAIや他社モデルからの知識蒸留（distillation）は行っていません。Microsoftが自ら収集した「クリーンで追跡可能なエンタープライズグレードのデータ」だけで作られた、初の純正自社モデルです。OpenAI依存からの脱却宣言でもあります。

	一般的なコーディングモデル	MAI-Code-1-Flash
学習環境	ベンチマーク最適化	Copilot本番ハーネス
データソース	様々（蒸留含む可能性あり）	自社収集、サードパーティ蒸留なし
SWE-Bench Pro	35.2%（Claude Haiku 4.5）	51.2%（+16点）
SWE-Bench Verified	66.6%（Claude Haiku 4.5）	71.6%
Token効率	基準	難しい問題で最大60%削減

命令遵守能力（IF Bench）ではClaude Haiku 4.5より28.9点リード。34カテゴリー186問の対抗推論テストでは85.8%の精度を達成しました。「小型モデル」と侮れない数字ですよね。

Copilotの請求書との関係

GPT-5.5は入力$5/出力$30（1Mトークン）。MAI-Code-1-Flashは$0.75/$4.50で、しかもToken60%節約。月々の請求額の差は相当なものになりえます。

Copilotモデルピッカーでの設定方法

VS Code + Copilot拡張機能をアップデート
最新バージョンでのみモデルピッカーが表示されます。VS CodeのExtensionsタブからGitHub Copilot拡張機能を更新してください。
モデルピッカーで選択、またはAutoを活用
Copilot Chatパネルのドロップダウンをクリックするとモデル一覧が表示されます。MAI-Code-1-Flashを直接選択するか、Autoを選ぶとタスクに応じてCopilotが自動でルーティングします。
タスク別の推奨モデル
インライン編集・リファクター・短いバグ修正・レポジトリQ&A・反復作業 → MAI-Code-1-Flash。複雑なアーキテクチャ設計・深いセキュリティレビュー・大規模な自律実装 → フロンティアモデル（MAI-Thinking-1、Claude Opusなど）。
Business/Enterpriseユーザーの場合
2026年6月26日からBusinessおよびEnterpriseプランでも一般提供が開始されました。ピッカーにまだ表示されない場合は数日待つか、GitHub Community Discussionsをご確認ください。
使用量ダッシュボードで確認
Copilot設定のUsage Dashboardでモデル別Token消費量を確認できます。MAI-Code-1-Flashによる節約効果を実際の数字で検証してみてください。

他のモデルを使うべき場面

大規模なアーキテクチャ決定、長期的な自律実装、複雑なマルチシステムデバッグには、MAI-Code-1-Flashが最善策ではない場合があります。日常的なコーディングへの高速な初期対応に最適化されたモデルです——深い推論が必要な場合は大型モデルへエスカレーションを。

MAI-Code-1-Flashが現在対応している環境：

1/3

IDE

VS Code、Visual Studio、JetBrains IDE、Eclipse、Xcode

2/3

GitHubサービス

Copilot Chat on GitHub、GitHub Mobile、Copilotクラウドエージェント

3/3

CLI

Copilot CLI（ターミナルから直接使用可能）

もっと深く知りたい方へ

Introducing MAI-Code-1-Flash Microsoft Superintelligenceチームの公式発表。学習方法論、MoEアーキテクチャの詳細、全ベンチマーク数値を掲載。 microsoft.ai

MAI-Code-1-Flash is now available for GitHub Copilot 初回リリース公告。Copilotの各ティアへの段階的展開スケジュールとモデルピッカーの使い方。 github.blog

MAI-Code-1-Flash available on more Copilot surfaces JetBrains、Eclipse、Xcode、モバイル、CLIなど9プラットフォーム追加対応の告知。 github.blog

MAI-Code-1-Flash for Copilot Business and Enterprise 企業向けプランの一般提供開始の告知と利用開始スケジュール。 github.blog

Microsoft MAI-Code-1-Flash in GitHub Copilot: Pricing and Performance 価格構造と実際のユースケース比較分析。 smartscope.blog

MAI-Code-1-Flash: Copilot-Native Coding Model 開発者視点の分析。モデルルーティングと実際のユースケース比較。 chatforest.com

GitHub Copilot's Token Billing Backlash as Microsoft Build 2026 Opens With MAI Copilot課金変更とMAI登場タイミングの戦略的背景を深掘り分析。 the-agent-report.com

よくある質問

Autoピッカーを使うとMAI-Code-1-Flashが自動で選ばれますか？

CopilotのAutoルーターはタスクの種類を分析し、MAI-Code-1-Flashを含む複数のモデルから最適なものを自動選択します。ピッカーで直接選ぶこともできます。どのモデルが選ばれたかはCopilot設定のUsage Dashboardで確認できます。

JetBrainsやXcodeでも使えますか？

2026年6月18日より、JetBrains IDE・Eclipse・Xcode・Visual Studio・GitHub Mobile・Copilot CLIなど9つの追加環境で対応しました。Business/Enterpriseプランは6月26日より一般提供開始です。

MAI-Code-1-FlashはすべてのCopilotプランで使えますか？

Free・Student・Pro・Pro+・Maxの全ティアで利用可能です。AI Creditsの従量課金モデル内で動作しますが、Token効率が60%高いため、同じクレジットでより多くの作業をこなせます。

MAI-Code-1-FlashとMAI-Thinking-1の違いは何ですか？

MAI-Code-1-Flashはインライン編集・リファクター・簡単なバグ修正に特化した高速・効率モデルです。MAI-Thinking-1は複雑なアーキテクチャ設計や長期的な自律実装向けの推論特化モデルです。役割が異なるので、タスクに合わせて使い分けてください。

本当にOpenAIのデータを使っていないのですか？

Microsoftは公式に「クリーンで追跡可能なライセンス済みデータを使用し、サードパーティモデルからの蒸留は行っていない」と表明しています。OpenAIモデルからの知識蒸留を行っていない、Microsoft純正の自社モデルです。

著者ラッシュ

ビジネスとAIが交わる接点を追跡します。

このリファレンスは役に立ちましたか？

毎週厳選されたリファレンスをメールでお届けします

このリファレンスを共有

ラルフトン — 人間が退勤し、AIが夜通しコーディングするハッカソン

ソウルで開催された韓国初のAIエージェントハッカソン。キーボードに触れずに10万行のコードを書いた優勝チームの話と、ハーネスエンジニアリング時代が幕を開ける現場レポート。

こんなリファレンスもあります

他の読者も読んだリファレンス

26人がOpenAIに挑んだ — ArceeのオープンソースLLMがOpenClawで1位になるまで

techcrunch.com

Arcee AI、Trinity LLM、オープンソースAI、OpenClaw代替、小規模スタートアップ

26人がOpenAIに挑んだ — ArceeのオープンソースLLMがOpenClawで1位になるまで

わずか26人のスタートアップArceeが2000万ドルで400Bのオープンソース大規模言語モデルを開発し、OpenClawで最も使われるオープンモデルの第1位に。小規模チームの戦略と開発者が注目する理由をまとめました。

詳しく見る

OpenAIがmacOS仮想化チームを丸ごと連れ去った — Cirrus Labs買収とエージェントインフラの次の一手

cdn.prod.website-files.com

Cirrus Labs, OpenAI, Agent Infrastructure, Tart, Apple Silicon仮想化, Codex

OpenAIがmacOS仮想化チームを丸ごと連れ去った — Cirrus Labs買収とエージェントインフラの次の一手

OpenAIがApple Silicon仮想化ツールの代名詞Cirrus Labsを買収しました。TartやVetuなどのVM仮想化技術をAgent Infrastructureチームに取り込み、AIエージェントが自律的にコードをビルド・テストできる隔離実行環境を構築する狙いです。

詳しく見る

次へ →ラルフトン — 人間が退勤し、AIが夜通しコーディングするハッカソン