GitHub CopilotのToken課金が始まったのは6月1日です。MicrosoftがGitHub Copilot向けに自社初コーディングモデルを公開したのはその翌日、6月2日。たった1日の差。偶然かもしれません。でも、このモデルの設計を知ると、少し見方が変わります。

3秒サマリー
137B/5B MoE 本番環境で学習 Claude Haiku比+16点 Token60%削減 日常コーディングの新標準

137Bなのに、なぜ速くて安いんですか?

MAI-Code-1-Flashは総パラメーター数は137Bですが、推論時に実際に活性化するのは5Bだけなんです。これがMixture-of-Experts(MoE)アーキテクチャです。

専門医チームのように考えてみてください。患者が来たとき、実際に診察するのは担当の専門医1〜2人だけ。同じように、モデルも各Tokenの処理に137Bの中から最も関連する5Bだけを活性化させます。残りの132Bはその処理には関与しません。5Bモデルの速さとコストで、137B分の幅広い知識が使えるわけです。

速くて安くてスマート——その秘密がMoE構造にあります。価格は入力1Mトークンあたり$0.75、出力1Mトークンあたり$4.50です。しかもToken使用量も60%少なくて済むんです。

137B
総パラメーター数
5B
推論時の活性パラメーター
256K
コンテキストウィンドウ(Token)

ベンチマークではなく、Copilotの本番環境で学習した

多くのコーディングモデルはSWE-Benchなどのベンチマークで高スコアを出すように学習されています。MAI-Code-1-Flashは違います。実際のGitHub Copilot本番環境で行われる作業——ファイル編集、ターミナル呼び出し、マルチターン会話——その流れ自体で直接学習されています。

もう一つ重要なこと:OpenAIや他社モデルからの知識蒸留(distillation)は行っていません。Microsoftが自ら収集した「クリーンで追跡可能なエンタープライズグレードのデータ」だけで作られた、初の純正自社モデルです。OpenAI依存からの脱却宣言でもあります。

一般的なコーディングモデルMAI-Code-1-Flash
学習環境ベンチマーク最適化Copilot本番ハーネス
データソース様々(蒸留含む可能性あり)自社収集、サードパーティ蒸留なし
SWE-Bench Pro35.2%(Claude Haiku 4.5)51.2%(+16点)
SWE-Bench Verified66.6%(Claude Haiku 4.5)71.6%
Token効率基準難しい問題で最大60%削減

命令遵守能力(IF Bench)ではClaude Haiku 4.5より28.9点リード。34カテゴリー186問の対抗推論テストでは85.8%の精度を達成しました。「小型モデル」と侮れない数字ですよね。

Copilotの請求書との関係

GPT-5.5は入力$5/出力$30(1Mトークン)。MAI-Code-1-Flashは$0.75/$4.50で、しかもToken60%節約。月々の請求額の差は相当なものになりえます。

Copilotモデルピッカーでの設定方法

  1. VS Code + Copilot拡張機能をアップデート
    最新バージョンでのみモデルピッカーが表示されます。VS CodeのExtensionsタブからGitHub Copilot拡張機能を更新してください。
  2. モデルピッカーで選択、またはAutoを活用
    Copilot Chatパネルのドロップダウンをクリックするとモデル一覧が表示されます。MAI-Code-1-Flashを直接選択するか、Autoを選ぶとタスクに応じてCopilotが自動でルーティングします。
  3. タスク別の推奨モデル
    インライン編集・リファクター・短いバグ修正・レポジトリQ&A・反復作業 → MAI-Code-1-Flash。複雑なアーキテクチャ設計・深いセキュリティレビュー・大規模な自律実装 → フロンティアモデル(MAI-Thinking-1、Claude Opusなど)。
  4. Business/Enterpriseユーザーの場合
    2026年6月26日からBusinessおよびEnterpriseプランでも一般提供が開始されました。ピッカーにまだ表示されない場合は数日待つか、GitHub Community Discussionsをご確認ください。
  5. 使用量ダッシュボードで確認
    Copilot設定のUsage Dashboardでモデル別Token消費量を確認できます。MAI-Code-1-Flashによる節約効果を実際の数字で検証してみてください。

他のモデルを使うべき場面

大規模なアーキテクチャ決定、長期的な自律実装、複雑なマルチシステムデバッグには、MAI-Code-1-Flashが最善策ではない場合があります。日常的なコーディングへの高速な初期対応に最適化されたモデルです——深い推論が必要な場合は大型モデルへエスカレーションを。

MAI-Code-1-Flashが現在対応している環境:

1/3

IDE

VS Code、Visual Studio、JetBrains IDE、Eclipse、Xcode

2/3

GitHubサービス

Copilot Chat on GitHub、GitHub Mobile、Copilotクラウドエージェント

3/3

CLI

Copilot CLI(ターミナルから直接使用可能)

もっと深く知りたい方へ

Introducing MAI-Code-1-Flash Microsoft Superintelligenceチームの公式発表。学習方法論、MoEアーキテクチャの詳細、全ベンチマーク数値を掲載。 microsoft.ai

MAI-Code-1-Flash is now available for GitHub Copilot 初回リリース公告。Copilotの各ティアへの段階的展開スケジュールとモデルピッカーの使い方。 github.blog

MAI-Code-1-Flash available on more Copilot surfaces JetBrains、Eclipse、Xcode、モバイル、CLIなど9プラットフォーム追加対応の告知。 github.blog

MAI-Code-1-Flash for Copilot Business and Enterprise 企業向けプランの一般提供開始の告知と利用開始スケジュール。 github.blog

Microsoft MAI-Code-1-Flash in GitHub Copilot: Pricing and Performance 価格構造と実際のユースケース比較分析。 smartscope.blog

MAI-Code-1-Flash: Copilot-Native Coding Model 開発者視点の分析。モデルルーティングと実際のユースケース比較。 chatforest.com

GitHub Copilot's Token Billing Backlash as Microsoft Build 2026 Opens With MAI Copilot課金変更とMAI登場タイミングの戦略的背景を深掘り分析。 the-agent-report.com