たった5ヶ月でバリュエーションが$5B → $13Bへ。GPTやClaudeを作る会社ではありません。モデルを動かすインフラを売るスタートアップです。
BasetanのAIコスト急成長は偶然ではありません。AIのコスト構造において、まだ多くのチームが気づいていない転換が起きているんです。
モデルが良くなるほど、運ぶコストが戦場になる
AIへの投資はずっとモデル開発に集中してきました。OpenAI、Anthropic、xAIに巨額の資金が流れ込みました。でも、あまり知られていない事実があります。
AIの総コストの80〜90%は推論から発生します
モデルの訓練コストは、AI運用コスト全体の10〜20%にすぎません。残りの80〜90%は、モデルを実際に動かす推論(inference)から発生します。ユーザーがクエリを送るたびにコストが発生する仕組みです。
2023年、推論がAIコンピューティングに占める割合は全体の1/3でした。2026年には2/3を超えました。AIが実際のサービスで大規模に使われ始めたからです。同時に、AI推論コストは2023年以降、トークンあたり$20から$0.07へ急落しました。問題は、多くのチームがいまだにOpenAIやAnthropicなどのクローズドAPIに直結したまま、より高い費用を払い続けていることです。
オープンソースモデルの品質が急速に向上しています。Llama 3.3、Mistral、Qwenなどのモデルが多くのベンチマークでGPT-4レベルに近づき、オープンソースへルーティングすることでコストを最大30〜50%削減できる状況になりました。しかし、これを自前で実装しようとすると、20のクラウド、数十のモデル、自動ルーティングロジックが必要で、エンジニアリングコストが膨大です。
それがまさにBasetanが狙った隙間です。
5ヶ月で売上3倍 — Basetanは実際に何をしてくれる?
BasetanはGPUを所有していません。代わりに18のクラウドプロバイダーの87のグローバルクラスターを接続し、推論リクエストを最もコスト効率の高いルートへ振り分けます。「AIインフラのオーケストレーター」です。
顧客にはCursor(AIコーディングエディタ)、Notion、Mercorがいます。その中でOpenEvidenceは、世界中の数十万人の医師にAIで医療情報をリアルタイムに提供するスタートアップですが、Basetanへの移行で具体的な成果が出ました。
「Basetanでは、すべてがちゃんと動くんですよ。インフラの複雑さが消えました。」
— Zachary Ziegler、OpenEvidence共同創業者 & CTO
コスト削減だけでなく、エンジニアリングの負担まで吸収してくれます。Basetanの売上は前年比1,900%成長し、2025年の推論ボリュームは40倍に増えました。
| クローズドAPI直結 | 推論レイヤー経由 | |
|---|---|---|
| モデル選択 | 1プロバイダーに依存 | 20以上のクラウド、OSS含む |
| トークンコスト | 固定価格 | 最大50%以上削減可能 |
| レイテンシ最適化 | プロバイダー任せ | マルチクラウド自動ルーティング |
| デプロイ速度 | 数時間〜数日 | 1時間以内(OpenEvidenceの実績) |
| ベンダーロックイン | 高い | 低い |
自分のチームのAIコスト、どこで漏れているか確認する方法
Basetanを使う予定がなくても、この市場が伝えていることは明確です。AIをプロダクションで運用しているチームは、今すぐ推論コスト構造を点検すべきです。
- AIトークンコストのレビュー
過去3ヶ月のOpenAI/Anthropicの請求書を出して、どのモデルにいくら使っているか確認しましょう。ほとんどのチームで、コストの70〜80%が2〜3種類のAPIコールに集中しています。 - タスク別のモデルティア分類
すべての作業にGPT-4やClaude Opusが必要なわけではありません。単純な分類、要約、埋め込みはOSSの小型モデルで十分なことが多いです。タスク種別ごとに必要な性能閾値を把握しましょう。 - OSSの代替品の品質テスト
Together AI、Modal Labs、Basetanはすべて無料のテスト環境を提供しています。現在のAPIと同じタスクをLlama 3.3やMistralで実行して結果を比べてみましょう。 - コスト・品質のトレードオフ計算
品質が同等なら、年間どれだけ節約できるか計算しましょう。月のAIコストが$500以上なら、推論レイヤー導入はROI的に合理的です。 - 段階的な移行開始
システム全体を一度に変えないでください。コスト比重が大きく、性能要件が低いAPIコール1〜2種類からOSSへの移行を始めましょう。品質指標を監視しながら範囲を広げていきましょう。
OSSが常に正解ではありません
医療・金融・法務などの規制産業、マルチモーダル機能、最先端の推論性能が必要な場合はクローズドAPIが依然として優位です。コスト削減のために品質を犠牲にしないでください。必ず実際の業務で品質を検証してから移行しましょう。




