ディクテーションアプリが$2B評価で$260Mを調達中というニュースが出ました。Wispr Flowの話です。半年前は$700M評価でしたが、今回のラウンド(Menlo Ventures主導)で約3倍に跳ね上がっています。

最初に聞くとちょっと不思議ですよね。OpenAI Whisperは2年前から無料で公開されていて、SuperWhisperみたいなローカルアプリにも慣れている。それなのに、いったい何が違うから$2Bなのか。

3秒まとめ
音声入力 ディクテーション(Whisper時代) AI自動編集(Wispr時代) 「Enterまで0.5秒」

なぜ$2Bなんですか?

結論から言うと、Wisprが売っているのは「ディクテーション」ではなく「書き起こして整えるまで」なんです。同じ音声入力に見えますが、出力物の性格が完全に違います。

以前のディクテーションの流れはこうでした。「えーと、その、あの、来週火曜日にミーティング動かせますか」と話すと、画面にその通り出てきます。そこから自分で「えー/その/あの」を消して、文を整えて、フォーマットを直す。書き起こし自体は速いのに、編集が別の仕事だったんですね。

Wispr Flowはここからもう一段先に進みます。同じ発話を入れると「来週火曜日にミーティングを動かせますか?」くらいに整った文章が出てきます。フィラーワード除去、文の整形、頻出用語の学習、相手のアプリ(メール・Slack・コードエディタ)に合わせたトーン調整までが自動です。

Notable Capital(投資家)が分析した指標で面白いものがありました。ユーザーが書き起こし結果を見てから0.5秒でEnterを押すそうです。これが何を意味するかというと、AI出力をもう一度読んで直す段階が消えたということ。「自分で手を入れる必要がない」という信頼が0.5秒で測れる、という話です。

なぜ今が変曲点なのか

Whisperは2022年に公開されたOSSです。精度はすでに十分でした。それでもディクテーション市場が爆発したのは2025〜2026年。差はどこかというと、「書き起こした後」をLLMが整えられるようになった時点からなんです。STT(音声→文字)は解決済み。カテゴリは「音声→完成した文章」に静かに移動した、というのが本質です。

$2Bを数字で見る

$260M
今回のラウンド(Menlo主導)
$2B
評価(半年で3倍)
250万+
2025年末〜2026年初の累計DL
60%
非英語の利用比率(104言語対応)

Bloombergが最初にスクープした今回のラウンドは、まだクロージング前です。でも面白いデータは金額じゃなくて、非英語圏の利用が60%という点なんですね。インドが米国に次ぐ2位市場(インストールの14%)で、ヒンディー・北京語・スペイン語が急成長中です。キーボードが英語前提に最適化されている言語ほど、「話すだけで入力」の価値が爆発する、という仮説がデータで見えています。

顧客企業も傾向がはっきりしていて、NvidiaやAmazonのエンジニアがコーディングアシスタント・業務ツール操作にWispr Flowを使っていると報じられています。Cursor・Windsurfというコードエディタ向けの拡張も別途用意されています。SOC 2 Type IIとHIPAAコンプライアンスを全プランに搭載していることが、エンタープライズ導入の潤滑剤になっています。

Whisper・SuperWhisperと何が違うんですか?

精度はだいたい似ています。分かれるのは「書き起こした後を誰が整えるか」です。

Whisper / SuperWhisper Wispr Flow
出力 そのまま書き起こす(「えーと…」も) フィラー除去・整形済みの文
処理場所 ローカル(オフラインOK) クラウド(常時接続)
プラットフォーム Mac中心(WhisperはLinuxも) Mac・Windows・iOS・Android
月額 $0〜$9 $15〜$18(Pro)
エンタープライズ 個人利用中心 SOC 2・HIPAA標準搭載

SuperWhisperの強い領域もハッキリしていて、ローカル処理なのでネットが切れても動きますし、音声がサーバーに出ないのでプライバシー重視の業務(法務・医療の一部、社内非公開資料)で安心です。月額も$8〜9で半額くらい。難点はMac専用ということ。

Whisper本体はもっとシンプルですね。OSSで、$29買い切りのデスクトップアプリ(get-whisper)もあって、精度は事実上同等です。「書き起こすだけ」で十分な人なら、クラウドサブスクを払う理由がありません。

Wispr Flowはその2つの間に挟まったのではなく、上に一段上がったんです。「ディクテーションツール」ではなく「話すことでテキスト入力を完了させるワークフロー」を売っている。だからメール・Slack・CRMでの結果がそのまま使える、というのが核心です。

日本語ユーザーが知っておくこと

Wisprは日本語に対応しています。ただし「model parity」等級は英語・ドイツ語・フランス語・スペイン語・ポルトガル語・イタリア語・ヒンディー語・タイ語の8言語で、日本語はその次の等級です。短文は十分に書き起こせますが、専門用語や敬語の細かい揺れがあると後編集が必要なことがあります。SuperWhisperも同様の傾向です。日本語比率が高いワークフローなら、無料トライアルで自分の業務に近い文を先に試すのが安全です。

これから始める方法

  1. まず自分のワークフローを一文で書く
    「メール・Slack返信が業務の70%」「長文ドキュメントを音声で素早く書きたい」「コードエディタ(Cursor)で音声コマンドを使いたい」のどれかで、選ぶべきツールが分かれます。
  2. ローカルかクラウドかを先に決める
    プライバシー・オフラインが大事ならSuperWhisperまたはWhisper(get-whisper)。自動編集・多言語・エンタープライズ要件があるならWispr Flow。
  3. 14日無料トライアルで日本語検証
    Wispr Flowはカード不要で14日Proトライアルが開放されています。自分の業務でよく使う日本語の文を10個書き起こさせて、「手を入れる頻度」がどれくらいか測ってみてください。
  4. ホットキーとSnippetを先に設定
    Wispr FlowのSnippet Libraryは、よく使うフレーズ(署名、定例会議URL、定型挨拶)を音声ショートカットにできます。最初の30分の設定で体感速度が変わります。
  5. コードエディタにも引き込む
    Cursor・Windsurfの拡張が別途あります。コードを書きながらチャットに長文を打つ場面で音声に置き換えるのが一番ROIが良いパターン。キーボードより3〜4倍速いというユーザーレポートが一貫しています。

もっと深く知るには

Bloomberg原文 Menlo主導$260M・$2B評価の最初のスクープ bloomberg.com

Wispr Flow公式 デモ・価格・IDE拡張・14日無料トライアルを一箇所で wisprflow.ai

Notable Capital分析 「0.5秒信頼指標」・BCIからソフトウェアへのピボット・150年前のキーボード再定義 notablecap.com

Whisper vs SuperWhisper vs Wispr Flow比較 価格・プラットフォーム・精度・オフラインを整理した2026年版 get-whisper.com

Tanay Kothari創業者プロフィール スタンフォード出身のインド系創業者が音声優先の未来に賭けるまで businesstoday.in

Wispr Flow vs SuperWhisper公式比較 Wisprが自社でまとめた違い・SOC 2・HIPAA標準搭載 wisprflow.ai