Recursive Superintelligence — AI 재귀적 자기개선 루프

techcrunch.com

AIが一晩で自分自身を修正した — $650Mが賭けられた「再帰的自己改善ループ」が始まった

再帰的自己改善, Recursive Superintelligence, リチャード・ソッシャー, Open-Endedness, Rainbow Teamingビジネス

What happens when AI starts building itself?

Recursive Superintelligence raises $650M to build self-improving AI models

Richard Socher's new AI startup wants to build recursively self-improving AI

AIが一晩で自分自身を修正しました。バグを見つけて、修正して、検証まで — 人間なしで。OpenAIのGPT-5.3 Codexはすでに自分のトレーニングをデバッグし、Anthropicのところでは、Claudeのコードの大部分をAIが直接書いているそうです。そして、このループをはじめて会社単位で閉じようとするチームがステルスから現れました。$650Mを携えて。

3秒まとめ

アイデア自動化 → 実装自動化 → 検証自動化 → 再帰ループ完成 → AIがAIを改良

これはどんなループなんですか？

Recursive Superintelligenceは2025年末に設立され、2026年5月にステルスから公開したサンフランシスコ拠点のAIスタートアップです。リーダーはRichard Socher — Salesforceの元チーフサイエンティストでYou.comの創業者、NLPにディープラーニングを初めて主流化した研究者です。スタンフォード博士、引用数21万5千件、NLP分野の引用数ランキング4位。

でも、さらに印象的なのは共同創業者のラインナップなんです。

Tim Rocktäschel
UCL教授兼Google DeepMindオープンエンドネスグループ前ディレクター。Rainbow Teaming論文の共著者で、Genie 3ワールドモデルのリード。
Alexey Dosovitskiy
Vision Transformer（ViT）論文の共著者。コンピュータビジョンに初めてトランスフォーマーを適用した人物です。
Jeff Clune
進化アルゴリズムとオープンエンドネス分野の先駆者。Darwin Gödel Machine（AIによる自律コード書き換え）研究の関係者。
Josh Tobin
OpenAI初期メンバーで、CodexとDeep Researchチームのリード。
Yuandong Tian
Meta FAIRリサーチディレクター、DarkForest GoとELF OpenGoの開発者。

アドバイザーにPeter Norgigまで — AIの教科書『Artificial Intelligence: A Modern Approach』の著者でGoogleリサーチ前ディレクター（25年勤務）。この名前が全員ひとつの会社に揃っているんですよね。

この会社がやろうとしていることはひとつです。AI研究の全プロセス — アイデア生成、実装、検証 — をAIが自律的に行うループを作ること。Socherはこう表現しています：「私たちの核心は真の再帰的自己改善超知性を構築することであり、それは研究アイデアの理想化・実装・検証の全プロセスが自動化されることを意味します。」

$650M

シリーズA資金調達

$4.65B

ポストマネーバリュエーション

~25名

総従業員数

既存のAI研究と何が違うんですか？

現在のAI研究は、人間の科学者が仮説を立て、実験を設計し、コードを書き、結果を分析するという線形構造です。各ステップにAIが補助として入ってはいますが、ループを閉じるのは依然として人間です。

Recursive Superintelligenceが狙っているのは、このループをAI自身が閉じることなんです。GV（Google Ventures）の投資ロジックがこれをうまく説明しています：「AIはコードであり、今やAIがコーディングできます。この二つの現実がつながれば、自己改善ループが閉じます。」

	現在のAI研究	再帰的自己改善
仮説生成	人間の研究者	AIが自律的に生成
実験実装	人間がコーディング	AIが自律的に実装
結果検証	人間が分析	AIが自律的に検証
改善方向	次の研究者が引き継ぐ	同じAIが再帰的に繰り返す
並列実験	研究チームの規模に限界	「5万人の博士」レベルの並列

その兆候はすでにありました。OpenAIのGPT-5.3 Codexは「自分のトレーニングをデバッグし、デプロイを管理し、評価を分析した最初のモデル」と説明され、AnthropicではClaudeのコードの大部分をAIが直接書いていると言います。 Google DeepMindのAlphaEvolveはニューラルネットワーク最適化やチップ設計でソリューションを進化させるのに使われています。

Recursiveはこの流れを会社単位ではじめて明示的にパッケージ化したんです。従業員25人のスタートアップが、ビッグラボよりも直接的に「ループを閉じる」を事業目標として宣言したわけです。

核心をまとめると：Recursiveが使う技術たち

Open-Endedness
固定されたゴールを最適化するのではなく、システム自身が新しいゴールを生成する方式です。生物の進化からインスピレーションを得ていて — 環境が変わり続けることで適応を促すように、AIも絶えず新しい課題を作り出して自分自身を追い込みます。 RocktäschelがDeepMindで長年研究してきた分野です。
Rainbow Teaming
2つのAIが共進化する方式です — 一方が攻撃し、もう一方が防御しながら、同時に複数の角度から対峙します。NeurIPS 2024で発表され、テストモデル全体で90%以上の攻撃成功率、GPT-4oのようなクローズドモデルにも平均50%の転移率を達成。現在、主要なAI研究所が安全性テストに使っています。
Darwin Gödel Machine
AIが自分のコードを直接書き換えるシステムです。Sakana AIとUBC（Jeff Clune参加）が発表した研究で、SWE-benchで20%から50%へと性能が自律的に向上しました。 Recursiveはこの系列の研究を会社規模で拡張しようとしているわけです。
World Models
RocktäschekがリードしたGenie 3は、テキストプロンプトからインタラクティブな環境を24fps 720pで生成できる汎用ワールドモデルです。 Waymoの自動運転学習環境生成にも協力中です。この技術がAI自己改善の環境生成に応用されます。
目標：「自律訓練システム Level 1」
最初のマイルストーンは、AI科学の分野で5万人の博士・医師に相当する能力を持つ自律訓練システムの構築です。その後は物理、化学、前臨床生物学、バッテリー化学、核融合物理学へのドメイン拡張がロードマップです。

なぜ今なのか？

Rocktäschelはスタニスワフ・レムの「情報障壁」という概念を引用します — 知識の蓄積速度が人間の処理できる速度を超える臨界点のこと。RecursiveのミッションはAI研究の方法論自体を自動化してこの障壁を突破することです。Jeff Cluneは「再帰的自己改善システムが科学と技術を変えるコーナーをちょうど曲がったところだ」と表現しています。

🔗