AIが一晩で自分自身を修正しました。バグを見つけて、修正して、検証まで — 人間なしで。OpenAIのGPT-5.3 Codexはすでに自分のトレーニングをデバッグし、Anthropicのところでは、Claudeのコードの大部分をAIが直接書いているそうです。 そして、このループをはじめて会社単位で閉じようとするチームがステルスから現れました。$650Mを携えて。
これはどんなループなんですか?
Recursive Superintelligenceは2025年末に設立され、2026年5月にステルスから公開したサンフランシスコ拠点のAIスタートアップです。 リーダーはRichard Socher — Salesforceの元チーフサイエンティストでYou.comの創業者、NLPにディープラーニングを初めて主流化した研究者です。スタンフォード博士、引用数21万5千件、NLP分野の引用数ランキング4位。
でも、さらに印象的なのは共同創業者のラインナップなんです。
- Tim Rocktäschel
UCL教授兼Google DeepMindオープンエンドネスグループ前ディレクター。Rainbow Teaming論文の共著者で、Genie 3ワールドモデルのリード。 - Alexey Dosovitskiy
Vision Transformer(ViT)論文の共著者。コンピュータビジョンに初めてトランスフォーマーを適用した人物です。 - Jeff Clune
進化アルゴリズムとオープンエンドネス分野の先駆者。Darwin Gödel Machine(AIによる自律コード書き換え)研究の関係者。 - Josh Tobin
OpenAI初期メンバーで、CodexとDeep Researchチームのリード。 - Yuandong Tian
Meta FAIRリサーチディレクター、DarkForest GoとELF OpenGoの開発者。
アドバイザーにPeter Norgigまで — AIの教科書『Artificial Intelligence: A Modern Approach』の著者でGoogleリサーチ前ディレクター(25年勤務)。 この名前が全員ひとつの会社に揃っているんですよね。
この会社がやろうとしていることはひとつです。AI研究の全プロセス — アイデア生成、実装、検証 — をAIが自律的に行うループを作ること。Socherはこう表現しています:「私たちの核心は真の再帰的自己改善超知性を構築することであり、それは研究アイデアの理想化・実装・検証の全プロセスが自動化されることを意味します。」
既存のAI研究と何が違うんですか?
現在のAI研究は、人間の科学者が仮説を立て、実験を設計し、コードを書き、結果を分析するという線形構造です。各ステップにAIが補助として入ってはいますが、ループを閉じるのは依然として人間です。
Recursive Superintelligenceが狙っているのは、このループをAI自身が閉じることなんです。GV(Google Ventures)の投資ロジックがこれをうまく説明しています:「AIはコードであり、今やAIがコーディングできます。この二つの現実がつながれば、自己改善ループが閉じます。」
| 現在のAI研究 | 再帰的自己改善 | |
|---|---|---|
| 仮説生成 | 人間の研究者 | AIが自律的に生成 |
| 実験実装 | 人間がコーディング | AIが自律的に実装 |
| 結果検証 | 人間が分析 | AIが自律的に検証 |
| 改善方向 | 次の研究者が引き継ぐ | 同じAIが再帰的に繰り返す |
| 並列実験 | 研究チームの規模に限界 | 「5万人の博士」レベルの並列 |
その兆候はすでにありました。OpenAIのGPT-5.3 Codexは「自分のトレーニングをデバッグし、デプロイを管理し、評価を分析した最初のモデル」と説明され、AnthropicではClaudeのコードの大部分をAIが直接書いていると言います。 Google DeepMindのAlphaEvolveはニューラルネットワーク最適化やチップ設計でソリューションを進化させるのに使われています。
Recursiveはこの流れを会社単位ではじめて明示的にパッケージ化したんです。従業員25人のスタートアップが、ビッグラボよりも直接的に「ループを閉じる」を事業目標として宣言したわけです。
核心をまとめると:Recursiveが使う技術たち
- Open-Endedness
固定されたゴールを最適化するのではなく、システム自身が新しいゴールを生成する方式です。生物の進化からインスピレーションを得ていて — 環境が変わり続けることで適応を促すように、AIも絶えず新しい課題を作り出して自分自身を追い込みます。 RocktäschelがDeepMindで長年研究してきた分野です。 - Rainbow Teaming
2つのAIが共進化する方式です — 一方が攻撃し、もう一方が防御しながら、同時に複数の角度から対峙します。NeurIPS 2024で発表され、テストモデル全体で90%以上の攻撃成功率、GPT-4oのようなクローズドモデルにも平均50%の転移率を達成。 現在、主要なAI研究所が安全性テストに使っています。 - Darwin Gödel Machine
AIが自分のコードを直接書き換えるシステムです。Sakana AIとUBC(Jeff Clune参加)が発表した研究で、SWE-benchで20%から50%へと性能が自律的に向上しました。 Recursiveはこの系列の研究を会社規模で拡張しようとしているわけです。 - World Models
RocktäschekがリードしたGenie 3は、テキストプロンプトからインタラクティブな環境を24fps 720pで生成できる汎用ワールドモデルです。 Waymoの自動運転学習環境生成にも協力中です。この技術がAI自己改善の環境生成に応用されます。 - 目標:「自律訓練システム Level 1」
最初のマイルストーンは、AI科学の分野で5万人の博士・医師に相当する能力を持つ自律訓練システムの構築です。 その後は物理、化学、前臨床生物学、バッテリー化学、核融合物理学へのドメイン拡張がロードマップです。
なぜ今なのか?
Rocktäschelはスタニスワフ・レムの「情報障壁」という概念を引用します — 知識の蓄積速度が人間の処理できる速度を超える臨界点のこと。RecursiveのミッションはAI研究の方法論自体を自動化してこの障壁を突破することです。Jeff Cluneは「再帰的自己改善システムが科学と技術を変えるコーナーをちょうど曲がったところだ」と表現しています。




