Recursive Superintelligence — AI 재귀적 자기개선 루프

techcrunch.com

AI在夜间修复了自身 — 价值$650M的「递归自我改进循环」已经启动

递归自我改进, Recursive Superintelligence, Richard Socher, Open-Endedness, Rainbow Teaming商业

What happens when AI starts building itself?

Recursive Superintelligence raises $650M to build self-improving AI models

Richard Socher's new AI startup wants to build recursively self-improving AI

AI在夜间修复了自己。找到了漏洞，进行了修复，并完成了验证——全程无人参与。OpenAI的GPT-5.3 Codex据称已经能够调试自身的训练过程，Anthropic表示Claude的大部分代码现在也是由AI直接编写的。而现在，一个团队携$650M从隐身模式现身，试图在公司层面完成这个闭环。

3秒概览

创意自动化 → 实现自动化 → 验证自动化 → 递归循环闭合 → AI改进AI

这到底是一个什么样的循环？

Recursive Superintelligence于2025年底创立，2026年5月从隐身模式公开亮相，是一家位于旧金山的AI初创公司。领头人是Richard Socher——前Salesforce首席科学家、You.com创始人，也是最早将深度学习引入NLP主流的研究者。斯坦福博士，引用次数21.5万次，NLP领域引用量排名第四。

但更令人印象深刻的是联合创始人阵容。

Tim Rocktäschel
UCL教授兼Google DeepMind Open-Endedness团队前总监。Rainbow Teaming论文共同作者，Genie 3世界模型负责人。
Alexey Dosovitskiy
Vision Transformer（ViT）论文共同作者——第一个将Transformer应用于计算机视觉的人。
Jeff Clune
进化算法和Open-Endedness领域的先驱。Darwin Gödel Machine（AI自主代码重写）研究相关人物。
Josh Tobin
OpenAI早期成员，Codex和Deep Research团队负责人。
Yuandong Tian
Meta FAIR研究总监，DarkForest Go和ELF OpenGo的开发者。

顾问中还有Peter Norvig——AI教科书《Artificial Intelligence: A Modern Approach》的作者，前Google Research总监（任职25年）。这些名字全都汇聚在一家公司里。

这家公司只做一件事：构建一个AI能够自主完成AI研究全流程的循环——创意生成、实现、验证——全部自动化。Socher这样表述："我们的核心是构建真正的递归自我改进超级智能，这意味着研究创意的构想、实现和验证全流程都将实现自动化。"

$650M

A轮融资

$4.65B

投后估值

~25人

总员工数

和现有AI研究有什么不同？

当前的AI研究方式是线性的：人类科学家提出假设，设计实验，编写代码，分析结果。AI在各个环节作为辅助工具参与，但闭合循环的仍然是人。

Recursive Superintelligence的目标是让AI自己来闭合这个循环。GV（Google Ventures）的投资逻辑很好地诠释了这一点："AI是代码，而现在AI可以编写代码。当这两个现实连接起来，自我改进循环就闭合了。"

	当前AI研究	递归自我改进
假设生成	人类研究员	AI自主生成
实验实现	人类编写代码	AI自主实现
结果验证	人类分析	AI自主验证
改进方向	交由下一位研究者继承	同一AI递归重复
并行实验	受研究团队规模限制	"5万名博士"级别的并行

迹象其实早已显现。OpenAI的GPT-5.3 Codex被描述为"首个能够调试自身训练、管理自身部署并分析自身评估的模型"，Anthropic也表示Claude的大部分代码现在由AI直接编写。 Google DeepMind的AlphaEvolve正被用于在神经网络优化和芯片设计中进化出解决方案。

Recursive是第一个在公司层面将这一趋势明确打包的团队。一家25人的初创公司比任何大型实验室都更直接地将"闭合循环"宣布为自己的商业目标。

核心整理：Recursive正在使用的技术

Open-Endedness
不是优化固定目标，而是让系统自主生成新目标。灵感来自生物进化——就像不断变化的环境驱动适应一样，AI也不断创造新的挑战来推动自身进化。这是Rocktäschel在DeepMind多年研究的领域。
Rainbow Teaming
两个AI共同进化的方式——一个攻击，一个防御，同时从多个角度对抗。在NeurIPS 2024上发表，在所有测试模型中攻击成功率超过90%，对GPT-4o等闭源模型的平均迁移率达50%。目前各大AI研究机构正将其用于安全测试。
Darwin Gödel Machine
AI直接重写自身代码的系统。由Sakana AI和UBC（Jeff Clune参与）发表，在SWE-bench上性能从20%自主提升至50%。 Recursive正试图将这一研究路线扩展到公司规模。
World Models
Rocktäschel主导的Genie 3是一个通用世界模型，可从文本提示以24fps 720p生成交互式环境。目前也在协助Waymo自动驾驶训练环境的生成。这项技术将被应用于AI自我改进的环境构建。
目标："自主训练系统 Level 1"
第一阶段目标是在AI科学领域构建一个具备5万名博士和医生能力的自主训练系统。之后的路线图是向物理、化学、临床前生物学、电池化学和核聚变物理等领域扩展。