AI在夜间修复了自己。找到了漏洞,进行了修复,并完成了验证——全程无人参与。OpenAIGPT-5.3 Codex据称已经能够调试自身的训练过程,Anthropic表示Claude的大部分代码现在也是由AI直接编写的。 而现在,一个团队携$650M从隐身模式现身,试图在公司层面完成这个闭环。

3秒概览
创意自动化 实现自动化 验证自动化 递归循环闭合 AI改进AI

这到底是一个什么样的循环?

Recursive Superintelligence于2025年底创立,2026年5月从隐身模式公开亮相,是一家位于旧金山的AI初创公司。 领头人是Richard Socher——前Salesforce首席科学家、You.com创始人,也是最早将深度学习引入NLP主流的研究者。斯坦福博士,引用次数21.5万次,NLP领域引用量排名第四。

但更令人印象深刻的是联合创始人阵容。

  1. Tim Rocktäschel
    UCL教授兼Google DeepMind Open-Endedness团队前总监。Rainbow Teaming论文共同作者,Genie 3世界模型负责人。
  2. Alexey Dosovitskiy
    Vision Transformer(ViT)论文共同作者——第一个将Transformer应用于计算机视觉的人。
  3. Jeff Clune
    进化算法和Open-Endedness领域的先驱。Darwin Gödel Machine(AI自主代码重写)研究相关人物。
  4. Josh Tobin
    OpenAI早期成员,Codex和Deep Research团队负责人。
  5. Yuandong Tian
    Meta FAIR研究总监,DarkForest Go和ELF OpenGo的开发者。

顾问中还有Peter Norvig——AI教科书《Artificial Intelligence: A Modern Approach》的作者,前Google Research总监(任职25年)。 这些名字全都汇聚在一家公司里。

这家公司只做一件事:构建一个AI能够自主完成AI研究全流程的循环——创意生成、实现、验证——全部自动化。Socher这样表述:"我们的核心是构建真正的递归自我改进超级智能,这意味着研究创意的构想、实现和验证全流程都将实现自动化。"

$650M
A轮融资
$4.65B
投后估值
~25人
总员工数

和现有AI研究有什么不同?

当前的AI研究方式是线性的:人类科学家提出假设,设计实验,编写代码,分析结果。AI在各个环节作为辅助工具参与,但闭合循环的仍然是人。

Recursive Superintelligence的目标是让AI自己来闭合这个循环。GV(Google Ventures)的投资逻辑很好地诠释了这一点:"AI是代码,而现在AI可以编写代码。当这两个现实连接起来,自我改进循环就闭合了。"

当前AI研究 递归自我改进
假设生成 人类研究员 AI自主生成
实验实现 人类编写代码 AI自主实现
结果验证 人类分析 AI自主验证
改进方向 交由下一位研究者继承 同一AI递归重复
并行实验 受研究团队规模限制 "5万名博士"级别的并行

迹象其实早已显现。OpenAI的GPT-5.3 Codex被描述为"首个能够调试自身训练、管理自身部署并分析自身评估的模型",Anthropic也表示Claude的大部分代码现在由AI直接编写。 Google DeepMind的AlphaEvolve正被用于在神经网络优化和芯片设计中进化出解决方案。

Recursive是第一个在公司层面将这一趋势明确打包的团队。一家25人的初创公司比任何大型实验室都更直接地将"闭合循环"宣布为自己的商业目标。

核心整理:Recursive正在使用的技术

  1. Open-Endedness
    不是优化固定目标,而是让系统自主生成新目标。灵感来自生物进化——就像不断变化的环境驱动适应一样,AI也不断创造新的挑战来推动自身进化。 这是Rocktäschel在DeepMind多年研究的领域。
  2. Rainbow Teaming
    两个AI共同进化的方式——一个攻击,一个防御,同时从多个角度对抗。在NeurIPS 2024上发表,在所有测试模型中攻击成功率超过90%,对GPT-4o等闭源模型的平均迁移率达50%。 目前各大AI研究机构正将其用于安全测试。
  3. Darwin Gödel Machine
    AI直接重写自身代码的系统。由Sakana AI和UBC(Jeff Clune参与)发表,在SWE-bench上性能从20%自主提升至50%。 Recursive正试图将这一研究路线扩展到公司规模。
  4. World Models
    Rocktäschel主导的Genie 3是一个通用世界模型,可从文本提示以24fps 720p生成交互式环境。 目前也在协助Waymo自动驾驶训练环境的生成。这项技术将被应用于AI自我改进的环境构建。
  5. 目标:"自主训练系统 Level 1"
    第一阶段目标是在AI科学领域构建一个具备5万名博士和医生能力的自主训练系统。 之后的路线图是向物理、化学、临床前生物学、电池化学和核聚变物理等领域扩展。

为什么是现在?

Rocktäschel引用了斯坦尼斯瓦夫·莱姆的"信息壁垒"概念——知识积累速度超过人类处理速度的临界点。Recursive的使命是将AI研究方法论本身自动化,从而突破这道壁垒。Jeff Clune表达道:"我们刚刚转过了那个弯——递归自我改进系统将要改变科学和技术。"