AI在夜间修复了自己。找到了漏洞,进行了修复,并完成了验证——全程无人参与。OpenAI的GPT-5.3 Codex据称已经能够调试自身的训练过程,Anthropic表示Claude的大部分代码现在也是由AI直接编写的。 而现在,一个团队携$650M从隐身模式现身,试图在公司层面完成这个闭环。
这到底是一个什么样的循环?
Recursive Superintelligence于2025年底创立,2026年5月从隐身模式公开亮相,是一家位于旧金山的AI初创公司。 领头人是Richard Socher——前Salesforce首席科学家、You.com创始人,也是最早将深度学习引入NLP主流的研究者。斯坦福博士,引用次数21.5万次,NLP领域引用量排名第四。
但更令人印象深刻的是联合创始人阵容。
- Tim Rocktäschel
UCL教授兼Google DeepMind Open-Endedness团队前总监。Rainbow Teaming论文共同作者,Genie 3世界模型负责人。 - Alexey Dosovitskiy
Vision Transformer(ViT)论文共同作者——第一个将Transformer应用于计算机视觉的人。 - Jeff Clune
进化算法和Open-Endedness领域的先驱。Darwin Gödel Machine(AI自主代码重写)研究相关人物。 - Josh Tobin
OpenAI早期成员,Codex和Deep Research团队负责人。 - Yuandong Tian
Meta FAIR研究总监,DarkForest Go和ELF OpenGo的开发者。
顾问中还有Peter Norvig——AI教科书《Artificial Intelligence: A Modern Approach》的作者,前Google Research总监(任职25年)。 这些名字全都汇聚在一家公司里。
这家公司只做一件事:构建一个AI能够自主完成AI研究全流程的循环——创意生成、实现、验证——全部自动化。Socher这样表述:"我们的核心是构建真正的递归自我改进超级智能,这意味着研究创意的构想、实现和验证全流程都将实现自动化。"
和现有AI研究有什么不同?
当前的AI研究方式是线性的:人类科学家提出假设,设计实验,编写代码,分析结果。AI在各个环节作为辅助工具参与,但闭合循环的仍然是人。
Recursive Superintelligence的目标是让AI自己来闭合这个循环。GV(Google Ventures)的投资逻辑很好地诠释了这一点:"AI是代码,而现在AI可以编写代码。当这两个现实连接起来,自我改进循环就闭合了。"
| 当前AI研究 | 递归自我改进 | |
|---|---|---|
| 假设生成 | 人类研究员 | AI自主生成 |
| 实验实现 | 人类编写代码 | AI自主实现 |
| 结果验证 | 人类分析 | AI自主验证 |
| 改进方向 | 交由下一位研究者继承 | 同一AI递归重复 |
| 并行实验 | 受研究团队规模限制 | "5万名博士"级别的并行 |
迹象其实早已显现。OpenAI的GPT-5.3 Codex被描述为"首个能够调试自身训练、管理自身部署并分析自身评估的模型",Anthropic也表示Claude的大部分代码现在由AI直接编写。 Google DeepMind的AlphaEvolve正被用于在神经网络优化和芯片设计中进化出解决方案。
Recursive是第一个在公司层面将这一趋势明确打包的团队。一家25人的初创公司比任何大型实验室都更直接地将"闭合循环"宣布为自己的商业目标。
核心整理:Recursive正在使用的技术
- Open-Endedness
不是优化固定目标,而是让系统自主生成新目标。灵感来自生物进化——就像不断变化的环境驱动适应一样,AI也不断创造新的挑战来推动自身进化。 这是Rocktäschel在DeepMind多年研究的领域。 - Rainbow Teaming
两个AI共同进化的方式——一个攻击,一个防御,同时从多个角度对抗。在NeurIPS 2024上发表,在所有测试模型中攻击成功率超过90%,对GPT-4o等闭源模型的平均迁移率达50%。 目前各大AI研究机构正将其用于安全测试。 - Darwin Gödel Machine
AI直接重写自身代码的系统。由Sakana AI和UBC(Jeff Clune参与)发表,在SWE-bench上性能从20%自主提升至50%。 Recursive正试图将这一研究路线扩展到公司规模。 - World Models
Rocktäschel主导的Genie 3是一个通用世界模型,可从文本提示以24fps 720p生成交互式环境。 目前也在协助Waymo自动驾驶训练环境的生成。这项技术将被应用于AI自我改进的环境构建。 - 目标:"自主训练系统 Level 1"
第一阶段目标是在AI科学领域构建一个具备5万名博士和医生能力的自主训练系统。 之后的路线图是向物理、化学、临床前生物学、电池化学和核聚变物理等领域扩展。
为什么是现在?
Rocktäschel引用了斯坦尼斯瓦夫·莱姆的"信息壁垒"概念——知识积累速度超过人类处理速度的临界点。Recursive的使命是将AI研究方法论本身自动化,从而突破这道壁垒。Jeff Clune表达道:"我们刚刚转过了那个弯——递归自我改进系统将要改变科学和技术。"




