Recursive Superintelligence — AI 재귀적 자기개선 루프

techcrunch.com

AI가 밤새 자기 자신을 고쳤다 — $650M이 걸린 '재귀적 자기개선 루프'의 시작

재귀적 자기개선, Recursive Superintelligence, 리처드 소처, 오픈엔드니스, 레인보우 팀잉AI 조직 전환

What happens when AI starts building itself?

Recursive Superintelligence raises $650M to build self-improving AI models

Richard Socher's new AI startup wants to build recursively self-improving AI

AI가 밤새 자기 자신을 고쳤어요. 버그를 찾고, 수정하고, 검증까지 — 사람 없이. 이미 OpenAI의 GPT-5.3 Codex는 자기 훈련을 디버깅하고, Anthropic의 Claude는 코드의 대부분을 AI가 직접 쓴다고 해요. 그리고 이 루프를 처음으로 하나의 회사 단위로 닫으려는 팀이 스텔스에서 나왔습니다. $650M 들고.

3초 요약

아이디어 자동화 → 구현 자동화 → 검증 자동화 → 재귀 루프 완성 → AI가 AI를 개량

이게 어떤 루프인 건데?

Recursive Superintelligence는 2025년 말 창립, 2026년 5월에 스텔스에서 나온 샌프란시스코 기반 AI 스타트업이에요. 리더는 Richard Socher — Salesforce 최고 과학자 출신이자 You.com 창업자로, NLP에 처음으로 딥러닝을 주류화한 연구자예요. 스탠퍼드 박사, 21만 5천 건 인용, NLP 분야 인용수 4위.

근데 더 인상적인 건 공동창업자 라인업이에요.

Tim Rocktäschel
UCL 교수 겸 Google DeepMind 오픈엔드니스 그룹 前 디렉터. Rainbow Teaming 논문 공저자, Genie 3 월드모델 리드.
Alexey Dosovitskiy
Vision Transformer(ViT) 논문 공저자. 컴퓨터 비전에서 트랜스포머를 처음 써먹은 사람.
Jeff Clune
진화 알고리즘·오픈엔드니스 분야 선구자. Darwin Gödel Machine(AI 자율 코드 재작성) 연구 관련자.
Josh Tobin
OpenAI 초기 입사자, Codex·딥 리서치 팀 리드.
Yuandong Tian
Meta FAIR 연구 디렉터, DarkForest Go·ELF OpenGo 개발자.

어드바이저로 Peter Norvig까지 — AI 교과서 《Artificial Intelligence: A Modern Approach》의 저자이자 구글 리서치 전 디렉터(25년 근무). 한 회사에 이 이름들이 다 들어가 있어요.

이 회사가 하려는 건 딱 하나예요. AI 연구의 전 과정 — 아이디어 생성, 구현, 검증 — 을 AI가 자율로 수행하는 루프를 만드는 거예요. Socher는 이렇게 표현했어요: "우리의 핵심은 진정한 재귀적 자기개선 초지능을 구축하는 것이고, 그 의미는 연구 아이디어의 이상화·구현·검증 전 과정이 자동화된다는 거예요."

$650M

시리즈 A 펀딩

$4.65B

포스트머니 밸류에이션

~25명

전체 직원 수

기존 AI 연구와 뭐가 다른 건데?

현재 AI 연구 방식은 사람 과학자가 가설을 세우고, 실험을 설계하고, 코드를 짜고, 결과를 분석하는 선형 구조예요. 각 단계에 AI가 보조로 들어오긴 하지만, 루프를 닫는 건 여전히 사람이죠.

Recursive Superintelligence가 노리는 건 이 루프를 AI 자신이 닫는 거예요. GV(Google Ventures)의 투자 논리가 이걸 잘 설명해요: "AI는 코드고, 이제 AI가 코딩할 수 있어요. 이 두 현실이 연결되면 자기개선 루프가 닫힙니다."

	현재 AI 연구	재귀적 자기개선
가설 생성	사람 연구자	AI가 자율 생성
실험 구현	사람이 코딩	AI가 자율 구현
결과 검증	사람이 분석	AI가 자율 검증
개선 방향	다음 연구자가 이어받음	같은 AI가 재귀적으로 반복
병렬 실험	연구팀 규모에 한계	"50,000명 박사" 수준 병렬

이미 징조는 있었어요. OpenAI의 GPT-5.3 Codex는 "자기 자신의 훈련을 디버깅하고 배포를 관리하며 평가를 분석한 최초의 모델"이라고 설명됐고, Anthropic에선 Claude 코드의 대부분을 AI가 직접 쓰고 있다고 해요. Google DeepMind의 AlphaEvolve는 신경망 최적화와 칩 설계에서 솔루션을 진화시키는 데 쓰이고 있어요.

Recursive는 이 흐름을 회사 단위로 처음 명시적으로 패키지화한 거예요. 직원 25명짜리 스타트업이 빅랩보다 더 직접적으로 "루프 닫기"를 사업 목표로 선언한 셈이에요.

핵심만 정리: Recursive가 쓰는 기술들

오픈엔드니스(Open-Endedness)
고정된 목표를 최적화하는 게 아니라, 시스템 스스로 새로운 목표를 생성하는 방식이에요. 생물 진화에서 영감을 받았고 — 환경이 계속 바뀌면서 적응을 유도하는 것처럼, AI도 끊임없이 새로운 과제를 만들어서 자신을 밀어붙여요. Rocktäschel이 DeepMind에서 수년간 연구한 분야예요.
레인보우 팀잉(Rainbow Teaming)
두 AI가 공진화하는 방식이에요 — 하나는 공격하고 하나는 방어하면서 동시에 여러 각도에서 맞붙어요. NeurIPS 2024에 발표됐고, 테스트 모델 전체에서 90% 이상 공격 성공률, GPT-4o 같은 클로즈드 모델에도 평균 50% 전이율. 지금 주요 AI 연구소들이 안전성 테스트에 쓰고 있어요.
Darwin Gödel Machine
AI가 자기 코드를 직접 재작성하는 시스템이에요. Sakana AI와 UBC(Jeff Clune 참여)가 발표한 연구로, SWE-bench에서 20% → 50%로 성능이 자율 향상됐어요. Recursive는 이 계열의 연구를 회사 규모로 확장하려는 셈이에요.
World Models(세계 모델)
Rocktäschel이 이끈 Genie 3는 텍스트 프롬프트에서 인터랙티브 환경을 24fps 720p로 생성하는 범용 월드 모델이에요. Waymo 자율주행 훈련 환경 생성에도 협력 중이에요. 이 기술이 AI 자기개선 환경 생성에 적용돼요.
목표: "자율 훈련 시스템 Level 1"
첫 단계 목표는 AI 과학 분야에서 5만 명의 박사·의사에 상당하는 능력을 가진 자율 훈련 시스템 구축이에요. 그다음은 물리, 화학, 전임상 생물학, 배터리 화학, 핵융합 물리학으로 도메인 확장이 로드맵이에요.

왜 지금인가?

Rocktäschel은 Stanisław Lem의 "정보 장벽" 개념을 인용해요 — 지식 축적 속도가 인간이 처리할 수 있는 속도보다 빠르게 커지는 임계점. Recursive의 미션은 AI 연구 방법론 자체를 자동화해서 이 장벽을 돌파하는 거예요. Jeff Clune은 "재귀적 자기개선 시스템이 과학·기술을 바꿀 코너를 막 돌았다"고 표현했어요.

🔗