달걀을 깨고, 토마토를 썰고, 피아노를 치고, 루빅스 큐브를 맞췄어요. 사람이 아니라 로봇이요. 더 놀라운 건 이걸 단 하나의 모델로, 실시간으로 해냈다는 거예요.

3초 요약
구현 격차 문제 사람 손 복제 20만 시간 데이터 GENE-26.5 인간 수준 조작 달성

로봇은 왜 달걀도 못 깼을까요

GPT는 인터넷에 올라온 15억~45억 건의 텍스트로 학습했어요. 그럼 로봇은 어디서 배울까요?

여기서 문제가 생겨요. 구글이 RT-1 로봇을 만들 때, 로봇 13대를 17개월 동안 돌려서 얻은 훈련 데이터가 고작 13만 개 궤적이에요. 언어 모델의 수십억 건과 비교하면 사실상 아무것도 없는 거죠. 이걸 구현 격차(Embodiment Gap)라고 불러요. 텍스트는 인터넷에 무한하지만, 로봇이 학습할 "물리 세계 데이터"는 극단적으로 부족한 거예요.

게다가 기존 로봇 손 대부분은 집게 모양이에요. 사람 손은 20개 이상의 관절이 복잡하게 움직이는데, 집게 손가락 2개로는 "달걀을 잡는 법"을 사람 동작에서 직접 배울 수가 없어요. 사람 손→로봇 손으로 데이터를 "번역"하는 과정에서 핵심 정보가 다 날아가 버리거든요.

그래서 손부터 다시 만들었어요

Genesis AI는 2024년 12월, Zhou Xian(카네기멜론 로봇공학 박사)과 Théophile Gervet(전 Mistral AI 연구과학자, CMU AI 박사)이 공동 창업한 스타트업이에요. Khosla Ventures와 Eclipse가 공동 리드한 $1억 500만 시드 라운드를 받았고, 에릭 슈미트(전 구글 CEO)도 투자자 명단에 이름을 올렸어요.

이들의 핵심 주장은 명확해요. "더 나은 모델 = 더 나은 지능. 그러니까 더 나은 모델을 만들려면 하드웨어까지 우리가 직접 통제해야 한다."

Genesis Hand 1.0은 사람 손과 1:1 비율이에요. 20개 능동 자유도, 손끝 힘 15N, 데이터 피드백 1000Hz, 엔드투엔드 지연시간 3ms. 일반 로봇 팔의 지연시간이 80ms 정도니까, 27배 빠른 반응이에요.

20 DOF
능동 자유도 (사람 손과 동일)
3ms
엔드투엔드 지연시간
20만+
멀티모달 학습 데이터 시간

손 모양이 사람과 동일하니까 데이터 글러브도 똑같이 만들 수 있었어요. 사람이 글러브를 끼고 동작하면, 그 동작이 1:1로 로봇에 전달돼요. 번역 과정에서 정보 손실이 없어요. 이 글러브는 기존 텔레오퍼레이션 장비보다 100배 저렴하고, 데이터 수집 효율은 5배 높아요.

풀스택이 실제로 뭘 바꿨냐면요

Genesis AI가 '풀스택(Full Stack)'이라고 부르는 건 하드웨어 + 소프트웨어 단순 조합이 아니에요. 5개 레이어를 전부 자체 통제한다는 의미예요.

  1. 하드웨어 브릿지
    사람 손과 동일 구조의 로봇 손 + 데이터 글러브. Wuji Tech(선전)와 협업해 제조.
  2. 데이터 수집
    20만 시간 이상의 멀티모달 인터랙션 데이터. 에고센트릭 영상 + 인터넷 규모 인간 동작 영상 포함.
  3. 제어 최적화
    자체 미들웨어. 15cm 원 추적 시 오차 2mm (기존 20mm 대비 90% 개선).
  4. 기반 모델 GENE-26.5
    단일 공유 가중치 모델이 요리·피아노·루빅스 큐브를 모두 처리. 대부분 스킬은 로봇 전용 데이터 1시간 미만으로 적응.
  5. 평가 인프라 Genesis World 1.0
    오픈소스 시뮬레이터. 실제 하드웨어와 89% 상관관계, 30분에 2,700시간 분량 평가 가능.

에릭 슈미트가 투자한 이유

"Genesis AI는 로봇공학의 패러다임 전환을 불러오고 있다." — 에릭 슈미트(전 구글 CEO, 투자자)

기존 접근 Genesis 풀스택
로봇 손 2지 그리퍼 20 DOF 사람 손 크기
데이터 수집 비용 $340/hr (텔레오퍼레이션) 100배 저렴한 글러브
동작 번역 손실 모션 리타기팅 필요 1:1 직접 매핑
파인튜닝 속도 수천 에피소드 20초 스킬 → 200 에피소드 미만
평가 속도 실제 로봇 200+ 시간 시뮬레이터 30분

지금 당장 어떻게 연결할 수 있나요

GENE-26.5는 아직 일반 구매 제품이 아니에요. 하지만 이 발표가 중요한 건, 로봇 AI의 가능성 경계가 실제로 이동했기 때문이에요. 구체적으로 무엇을 챙겨야 할지 정리했어요.

  1. 제조·물류 업계라면 ROI 재계산 시점
    텔레오퍼레이션 비용은 2024년 $340/hr에서 2026년 $118/hr로 65% 하락했어요. 로봇 도입 파일럿 비용 가정이 빠르게 바뀌고 있어요. 타당성 검토를 다시 할 시점이에요.
  2. 기술 팔로우: 공식 블로그 + GitHub
    genesis.ai 공식 블로그에서 연구 업데이트를 확인하고, Genesis World 시뮬레이터는 오픈소스로 공개되어 있어요 (github.com/Genesis-Embodied-AI/genesis-world).
  3. 채용·파트너십 기회 주목
    파리, 캘리포니아, 런던 3개 거점에서 60명 규모, 전 지역 채용 진행 중이에요. 유럽-미국 AI·로봇 생태계 접점이 필요하다면 주목할 조직이에요.
  4. 다음 마일스톤: 전신 범용 로봇
    Zhou Xian CEO는 곧 전신(full-body) 범용 로봇 발표가 있을 것이라고 예고했어요. 손에서 시작해 몸통으로 확장하는 로드맵이에요.

아직 주의할 점

GENE-26.5 데모는 통제된 환경의 스킬 증명이에요. Bank of America는 2026년 인간형 로봇 출하를 약 9만 대로 예측하지만, 2030년 120만 대까지 가려면 신뢰성·비용·안전 문제가 여전히 남아 있어요. "언제 실제 현장에 쓸 수 있나"는 아직 열린 질문이에요.