광고 한 편을 만드는 데 보통 얼마가 들까요. 대형 캠페인이면 1,500만 달러, 작업 기간은 몇 달. 그게 업계 상식이었어요.
그런데 어느 브랜드가 같은 급의 캠페인을 40시간, 2만 달러에 끝냈어요. 비용은 750분의 1, 시간은 단위가 달라졌고요. 게다가 브랜드 내부 품질 검수까지 통과했어요. "AI라 싸구려 티 나겠지"라는 의심을 정면으로 깬 거예요.
이 일을 가능하게 한 도구가 AI 영상 스타트업 Luma가 내놓은 Luma Agents예요. 오늘 이야기의 핵심은 "또 하나의 AI 도구가 나왔다"가 아니라, 크리에이티브 작업의 원가 구조가 통째로 흔들리기 시작했다는 신호라는 점이에요.
왜 지금까지는 이게 안 됐을까
지금까지 AI로 콘텐츠를 못 만들었던 게 아니에요. 오히려 도구가 너무 많은 게 문제였어요. 이미지는 Midjourney, 영상은 Sora, 오디오는 ElevenLabs — 모델마다 프롬프트 문법이 다르고, 결과물을 이어 붙이는 건 결국 사람 몫이었죠.
그래서 정작 시간은 '만드는 데'가 아니라 '도구를 오케스트레이션하는 데' 빠져나갔어요. Luma CEO Amit Jain의 표현을 빌리면, 지금의 크리에이티브 AI는 "모델 100개를 줄 테니 프롬프트를 배워서 알아서 써"라는 방식이었던 거예요. 도구는 늘었는데 사람의 잡일도 같이 늘어난 셈이죠.
Luma Agents는 이 잡일 레이어를 통째로 걷어냈어요. 브리프 하나를 넣으면, 에이전트가 기획하고, 작업 단계마다 가장 적합한 외부 모델을 자동으로 골라 라우팅하고, 텍스트·이미지·영상·오디오를 한 시스템에서 end-to-end로 뽑아내요. 사람이 도구 사이를 오갈 일이 없어지는 거예요.
| 기존 멀티 도구 방식 | Luma Agents | |
|---|---|---|
| 워크플로우 | 도구별 프롬프트 → 결과물 수동 병합 | 브리프 하나로 end-to-end 자동 |
| 컨텍스트 | 도구 전환 시 맥락 유실 | 전체 프로젝트 컨텍스트 유지 |
| 품질 관리 | 사람이 결과물 일일이 검수 | 에이전트가 자체 평가·반복 개선 |
| 모델 선택 | 직접 모델별 장단점 파악 필요 | 자동으로 최적 모델 라우팅 |
| 협업 | 에셋 파일 주고받기 | 멀티플레이어 보드에서 실시간 협업 |
현재 에이전트가 골라 쓰는 외부 모델만 해도 Ray3.14, Google Veo 3, Sora 2, Kling 2.6, Nano Banana Pro, Seedream, GPT Image 1.5, ElevenLabs 등 한 줌이 넘어요. 어떤 모델을 쓸지 고민하는 단계 자체가 사라진 거죠.
"생각하면서 동시에 그린다" — Uni-1의 정체
여기까지만 보면 "여러 모델을 잘 엮은 자동화 툴"처럼 들릴 수도 있어요. 그런데 Luma가 진짜 베팅한 건 그 아래 깔린 아키텍처예요. 이름이 Unified Intelligence, 첫 모델은 Uni-1이에요.
핵심은 이거예요. Uni-1은 언어 토큰과 이미지 토큰을 하나의 시퀀스에서 동시에 처리하는 decoder-only transformer예요. 추론(생각)과 렌더링(그리기)이 따로 도는 게 아니라, 하나의 forward pass 안에서 같이 일어나요.
건축가가 선 하나를 그을 때 구조, 빛, 공간의 흐름을 동시에 시뮬레이션하잖아요. Uni-1도 그렇게 '생각하면서 동시에 그리는' 구조예요. — Amit Jain, Luma CEO
왜 이게 중요하냐면, "이미지 생성기에 LLM을 붙였다"와 "처음부터 같이 사고하도록 설계했다"는 결과물의 일관성에서 차이가 나기 때문이에요. 캠페인 전체에서 톤과 맥락이 흐트러지지 않는 비결이 여기 있어요.
이 베팅의 규모도 만만치 않아요. 2021년 팔로알토에서 시작한 Luma는 지금까지 총 11억 달러를 유치했고, 밸류에이션은 40억 달러예요. 지난해 11월엔 사우디 PIF 자회사 HUMAIN에서 9억 달러를 받아 사우디에 슈퍼클러스터 데이터센터를 짓겠다고 발표했고, 투자사 명단엔 Andreessen Horowitz, NVIDIA, AWS, AMD Ventures가 올라 있어요.
작은 팀이 큰 팀을 이기기 시작했다
맨 앞의 '40시간 캠페인'이 운 좋은 한 건이 아니라는 증거가 더 있어요.
남아프리카의 20명 미만 소규모 에이전시가 마쓰다 MX-5의 80년대·90년대·2000년대 변천사를 담은 캠페인을 2주 만에 완성했어요. 실제 빈티지 차량을 수소문해 소싱하고, 촬영하고, 후반 작업까지 했다면 몇 달은 걸렸을 프로젝트를요. 큰 예산도, 큰 팀도 없는 곳이 대형 에이전시의 결과물을 따라잡은 거예요.
방식이 단순 자동화가 아니라는 점도 눈여겨볼 만해요. 또 다른 글로벌 클라이언트는 마스터 영상을 전통 방식으로 직접 촬영한 뒤, 그걸 Luma로 150개 이상의 시장·언어에 맞춰 현지화했어요. 정리하면 이런 분업이에요.
- 크래프트(감성·핵심 크리에이티브)는 사람이 — 톤을 잡고 브랜드의 손맛을 넣는 일
- 스케일링(변형·현지화·반복)은 AI가 — 150개 버전을 찍어내는 노가다
"AI가 사람을 대체한다"가 아니라 "사람이 잘하는 일과 기계가 잘하는 일을 분리한다" — 이 하이브리드 모델이 Luma가 제안하는 실전 운영법이에요.
그래서, 직접 써보려면
거창한 세팅 없이 30분이면 첫 결과물을 뽑아볼 수 있어요. 순서는 이래요.
- Luma 앱 접속
lumalabs.ai에서 계정을 만들어요. API 접근도 열려 있지만, 처음이면 앱에서 바로 시작하는 게 제일 빨라요. - Brainstorm 모드로 기획부터
"제품 런칭 캠페인 만들어줘" 같은 자연어 한 줄로 시작하면, 에이전트가 아이디어를 넓히고 크리에이티브 방향을 제안해요. 여기선 아직 아무것도 생성하지 않아요. 순수 전략 단계예요. - Create 모드로 전환해 제작
방향이 정해지면 Create로 넘어가요. 이미지·영상·오디오 생성, 모델 선택·라우팅, 반복 개선까지 에이전트가 알아서 굴려요. - 대화로 다듬기
"색감 좀 따뜻하게", "2번 방향으로 가자" — 채팅하듯 피드백하면 컨텍스트를 유지한 채 수정돼요. 프롬프트 엔지니어링을 따로 배울 필요가 없는 게 포인트예요. - 스케일링 & 배포
완성 에셋을 플랫폼·언어·시장별로 변형 생성. 멀티플레이어 보드에서 팀원과 실시간으로 같이 손볼 수도 있어요.
업무용으로 쓰기 전에 확인할 안심 포인트
생성 콘텐츠의 IP를 고객이 100% 보유하고, 저작권 리스크를 자동 검토하며, 사람이 어디서 개입했는지 이력을 문서로 추적해요. 공개 전 필수 휴먼 리뷰 워크플로우도 들어 있어서, 엔터프라이즈 검수 라인에 끼워 넣기 좋아요.
한 줄로 남기자면
Luma Agents의 진짜 뉴스는 기능 목록이 아니에요. "많은 예산 + 큰 팀 + 긴 시간"이라는 크리에이티브의 진입장벽이 "브리프 한 줄 + 작은 팀 + 며칠"로 내려앉기 시작했다는 거예요. 20명짜리 에이전시가 대형 캠페인급 결과물을 2주에 뽑는 시대라면, "우리 팀은 작아서 못 해"라는 변명은 점점 통하지 않게 될 거예요. 오늘 30분만 투자해 첫 결과물을 만들어 보는 게, 이 변화에 올라타는 가장 빠른 방법이에요.




