AI 영상 1초를 만드는 데 $0.10. Veo, Kling, Luma, Runway가 채택한 글로벌 표준가예요. 30초 제품 광고 영상 하나에 $3, 학교 수업용 5분 클립이라면 $30이 넘어요.

Peak XV(구 Sequoia India)의 MD가 그걸 직접 지적했어요. "현재 AI 영상 모델들은 인도의 인구 규모 활용엔 너무 비싸다."

그래서 인도가 직접 만들었어요. Varya. 1초당 ₹0.48, 즉 약 $0.005. 글로벌 도구의 20분의 1 가격이에요.

3초 요약
Wan 2.2 기반 증류 50단계 → 4단계 압축 $0.005/초 (20배 저렴) 인도 문화 인식 AIKosh 오픈웨이트 공개

왜 글로벌 AI 영상은 인도 규모로 못 쓰나

글로벌 AI 영상 도구들의 가격 구조를 보면 문제가 명확해져요.

모델 가격 ($/초) 30초 영상 비용
Sora 2 (OpenAI) $0.75 $22.50
Veo 3.1 (Google) $0.15+ $4.50+
Kling 3.0 (Kuaishou) ~$0.10 ~$3.00
Runway Gen-4.5 $0.10+ $3.00+
Varya (Avataar AI) $0.005 $0.15

이 가격 차이를 현실에 대입해보면 더 명확해요. 인도 시골 학교가 AI 영상으로 수업 자료를 만들거나, 소규모 자영업자가 제품 광고 영상을 제작할 때 글로벌 모델은 경제적으로 불가능에 가까웠어요. 가격이 아니라 접근성이 문제였던 거예요.

두 번째 장벽은 문화예요. 글로벌 모델들은 서양 맥락으로 훈련돼 있어요. 인도의 다양한 축제 복식, 지역 건축 양식, 음식, 공공 공간을 정확히 표현하지 못했어요. 텍스트 프롬프트로 호리(Holi) 축제 장면을 입력하면 어딘가 어색하거나 스테레오타입에 가까운 결과물이 나왔어요.

증류(Distillation)로 50단계를 4단계로 — 기술이 가격을 바꿨다

Avataar AI가 Varya를 만든 방식은 처음부터 새 모델을 쌓은 게 아니에요. 알리바바의 오픈소스 모델 Wan 2.2(140억 파라미터)를 기반으로 증류(distillation) 기술을 적용했어요. 증류란 큰 모델의 핵심 능력을 더 가볍고 빠른 버전으로 압축하는 기법이에요.

결과적으로 Varya는 영상 생성에 필요한 스텝 수를 Wan 2.2의 50단계에서 4단계로 줄였어요. NVIDIA H200 GPU 기준으로 5초짜리 720p 클립을 45초 안에 생성해요. 같은 작업에 Wan 2.2는 1,230초(약 20분)가 걸렸어요. 이 속도 차이가 바로 가격 차이로 이어져요.

4단계
생성 스텝 (Wan 2.2 대비 50→4)
45초
5초 720p 영상 생성 시간
20배
글로벌 도구 대비 저렴

여기서 인도 정부의 역할도 봐야 해요. India AI Mission은 38,000개 이상의 GPU(NVIDIA H100·H200 포함)를 시간당 ₹65(약 $0.78)의 보조 단가로 스타트업에 제공하고 있어요. 상업 클라우드(AWS, Azure)의 ₹300~600/시간과 비교하면 실질적으로 컴퓨트 비용 장벽이 사라진 거예요. Avataar는 12개 선정 스타트업 중 하나로 이 보조 컴퓨트 인프라를 활용해 Varya를 개발했어요.

인도 AI 미션 CEO의 한 줄

Avataar CEO 스라반스 알루루는 Varya를 이렇게 정의했어요: "저렴한 AI가 곧 포용적인 AI다." MeitY 장관 S. 크리쉬난도 이를 "세계 수준이면서 인구 규모 접근이 가능한 절약적 혁신"이라고 말했어요.

문화를 아는 모델이 왜 무기인가

Varya의 차별점은 가격만이 아니에요. 훈련 데이터를 인도 문화에 맞게 큐레이션해서 지역 축제, 복식, 건축, 음식, 공공 공간을 정확히 생성할 수 있어요.

글로벌 AI 영상 모델 Varya
인도 축제 표현 스테레오타입적 결과 지역 축제·복식 정확 인식
건축 스타일 서양 중심 훈련 데이터 인도 지역별 건축 양식 반영
음식·일상 어색하거나 부정확한 표현 현지 음식·공공 공간 정확 표현
가격 $0.10+/초 $0.005/초 (20배 저렴)
공개 방식 클로즈드 API 오픈웨이트 (자체 호스팅 가능)

오픈웨이트로 AIKosh 포털에 공개된다는 것도 중요해요. 개발자나 기업이 훈련 데이터까지 포함해 다운로드하고 자체 환경에서 호스팅하거나 파인튜닝할 수 있어요. Higgsfield, Adobe Firefly와의 파트너십도 발표됐어요.

AI 도구의 경쟁력이 "최고 품질"에서 "누가 특정 시장을 설계 기준으로 삼느냐"로 이동하고 있어요. 한국어 특화, 동남아 문화 특화, 아랍어 특화 모델이 동일한 방식으로 등장할 수 있는 공식을 Varya가 처음으로 보여줬어요.

Varya 지금 써보는 법

  1. 웹에서 바로 테스트
    Avataar AI 공식 사이트(avataar.ai)에서 텍스트 프롬프트 또는 레퍼런스 이미지로 영상 생성을 체험할 수 있어요. 인도 맥락 없이 일반 영상 생성도 가능해요.
  2. 오픈웨이트 모델 다운로드
    AIKosh(indiaai.gov.in)에서 Varya 모델 가중치와 훈련 데이터를 다운로드할 수 있어요. 자체 GPU 환경에서 호스팅하거나 특정 도메인에 맞게 파인튜닝하는 게 가능해요.
  3. API로 프로덕션 연동
    Avataar의 호스팅 서비스를 통해 API로 연동하면 초당 ₹0.48($0.005) 요금제로 파이프라인에 통합할 수 있어요. 글로벌 도구 대비 20배 저렴해 대량 영상 생성 워크플로우에 특히 유리해요.
  4. 파트너십 도구로 접근
    Higgsfield, Adobe Firefly 연동이 확정됐어요. 기존에 이 도구들을 사용 중이라면 Varya가 그 안에서 통합될 예정이에요.

현재 알려진 한계

Varya는 현재 720p 해상도가 최대예요. 4K·2K가 필요한 고해상도 제작에는 Veo 3.1이나 Seedance 2.0이 더 나은 선택이에요. 글로벌 최고 모델들과의 직접 퀄리티 비교 벤치마크는 아직 제한적이에요.