AI動画を1秒生成するのに$0.10。Veo、Kling、Luma、Runwayが採用しているグローバル標準価格です。30秒の商品広告動画で$3、学校の授業用5分クリップなら$30を超えます。

Peak XV(旧Sequoia India)のマネージングディレクターがはっきりと言いました。「現在のAI動画モデルは、インドの人口規模での活用には高すぎる。」

だからインドが自分たちで作りました。Varya。1秒あたり₹0.48、つまり約$0.005。グローバルツールの20分の1の価格です。

3秒まとめ
Wan 2.2ベースに蒸留 50ステップ → 4ステップ $0.005/秒(20倍安い) インド文化を認識 AIKoshでオープンウェイト公開

なぜグローバルAI動画はインド規模では使えなかったのか

グローバルAI動画ツールの価格構造を見れば、問題は明らかです。

モデル 価格($/秒) 30秒動画のコスト
Sora 2 (OpenAI) $0.75 $22.50
Veo 3.1 (Google) $0.15+ $4.50+
Kling 3.0 (Kuaishou) ~$0.10 ~$3.00
Runway Gen-4.5 $0.10+ $3.00+
Varya (Avataar AI) $0.005 $0.15

この価格差を現実のシナリオに当てはめると、問題がより鮮明になります。インドの農村部の学校がAI動画で授業資料を作ったり、中小企業が商品広告動画を制作したりするとき、グローバルモデルは経済的にほぼ不可能でした。問題は価格ではなく、アクセシビリティだったんです。

2つ目の壁は文化です。グローバルモデルは西洋中心のデータで訓練されています。インドの多様な祭りの衣装、地域の建築様式、料理、公共空間を正確に表現できませんでした。「ホーリー祭のシーン」とプロンプトを入れると、ステレオタイプ的な結果が返ってきました。

蒸留で50ステップを4ステップに圧縮 — 技術が価格を変えた

Avataar AIがVaryaを作ったのは、ゼロからではありません。アリババのオープンソースモデルWan 2.2(140億パラメータ)をベースに、蒸留(distillation)技術を適用しました。蒸留とは、大きなモデルの核心能力をより軽量で高速なバージョンに圧縮する手法です。

結果として、VaryaはWan 2.2の50ステップを4ステップに削減しました。NVIDIA H200 GPUで5秒の720pクリップを45秒で生成できます。同じ作業にWan 2.2は1,230秒かかっていました。この速度の差がそのまま価格の差になるんです。

4ステップ
生成ステップ数(Wan 2.2比 50→4)
45秒
5秒720p動画の生成時間
20倍
グローバルツール比のコスト削減

インド政府の役割も見逃せません。India AI Missionは38,000台以上のGPU(NVIDIA H100・H200含む)を、スタートアップ向けに時間あたり₹65(約$0.78)の補助価格で提供しています。 商用クラウド(AWS、Azure)の₹300〜600/時間と比べると、実質的にコンピュート費用の壁が取り除かれています。Avataarは選ばれた12社のスタートアップの1つとして、この補助インフラを使ってVaryaを開発しました。

CEOの一言

Avataar CEOスラヴァンス・アルルはVaryaをこう定義しました:「手頃なAIは包括的なAIだ。」MeitY長官S.クリシュナンも「世界水準でありながら人口規模でアクセス可能なフルーガル・イノベーション」と称えました。

文化を理解するモデルがなぜ武器になるのか

Varyaの優位性は価格だけではありません。訓練データをインド文化向けにキュレーションすることで、地域の祭り、衣装、建築、料理、公共空間を正確に生成できます。

グローバルAI動画モデル Varya
インドの祭り表現 ステレオタイプ的な結果 地域の祭り・衣装を正確に認識
建築スタイル 西洋中心の訓練データ インドの地域建築様式を反映
料理・日常生活 不正確または不自然な表現 現地の料理・公共空間を正確に表現
価格 $0.10+/秒 $0.005/秒(20倍安い)
公開方式 クローズドAPI オープンウェイト(セルフホスト可)

AIKoshポータルでオープンウェイトとして公開されることも重要です。開発者や企業が訓練データも含めてダウンロードし、自前の環境でホストしたりファインチューニングしたりできます。HighsfieldとAdobe Fireflyとのパートナーシップも発表されました。

AIツールの競争力が「最高品質」から「誰が特定の市場を設計基準にするか」に移行しています。インドだけの話ではありません。韓国語特化、東南アジア文化特化、アラビア語特化のモデルが同じ方式で登場できる公式を、Varyaが初めて示しました。

Varyaを今すぐ使ってみる

  1. ウェブで試す
    Avataar AI公式サイト(avataar.ai)でテキストプロンプトまたは参照画像から動画生成を体験できます。インド文化に関係なく、一般的な動画生成にも使えます。
  2. オープンウェイトモデルをダウンロード
    AIKosh(indiaai.gov.in)でVaryaのモデルウェイトと訓練データをダウンロードできます。自前のGPU環境でホストしたり、特定ドメイン向けにファインチューニングしたりすることが可能です。
  3. APIで本番連携
    Avataarのホスティングサービスを通じてAPIで連携すると、1秒あたり₹0.48($0.005)の料金で本番パイプラインに組み込めます。グローバルツール比20倍安いため、大量動画生成ワークフローに特に有利です。
  4. パートナーツール経由でアクセス
    Higgsfield、Adobe Fireflyとの連携が確定しています。これらのツールをすでに使っているなら、Varyaがその中で統合される予定です。

現時点での制限事項

Varyaの現在の最大解像度は720pです。4KまたはQuality 2K制作にはVeo 3.1やSeedance 2.0の方が適しています。グローバル最高モデルとの直接品質比較ベンチマークはまだ公開データが限られています。