영상 기획, 대본 작성, 나레이션 녹음, 자막 디자인, 편집. 숏츠 하나에 보통 2~3시간 걸리잖아요. 이제 터미널에 주제 하나 치면 끝이에요. AI가 대본부터 최종 영상까지 전부 만들어줍니다.
Gemini 무료 티어 + Edge-TTS(무료) + FFmpeg(무료). 전부 무료로 가능합니다.
이게 뭔데?
숏폼 시장이 미쳤어요. 2024년 기준 약 348억 달러 규모인데, 2032년까지 연평균 30% 이상 성장해서 2,895억 달러에 이를 거라는 전망이에요. 마케터의 90% 이상이 숏폼 광고에서 긍정적 ROI를 경험하고 있다는 통계도 있고요.
근데 문제는, 숏폼 영상을 꾸준히 만드는 게 진짜 고역이라는 거예요. 일주일에 3~5개씩 올려야 알고리즘 타는데, 매번 기획하고 촬영하고 편집하는 건 개인이나 소규모 팀에겐 거의 불가능에 가까워요.
이걸 해결하는 오픈소스 AI 숏츠 자동 생성기들이 쏟아지고 있어요. 핵심 기술은 딱 세 가지예요:
Gemini, GPT-4, DeepSeek 같은 모델이 주제만 주면 영상 스크립트를 자동으로 써요.
Microsoft Edge-TTS가 API 키 없이 300개 이상의 고품질 음성을 제공. Gemini 2.5 네이티브 TTS는 감정 표현까지 가능해요.
FFmpeg의 Ken Burns 효과(이미지가 천천히 줌인/줌아웃되는 그 효과요)로 정적인 이미지를 영상으로 만들어줘요.
2026년 2월, Threads에서 @build_daemon이 공개한 "AI 숏츠 영상 자동 생성기"가 좋아요 328개를 받으며 화제가 됐어요. MoneyPrinterTurbo(49,500 Stars), ShortGPT(7,100 Stars), MCP 연동 Short Video Maker 등 GitHub에도 비슷한 도구들이 이미 여럿 있어요.
뭐가 달라지는 건데?
Runway, Pika, HeyGen 같은 유료 서비스도 있잖아요. 근데 우리가 지금 알아보고 있는 오픈소스 도구는 결이 달라요.
| 유료 SaaS (Runway, Pika 등) | 오픈소스 자동 생성기 | |
|---|---|---|
| 비용 | 월 $8~95 (플랜별) | 무료 (API 비용만 소액 발생) |
| 제어권 | 플랫폼이 정한 템플릿 안에서 | 코드 수준에서 모든 걸 커스터마이징 |
| 영상 스타일 | AI 생성 영상 (실사/애니메이션) | 슬라이드 + 나레이션 + 자막 (정보 전달형) |
| 대량 생산 | 크레딧 제한 있음 | 제한 없음 (로컬 실행) |
| 적합한 콘텐츠 | 광고, 뮤직비디오, 시각 효과 | 정보 전달, 교육, 뉴스, 요약 영상 |
| 기술 난이도 | 웹에서 클릭 몇 번 | Python, 터미널 기본 지식 필요 |
정리하면 이래요. Runway이나 Pika는 "있어 보이는 영상"을 만드는 데 강하고, 오픈소스 도구들은 "매일 꾸준히 찍어내는 영상"을 만드는 데 강해요.
매일 숏츠 올려야 하는 채널 운영자, 블로그를 영상으로 재가공하려는 마케터, 뉴스 요약 콘텐츠를 대량 생산하려는 크리에이터라면 — 오픈소스가 압도적이에요.
주요 도구를 비교해볼게요. 입문자에게는 MoneyPrinterTurbo를 추천해요.
| 프로젝트 | Stars | LLM 지원 | TTS | 특징 |
|---|---|---|---|---|
| MoneyPrinterTurbo | 49.5k | GPT, Gemini, DeepSeek, Qwen 등 12종+ | Edge-TTS, Azure | 웹 UI 제공, 배치 생성, 가장 큰 커뮤니티 |
| ShortGPT | 7.1k | OpenAI | ElevenLabs, Edge-TTS | 30개 언어 지원, 번역 엔진 내장 |
| Short Video Maker | 965 | MCP 연동 (모든 LLM) | Kokoro TTS | MCP/REST API 지원, Docker 배포, 30초 안에 영상 완성 |
| @build_daemon | 신규 | Gemini | 무료 TTS | Ken Burns 효과, 원클릭 자동화, Windows/Mac/Linux |
핵심만 정리: 시작하는 법
커뮤니티가 가장 큰 MoneyPrinterTurbo 기준으로 안내할게요. 다른 도구도 흐름은 비슷해요.
Python 3.10+, FFmpeg, ImageMagick 설치. Mac은 brew install ffmpeg imagemagick, Windows는 각 공식 사이트에서 다운로드.
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
pip install -r requirements.txt
python webui.py
브라우저에서 웹 UI가 열려요.
Google AI Studio에서 Gemini API 키 무료 발급 → 웹 UI 설정에서 입력. TTS는 Edge-TTS 선택하면 완전 무료.
"비트코인 반감기가 뭔지 30초로 설명해줘" 같이 구체적으로 입력. 세로 9:16으로 설정하면 숏츠/릴스에 바로 업로드 가능해요.
CLI를 선호하면 @build_daemon의 프로젝트도 추천해요. Ken Burns 효과의 시네마틱한 느낌이 차별화 포인트예요.




