GPT-Image-2로 생성된 이미지 예시 — ChatGPT에서 테스트된 차세대 이미지 모델 결과물

storage.ghost.io

GPT-Image-2가 유출됐다 — 텍스트 렌더링과 세계 지식이 달라진 OpenAI의 차세대 이미지 모델

GPT-Image-2 유출, LM Arena 코드네임, 텍스트 렌더링, 세계 지식, Nano Banana Pro 비교AI 도구

Pieter Levels의 GPT-Image-2 유출 최초 공유 트윗

GPT-Image-2 LMArena 유출 상세 분석 및 프롬프트 가이드

OpenAI Image V2 ChatGPT 및 LM Arena 테스트 현황

OpenAI의 차세대 이미지 모델이 공개도 전에 세상에 나왔습니다. GPT-Image-2가 LM Arena에서 세 개의 코드네임으로 테스트되다 커뮤니티에 발각된 건데요. "이미지 AI가 텍스트를 못 쓴다"는 고질적 한계가 이번에 진짜 풀렸을 수 있어요.

이게 뭔데?

GPT-Image-2는 OpenAI가 준비 중인 차세대 이미지 생성 모델입니다. 아직 공식 발표 전이지만, 2026년 4월 초 LM Arena(AI 모델 블라인드 테스트 플랫폼)에서 maskingtape-alpha, gaffertape-alpha, packingtape-alpha라는 세 가지 코드네임으로 등장했다가 몇 시간 만에 제거됐어요.

개발자 Pieter Levels(@levelsio)가 최초로 이 모델들을 식별하면서 화제가 됐고, 커뮤니티가 캡처한 결과물들이 쏟아져 나왔습니다. 핵심은 두 가지예요:

텍스트 렌더링: 이미지 안에 텍스트를 넣으면 또렷하고 정확하게 표시됨
세계 지식(World Knowledge): 실제 브랜드, 인터페이스, 사물의 구체적인 모습을 정확히 알고 있음

또 GPT-Image-1에서 유저들을 괴롭히던 노란색 필터(yellow tint)도 사라진 것으로 보입니다.

뭐가 달라지는 건데?

비교 항목	GPT-Image-1.5 (현재)	GPT-Image-2 (유출)
아키텍처	4o 기반	완전히 새로운 독립 아키텍처
텍스트 렌더링 정확도	~95%	99%+ (예상)
색감	노란색 틴트 있음	자연색, 노란 필터 제거
포토리얼리즘	높음	사진 수준에 근접
세계 지식	양호	대폭 강화 (브랜드, UI, 손글씨 등)
종횡비 지원	1:1, 3:2, 2:3	16:9 와이드스크린 추가 확인

기존 AI 이미지 모델의 가장 큰 약점은 세 가지였어요: 텍스트가 깨지고, 손이 이상하고, 실제 사물을 정확히 못 그리는 것. GPT-Image-2는 이 세 가지를 동시에 공략한 것으로 보입니다.

커뮤니티가 실제로 만든 것들

블라인드 테스트 중 생성된 이미지들이 커뮤니티에서 공유됐는데, 사람들은 AI가 만든 이미지를 구분하지 못했습니다.

IKEA 매장 야경
실제 사진으로 착각할 수준. 간판 폰트, 조명, 입구 사인까지 정확하게 재현됐어요.
YouTube·Windows 인터페이스
스크린샷으로 오인할 정도의 UI 정확도. 버튼 텍스트, 레이아웃이 실제와 일치했습니다.
의료 손글씨 노트
사람이 직접 쓴 것 같은 필체. 기존 모델에서는 불가능했던 수준이에요.
시계 바늘 테스트
특정 시간을 지정하면 시계 바늘이 정확한 위치를 가리킴. Nano Banana Pro는 이 테스트에서 실패했습니다.
만화책 패널
스파이더맨, 배트맨의 코스튬 디테일과 읽을 수 있는 말풍선까지 정확하게 생성.

왜 이게 "진짜" 달라진 걸까?

기존 GPT-Image-1.5가 4o(GPT-4 Omni) 기반이었다면, GPT-Image-2는 완전히 새로운 아키텍처를 쓰고 있다는 분석이 나옵니다. 아키텍처 자체가 바뀌었기 때문에 단순 업그레이드가 아니라 세대 교체에 가깝다는 거예요.

또 하나 중요한 배경: OpenAI가 2026년 3월 24일 Sora를 종료했습니다. 하루 1,500만 달러의 추론 비용을 감당할 수 없었기 때문인데, 이때 확보된 GPU 자원이 GPT-Image-2 학습과 추론에 재배치된 것으로 추정됩니다.

핵심만 정리: 시작하는 법

GPT-Image-2는 아직 공식 출시 전이지만, 일부 ChatGPT 사용자가 이미 A/B 테스트로 접할 수 있다는 보고가 있어요. 지금 바로 할 수 있는 것들을 정리해볼게요.

GPT-Image-2가 적용됐는지 확인하는 법
프롬프트 끝에 "Format 16:9"을 추가해보세요. 16:9 와이드 이미지가 생성되고, 텍스트가 선명하며, 노란 틴트가 없다면 새 모델에 연결된 것입니다.

복잡한 이미지 생성 반복 시도
ChatGPT Images에서 텍스트가 많은 포스터, 인포그래픽, UI 스크린샷 등을 5~15회 연속 생성하면 새 모델에 연결될 확률이 높아져요.
텍스트 렌더링 활용 케이스 준비
제품 목업, 소셜 미디어 카드, 프레젠테이션 슬라이드 등 텍스트 정확도가 중요한 작업을 미리 리스트업하세요.
경쟁 모델 벤치마크
Nano Banana Pro, Midjourney V7, Ideogram 3.0 등과 같은 프롬프트로 비교 테스트해보면 차이를 체감할 수 있어요.
API 출시에 대비
GPT-Image-1.5 API 기준 고품질 1024x1024 이미지가 $0.133/장. GPT-Image-2는 새 아키텍처 때문에 $0.15~0.20 수준으로 소폭 인상될 가능성이 있어요.

경쟁 구도 한눈에

모델	핵심 강점	GPT-Image-2 대비
Nano Banana Pro	Google 컴퓨팅, 선점 효과	블라인드 테스트에서 GPT-Image-2에 밀린 평가 다수
Midjourney V7	예술적 스타일, 커뮤니티	포토리얼리즘·텍스트 렌더링에서 열세
FLUX Pro	오픈소스, 로컬 배포	세계 지식·복잡 장면 처리에서 차이
Ideogram 3.0	텍스트 렌더링 특화	단일 차원이 아닌 종합력에서 GPT-Image-2가 우위

더 깊이 파고 싶다면

LM Arena 블라인드 테스트 방식

LM Arena는 사용자가 모델 이름을 모르는 상태에서 두 결과물을 비교 평가하는 플랫폼이에요. 마케팅 없이 순수 실력으로 Elo 점수가 매겨지기 때문에, 여기서 높은 점수를 받으면 실제 성능이 검증된 셈입니다. OpenAI는 2025년 12월에도 Chestnut, Hazelnut이라는 코드네임으로 테스트를 거친 뒤 GPT-Image-1.5를 출시한 바 있어요.

Sora 종료와 GPU 재배치

Sora는 2026년 3월 종료됐는데, 피크 시 하루 추론 비용만 1,500만 달러였어요. 전체 수명 동안 인앱 매출은 210만 달러에 불과했고요. Sam Altman은 "차세대 자동화 연구원과 엔터프라이즈 애플리케이션에 컴퓨팅을 집중하겠다"고 밝혔는데, GPT-Image-2가 그 수혜자 중 하나로 보입니다.

다국어 텍스트 렌더링

터키어권 유저들이 GPT-Image-2의 비라틴 문자 렌더링 능력을 테스트했는데, 이전 모델보다 훨씬 정확하게 처리했다는 보고가 있어요. 한국어, 아랍어 등에서도 개선이 기대됩니다.

자주 묻는 질문

GPT-Image-2는 언제 공식 출시되나요?

아직 공식 발표는 없지만, LM Arena 블라인드 테스트와 ChatGPT A/B 테스트 상황으로 볼 때 2026년 4~5월 중 출시될 것으로 예상됩니다. OpenAI는 이전에도 Arena 테스트 후 2~4주 내에 모델을 출시한 전례가 있어요.

GPT-Image-1.5와 가장 큰 차이점은 뭔가요?

세 가지입니다. 첫째, 완전히 새로운 아키텍처(4o 기반이 아님). 둘째, 텍스트 렌더링 정확도가 95%에서 99% 이상으로 향상. 셋째, 노란색 필터가 제거되어 자연스러운 색감을 보여줍니다.

지금 ChatGPT에서 GPT-Image-2를 쓸 수 있나요?

일부 사용자가 A/B 테스트를 통해 접할 수 있다는 보고가 있어요. 텍스트가 많은 복잡한 이미지를 반복 생성하고, 프롬프트 끝에 Format 16:9를 추가하면 새 모델에 연결될 확률이 높아진다고 합니다.

Written by 러쉬

비즈니스와 AI가 만나는 접점을 추적합니다.

이 레퍼런스가 도움이 되셨나요?

매주 엄선된 레퍼런스를 메일로 받아보세요

이 레퍼런스 공유하기

다음 읽을 레퍼런스

다들 AI 쓴다는데 회사는 그대로다 — Bond가 찾은 7.3%의 빈틈

경영진 86%가 매일 AI를 쓰지만 실제 AI-네이티브 자동화는 7.3%뿐이라는 조사 결과와, 그 틈을 겨냥한 YC 스타트업 Bond의 AI 비서 업무자동화 전략을 살펴봐요.

이런 가이드도 추천해요

비슷한 주제의 AI 활용 가이드를 더 살펴보세요

'GPT 래퍼는 다 죽는다' — 그 예측이 $60B 인수 앞에서 무너졌다

d1lamhf6l6yk6d.cloudfront.net

AI 스타트업 해자AI 스타트업 해자, GPT 래퍼, Cursor $60B 인수, 엔터프라이즈 AI 도입, 워크플로우 락인

'GPT 래퍼는 다 죽는다' — 그 예측이 $60B 인수 앞에서 무너졌다

GPT 래퍼는 다 죽는다던 예측이 왜 틀렸는지 a16z가 데이터로 뜯었어요. Cursor의 $60B 인수 뒤에 숨은 AI 스타트업 해자 4가지와 자가진단법을 정리했습니다.

coderabbit.ai

AI 조직 전환AI 코딩 의존성, METR 생산성 연구, CodeRabbit 코드 품질, Uber AI 예산, 개발자 기술 퇴화

"AI 없이는 안 해요" — METR이 재보니 19% 더 느렸다

개발자 절반이 AI 없이는 생산성 연구 참여를 거부했다. METR이 실제로 재보니 AI를 쓴 개발자가 19% 더 느렸다. CodeRabbit 분석과 Uber·Amazon 사례로 확인하는 AI 코딩 의존의 진짜 비용.

pewresearch.org

AI 조직 전환AI 신뢰 역설, Pew Research 2026, AI 채택률, AI 사회적 영향, 브랜드 투명성, AI 공개 의무화

쓸수록 믿지 않는다 — AI 신뢰 역설이 기업 전략에 던지는 실전 경고

AI 챗봇 사용률이 사상 최고(49%)인데 AI가 사회에 긍정적 영향을 미칠 거라 믿는 미국인은 16%뿐입니다. Pew Research 5,119명 조사가 공식화한 AI 신뢰 역설, 그리고 기업 AI 전략에 지금 당장 필요한 투명성 실전 가이드.

다음 →다들 AI 쓴다는데 회사는 그대로다 — Bond가 찾은 7.3%의 빈틈