캘린더 확인하고, 뉴스 조사하고, 브리핑 문서까지 만들어줘 — 이 세 가지를 하나의 프롬프트로 끝낼 수 있게 됐어요. OpenAI가 2025년 7월 처음 선보인 ChatGPT Agent가 2026년 3월, GPT-5.4를 탑재하면서 완전히 다른 물건이 됐어요. 별도 서비스였던 Operator는 폐지 예정이고, Deep Research의 분석력도 에이전트 안에 녹아들었어요. 이제 진짜 "하나로 다 되는" AI가 된 거예요.
이게 뭔데?
잠깐 타임라인을 정리할게요. 2025년 1월, OpenAI는 Operator를 출시했어요. AI가 브라우저를 직접 조작하는 서비스였죠. 같은 시기에 Deep Research도 있었어요. 수십 개 소스를 읽고 종합 보고서를 만드는 리서치 특화 기능이었어요. 문제는 — 이 둘이 따로 놀았다는 거예요.
Operator는 웹사이트를 클릭하고 스크롤하는 건 잘했지만, 긴 문서를 읽고 분석하는 건 서툴렀어요. Deep Research는 분석의 달인이었지만, 로그인이 필요한 사이트에는 접근조차 못 했죠. 2025년 7월, OpenAI는 이 두 팀을 합쳐서 ChatGPT Agent를 만들었어요.
그리고 2026년 3월 5일, GPT-5.4가 출시되면서 ChatGPT Agent는 완전히 새로운 단계로 진입했어요. GPT-5.4는 OpenAI의 가장 강력한 프론티어 모델이에요. 추론, 코딩, 에이전트 워크플로우를 하나의 모델에 통합한 최초의 사례고, ChatGPT·API·Codex에 동시 출시된 것도 처음이에요.
핵심 변화는 네이티브 컴퓨터 사용(Computer Use)이에요. GPT-5.4는 화면을 직접 해석하고, 마우스와 키보드를 제어해서 복잡한 워크플로우를 자동화할 수 있어요. 텍스트 브라우저, 비주얼 브라우저, 터미널, API 연동까지 — 모든 도구가 하나의 상태를 공유하면서 매끄럽게 전환돼요.
Sequoia Capital 팟캐스트에서 OpenAI 연구원들이 밝힌 내부 이야기가 인상적이에요. 에이전트를 만든 팀은 놀라울 정도로 작았대요. Deep Research 연구원 3~4명, Operator 연구원 6~8명, 그리고 응용 엔지니어링 팀. 이 작은 팀이 강화 학습(RL)으로 수천 대의 가상 머신에서 다양한 작업을 학습시켰는데, 핵심은 "도구 사용 패턴을 정해주지 않고 모델이 스스로 최적 전략을 찾게 했다"는 거예요.
Operator 폐지 예정
ChatGPT Agent에 가상 브라우저가 내장되면서, 별도로 운영되던 operator.chatgpt.com은 수주 내 폐지 예정이에요. 기존 Operator 사용자는 별도 조치 없이 ChatGPT 에이전트 모드로 전환하면 돼요.
뭐가 달라지는 건데?
기존 ChatGPT Agent(2025년 7월)도 브라우저를 조작할 수 있었어요. 하지만 GPT-5.4 탑재 후 달라진 건 "할 수 있다"에서 "잘한다"로 넘어갔다는 거예요.
| 이전 (GPT-5.2 기반) | 현재 (GPT-5.4 기반) | |
|---|---|---|
| 추론 모델 | GPT-5.2 Thinking + o3 | GPT-5.4 Thinking 단일 모델 |
| 데스크톱 조작 | 웹 브라우저 위주 | 네이티브 컴퓨터 사용 (마우스+키보드) |
| 전문가 수준 업무 | 44개 직종 중 70.9% 일치 | 44개 직종 중 83.0% 일치 (GDPval) |
| 코딩 | 기본 코드 생성 | GPT-5.3-Codex급 코딩 + 프론트엔드 폴리시 |
| 컨텍스트 | 제한적 | 272K 기본, 최대 1M 토큰 |
| 스프레드시트·PPT | 기본 생성 | 편집 가능한 파일 직접 생성·수정 |
| 사고 과정 | 블랙박스 | 사고 계획을 미리 보여주고 사용자가 조정 가능 |
OSWorld-Verified 벤치마크가 상징적이에요. 이건 AI가 실제 데스크톱 환경에서 작업을 수행하는 능력을 측정하는 건데, GPT-5.4가 75%를 찍었어요. 평균적인 사람의 점수(72.4%)를 넘은 거예요. "AI가 컴퓨터를 사람보다 잘 다룬다"는 게 벤치마크로 처음 증명된 셈이에요.
Sequoia Capital의 분석이 정확해요 — "1+1=3"이라고요. Operator의 시각적 웹 조작 능력과 Deep Research의 텍스트 분석·종합 능력이 합쳐지니, 각각이 못 하던 일을 해내는 거예요. 예를 들어 "경쟁사 3곳 분석해서 슬라이드 덱 만들어줘"라고 하면 — 웹사이트를 직접 돌아다니며 데이터를 수집하고(Operator 능력), 수집한 정보를 종합 분석하고(Deep Research 능력), 편집 가능한 프레젠테이션 파일을 생성하는(GPT-5.4 새 능력) 전 과정이 하나로 돌아가요.
아직 알아둘 것
GPT-5.4로 크게 좋아졌지만, 에이전트 작업은 여전히 5~30분이 걸려요. 날짜 선택기(datepicker) 같은 단순 UI에서 헤매는 경우도 있고, 웹사이트마다 다른 레이아웃에 적응하는 건 아직 도전 과제예요. 결제나 이메일 전송 같은 고위험 작업은 반드시 직접 확인하세요.
핵심만 정리: 시작하는 법
- 요금제 확인
GPT-5.4 Thinking은 ChatGPT Plus($20/월), Team, Pro($200/월) 사용자에게 제공돼요. Plus는 월 40회, Pro는 월 400회 에이전트 사용이 가능해요. GPT-5.4 Pro(최고 성능)는 Pro·Enterprise 전용이에요. - 에이전트 모드 진입
ChatGPT 대화창 하단의 도구 드롭다운에서 "agent mode"를 선택하거나,/agent를 입력하면 돼요. 아무 대화에서나 중간에 전환 가능해요. - 앱 커넥터 연결
Google Calendar, Gmail, Google Drive, GitHub 등을 연결하면 "내 캘린더 보고 다음 주 미팅 브리핑해줘" 같은 개인화된 작업이 가능해요. - 첫 작업 맡기기
리서치+정리 조합이 가장 성공률 높아요. "이번 주 AI 뉴스 5개 찾아서 요약표 만들어줘", "경쟁사 A/B/C 가격 비교해서 스프레드시트로 정리해줘" 같은 걸 시도해보세요. - 반복 작업 자동화
완료된 작업의 시계 아이콘을 누르면 매일/매주/매월 반복 예약이 가능해요. "매주 월요일 아침, 경쟁사 뉴스 브리핑"을 자동화해보세요.




