
2026년 4월 21일, OpenAI가 ChatGPT에 'Images 2.0'을 탑재했습니다. 단순한 업그레이드가 아니에요. 이전까지 AI 이미지 생성의 가장 큰 약점이었던 텍스트 렌더링 문제를 정면으로 해결했거든요. 한국어, 일본어, 힌디어 같은 비라틴 문자를 이미지 안에 정확하게 넣는 게 가능해졌고, 이미지를 생성하기 전에 먼저 '생각'하는 추론 기능(Thinking Mode)까지 탑재됐습니다.
이전 모델에서는 한국어가 포함된 포스터나 카드 이미지를 만들면 글자가 깨지거나 의미 없는 기호로 출력되는 경우가 비일비재했습니다. ChatGPT Images 2.0은 이 부분이 확연히 달라졌다는 게 여러 테크 매체의 공통된 평가예요. TechCrunch는 "텍스트 렌더링에서 깜짝 놀랄 만한 성능을 보여줬다"고 했고, Engadget은 한국어를 포함한 비라틴 문자 지원을 집중 조명했습니다.
무엇이 바뀌었는지, 어떻게 쓰는지, 미드저니와 어떤 상황에서 다르게 쓰는지 — 아래에서 순서대로 정리해뒀습니다. 무료 계정으로도 바로 써볼 수 있으니 직접 따라해보세요.
목차
- DALL-E 3와 무엇이 달라졌나
- ChatGPT Images 2.0 핵심 기능 5가지
- 실제 사용법 — 무료 계정에서 어디까지 되나
- 미드저니 vs ChatGPT Images 2.0 — 상황별 선택 가이드
- 요금제 완전 정리 — 무료부터 Pro까지
- 한국어 이미지 생성, 실제로 얼마나 달라졌나
DALL-E 3와 무엇이 달라졌나
DALL-E 3는 2023년 말부터 ChatGPT의 기본 이미지 생성 도구로 자리 잡았습니다. 그런데 2025년 11월 API에서 공식 deprecated(단종) 처리됐고, 12월에는 ChatGPT 본체에서도 완전히 제거됐죠. 이후 GPT Image 1.5가 잠시 그 자리를 맡았다가, 이번에 Images 2.0이 완전히 새로운 베이스라인으로 등장한 겁니다.
가장 크게 달라진 점은 두 가지로 압축됩니다. 하나는 추론 기능(Reasoning)의 탑재이고, 다른 하나는 텍스트 렌더링 정확도의 대폭 향상입니다. 추론 기능이란 프롬프트를 받으면 즉시 이미지를 만드는 게 아니라, 먼저 어떤 구조로 이미지를 구성할지 계획하고 필요시 웹을 검색한 뒤 생성하는 방식이에요. 인포그래픽이나 복잡한 레이아웃 작업에서 특히 차이가 납니다. 기존 DALL-E 3는 "burrto"처럼 오탈자가 섞인 텍스트를 그대로 이미지에 넣는 경우가 많았지만, Images 2.0은 이런 실수가 대폭 줄었다고 TechCrunch가 보도했습니다.
기술적으로는 모델명이 gpt-image-2로 바뀌었고, 최대 2K 해상도와 3:1부터 1:3까지의 다양한 종횡비를 지원합니다. 단일 프롬프트에서 최대 8장의 연속성 있는 이미지를 한 번에 생성하는 배치 기능도 추가됐습니다.
웹 검색 통합은 Thinking 모드 전용 기능입니다. 실시간 정보를 바탕으로 이미지를 생성할 수 있는데, 무료 계정에서는 사용이 제한됩니다.
ChatGPT Images 2.0 핵심 기능 5가지
OpenAI 공식 자료와 Axios, VentureBeat 등의 보도를 바탕으로, 실무에서 체감 차이가 나는 기능 다섯 가지를 아래 표에 정리했습니다.
| 기능 | 설명 | 실용 활용 예 |
|---|---|---|
| Thinking Mode | 이미지 생성 전 구조 계획 및 추론 수행 | 인포그래픽, 복잡한 슬라이드, 다층 레이아웃 |
| 멀티링궐 텍스트 | 한국어·일본어·힌디어 등 비라틴 문자 정확 렌더링 | 한국어 포스터, 메뉴판, SNS 카드 이미지 |
| 2K 해상도 | 고해상도 출력 지원 | 인쇄용 디자인, 고화질 배너 |
| 다양한 종횡비 | 3:1부터 1:3까지 자유롭게 설정 | 유튜브 썸네일, 세로 피드 콘텐츠, 와이드 배너 |
| 배치 생성 (최대 8장) | 단일 프롬프트로 일관된 이미지 8장 생성 | 캐릭터 일관성 유지, 광고 시리즈, 웹툰 시안 |
이 중에서 실무에서 가장 체감 차이가 큰 것은 멀티링궐 텍스트 렌더링입니다. VentureBeat는 한국어를 포함해 일본어 망가 스타일 이미지, 힌디어 포스터 등을 생성하는 테스트 결과를 공개했는데, 이전 모델 대비 오류율이 현저히 낮았다고 보도했습니다. 텍스트가 이미지에 섞여 들어가는 콘텐츠를 자주 만든다면 가장 즉각적으로 차이를 느낄 수 있는 기능이에요.
배치 생성 기능도 실용적입니다. 쇼핑몰 상품 이미지처럼 같은 제품을 다양한 배경에 놓아야 할 때, "빨간 가방을 배경 5가지로 각각 배치한 이미지"라는 프롬프트 하나로 일관된 이미지 묶음을 얻을 수 있습니다.

실제 사용법 — 무료 계정에서 어디까지 되나
ChatGPT Images 2.0은 2026년 4월 22일부터 모든 ChatGPT 사용자에게 순차적으로 열렸습니다. 무료 계정도 예외가 아닙니다. 다만 접근할 수 있는 기능에 차이가 있어요.
기본 사용 방법은 간단합니다. ChatGPT 대화창에서 이미지를 생성하고 싶은 내용을 프롬프트로 입력하면 됩니다. 특별한 명령어가 필요하지 않아요. 예를 들어 "한국어로 '오늘의 메뉴'라고 적힌 카페 메뉴판 이미지를 만들어줘"라고 입력하면 자동으로 Images 2.0이 동작합니다.
무료 계정에서 주의해야 할 점이 있습니다. Instant 모드만 사용 가능하고, Thinking 모드는 Plus 이상 구독자 전용입니다. Instant 모드는 추론 과정 없이 빠르게 이미지를 생성하는 방식인데, 단순한 이미지나 기본적인 텍스트 삽입은 충분히 처리합니다. 하지만 복잡한 인포그래픽, 데이터 시각화, 다층 레이아웃처럼 구조적 판단이 필요한 작업에서는 Thinking 모드와 체감 차이가 납니다.
또 하나의 제약은 생성 횟수 제한입니다. 무료 계정은 하루 생성 가능한 이미지 수가 제한되어 있고, 집중적으로 이미지 작업을 해야 하는 경우라면 이 한도에 금방 도달할 수 있습니다. 단순한 이미지 한두 장은 무료로 충분히 테스트할 수 있지만, 실무용으로 반복 사용한다면 유료 플랜을 고려하는 것이 현실적입니다.
미드저니 vs ChatGPT Images 2.0 — 상황별 선택 가이드
AI 이미지 생성 도구를 고를 때 가장 많이 나오는 질문이 "미드저니랑 뭐가 달라요?"입니다. 솔직하게 말하면, 두 도구는 잘하는 영역이 다릅니다. 어느 쪽이 무조건 낫다고 말하기 어려운 거예요.
| 비교 항목 | ChatGPT Images 2.0 | Midjourney V7 |
|---|---|---|
| 텍스트 렌더링 | 매우 우수 (한국어 포함) | 제한적 (영어 중심, 비라틴 문자 약함) |
| 예술적 표현력 | 중간 수준 | 탁월 (시네마틱 조명, 회화적 디테일) |
| 프롬프트 순응도 | 높음 (지시 사항을 충실히 따름) | 보통 (예술적 해석 비중 높음) |
| 무료 사용 | 가능 (Instant 모드) | 불가 (최소 $10/월) |
| 기본 요금 | 무료 (제한적), Plus $20/월 | Basic $10/월, Standard $30/월 |
| 워크플로우 | ChatGPT 대화 내에서 바로 사용 | Discord 또는 별도 앱 필요 |
| 배치 생성 | 최대 8장, 일관성 보장 | 4장, Omni Reference로 일관성 유지 |
미드저니는 소셜 미디어 콘텐츠, 일러스트, 컨셉 아트처럼 시각적 아름다움 자체가 목적인 경우에 여전히 압도적입니다. 미드저니 V7의 시네마틱한 조명과 회화적 디테일은 아직 ChatGPT Images 2.0이 넘보기 어려운 영역이에요. 반면 텍스트가 이미지에 포함되어야 하는 작업 — 메뉴판, 한국어 포스터, SNS 카드, UI 목업 — 에서는 ChatGPT Images 2.0이 훨씬 실용적입니다. ChatGPT를 이미 쓰고 있다면 별도 추가 비용 없이 바로 써볼 수 있다는 접근성의 이점도 있고요.
요금제 완전 정리 — 무료부터 Pro까지
ChatGPT Images 2.0의 요금 구조는 ChatGPT 요금제에 통합되어 있습니다. 별도 구독이 필요하지 않아요.
| 요금제 | 월 요금 | Images 2.0 접근 수준 | 주요 제약 |
|---|---|---|---|
| Free | 무료 | Instant 모드만 가능 | 일일 생성 횟수 제한, Thinking 모드 없음 |
| Plus | $20/월 (약 2만 8천 원) | Thinking 모드 포함 | 시간당 이미지 생성 제한 있음 |
| Pro | $200/월 (약 28만 원) | 고급 출력, 우선 접근 | 사실상 제한 없음 |
| API (gpt-image-2) | 사용량 기반 | 개발자용 직접 API 접근 | 이미지당 $0.006~$0.211 (품질별, 1024×1024 기준) |
일반 사용자에게는 Plus 플랜이 현실적인 선택지입니다. 월 $20에 Thinking 모드까지 사용할 수 있고, ChatGPT의 다른 기능들(고급 대화, GPT-5.4 모델 접근 등)도 함께 쓸 수 있으니 이미지만을 위한 구독이 아닌 셈이죠. 이미지 생성만 놓고 보면 미드저니 Basic($10/월)보다 비싸지만, ChatGPT 전체 기능 패키지로 보면 충분히 납득할 수 있는 가격대입니다.
API 요금은 개발자나 이미지를 대량으로 생성해야 하는 비즈니스용입니다. 1024×1024 기준 저화질 이미지 1장당 약 $0.006 수준이며, 중간 화질은 $0.053, 고화질은 $0.211 수준입니다. API는 2026년 5월 초 개발자에게 공개될 예정이라고 OpenAI 측이 밝혔습니다.

한국어 이미지 생성, 실제로 얼마나 달라졌나
한국 사용자에게 가장 직접적으로 관련된 변화는 단연 한국어 텍스트 렌더링입니다. Engadget은 이 부분을 집중 조명하며, ChatGPT Images 2.0이 한국어를 "문자 수준 정확도"로 처리한다고 설명했습니다. 이전까지는 한국어가 포함된 이미지를 생성하면 자음과 모음이 분리되거나 전혀 다른 문자로 대체되는 오류가 빈번했습니다.
실용적으로 어떤 변화가 생겼는지 예를 들면 이렇습니다. "서울 카페 분위기의 메뉴판, 아메리카노 4,500원이라고 적혀 있는 이미지"처럼 구체적인 한국어 텍스트를 지정하면, 실제로 그 문구가 이미지 안에 정확하게 포함됩니다. 이전 모델에서는 "아이아리카노 4500원"처럼 엉뚱한 자모 조합이 나오는 경우가 흔했는데, 이 문제가 상당 부분 해결된 겁니다.
다만 완벽하지는 않습니다. 긴 문장, 세로쓰기 방향, 흘림체(필기체) 스타일의 한국어는 여전히 오류 가능성이 있습니다. Instant 모드에서 복잡한 한국어 텍스트 작업을 하면 Thinking 모드보다 정확도가 떨어질 수 있어요. 따라서 텍스트 정확도가 중요한 실무용 이미지라면 Plus 이상 플랜의 Thinking 모드를 사용하는 것이 안전합니다.
한국에서 ChatGPT 유료 결제는 해외 결제 가능한 신용카드로만 처리됩니다. 카카오페이·네이버페이는 아직 지원하지 않으니, Plus 플랜 가입 전 카드 해외 결제 가능 여부를 미리 확인해두세요.
AI 이미지 생성 도구에서 "한국어가 제대로 된다"는 것은 오랫동안 풀리지 않던 문제였습니다. ChatGPT Images 2.0이 그 첫 번째 실질적인 해법을 내놓은 셈이고, 블로그 썸네일, 인스타그램 카드, 쇼핑몰 배너처럼 한국어 텍스트가 들어가는 일상 이미지 작업에서 이전과는 다른 결과물을 기대할 수 있습니다.
'AI' 카테고리의 다른 글
| GPT-5.5 완벽 가이드: 에이전트 AI 성능 비교와 플랜별 활용법 (0) | 2026.04.24 |
|---|---|
| Google Workspace Gemini 사용법 완벽 가이드 — Docs·Sheets·Meet 핵심 기능 총정리 (0) | 2026.04.23 |
| Claude Code로 프론트엔드 디자인까지? Claude Design 기능 완전 정리 (2026) (1) | 2026.04.22 |
| AI 이미지 생성 도구 2026 완전 비교 — 미드저니, DALL-E, 파이어플라이 선택 가이드 (1) | 2026.04.21 |
| GPT-5.4 Thinking 모드 완벽 가이드 — 사용법·요금제·활용팁 총정리 (1) | 2026.04.21 |