본문 바로가기
AI

GPT-5.5 총정리: 새 기능·성능 비교·가격까지 완벽 해설

by AI 써먹기 2026. 4. 25.
반응형

2026년 4월 23일, OpenAI가 GPT-5.5를 공개했다. 코드명은 "Spud" — 감자라는 뜻인데, 이름과 달리 성능은 가볍지 않다. TechCrunch 보도에 따르면 GPT-5.5는 GPT-4.5 이후 처음으로 기반 모델(base model) 자체를 완전히 새로 학습한 버전이다. GPT-5.1부터 5.4까지는 같은 기반 위에 후처리(fine-tuning)를 더하는 방식이었지만, 이번엔 아키텍처와 사전학습 데이터 구성까지 처음부터 다시 쌓았다.

한국에서 ChatGPT Plus를 사용하는 사람이라면 추가 비용 없이 지금 바로 GPT-5.5를 경험해볼 수 있다. 한국 기준 Plus 요금은 월 약 29,000원으로 이전과 같다. 개발자나 API 사용자라면 이야기가 좀 달라지는데 — 입력 100만 토큰당 $5, 출력 100만 토큰당 $30으로 GPT-5.4 대비 정확히 2배 올랐다. 에이전트 기능 강화, 1M 토큰 컨텍스트 추가, 옴니모달 통합까지. 출시 이틀 만에 확인된 핵심 정보를 한 번에 정리한다.

목차

GPT-5.5가 특별한 이유: 완전 재학습 기반 모델

GPT-5.5를 이전 업데이트들과 구분 짓는 가장 중요한 차이는 "완전 재학습"이다. GPT-5.1, 5.2, 5.3, 5.4는 모두 같은 기반 모델 위에서 특정 능력을 강화하는 방식으로 개선되었다. 비유하자면 같은 엔진에 부품을 교체하는 수준이었다. GPT-5.5는 엔진 자체를 새로 만들었다. ofox.ai의 분석에 따르면 아키텍처가 바뀌고, 사전학습(pre-training) 코퍼스 구성도 전면 개편되었으며, 이는 GPT-4.5 이후 처음 있는 일이다.

가장 눈에 띄는 구조적 변화는 네이티브 옴니모달 처리 방식이다. 이전 모델들이 텍스트, 이미지, 오디오를 별도 파이프라인으로 처리하다가 합쳤다면, GPT-5.5는 처음부터 모든 형식을 하나의 통합 시스템으로 이해하도록 설계되었다. 영상을 보면서 질문하거나, 이미지와 음성을 동시에 분석하는 작업에서 체감 차이가 나는 이유가 여기 있다.

컨텍스트 윈도우도 1M 토큰으로 대폭 늘었다. 토큰이란 AI가 한 번에 처리하는 텍스트 단위인데, 100만 토큰이면 약 750만 자 분량의 문서를 한 번에 읽을 수 있다. GPT-5.4에서 36.6%에 머물던 MRCR v2 벤치마크(100만 토큰 문서 이해력 측정)가 GPT-5.5에서 74.0%로 두 배 이상 뛴 것도 이 구조 변경 덕분이다.

TechCrunch는 이번 출시를 "AI 슈퍼앱으로 가는 한 걸음"이라고 표현했다. 단순한 챗봇에서 복잡한 멀티스텝 업무를 자율 수행하는 방향으로의 전환을 뜻하는 표현이다.

성능 벤치마크: Claude Opus 4.7, Gemini 3.1과 비교하면?

GPT-5.5가 경쟁 모델보다 실제로 나은지 판단하려면 벤치마크 수치를 직접 보는 게 가장 빠르다. 벤치마크는 AI 모델의 능력을 일정한 기준으로 측정한 점수로, 실전 성능과 완전히 일치하진 않지만 좋은 참고 지표가 된다.

벤치마크 GPT-5.5 Claude Opus 4.7 Gemini 3.1 Pro
Terminal-Bench 2.0 (에이전트 작업) 82.7% 69.4% 68.5%
SWE-Bench Pro (실제 코드 수정) 58.6% 64.3% 미공개
GDPval (지식 업무) 84.9%
AI Intelligence Index 60점 57점 57점
MRCR v2 (1M 토큰 이해) 74.0%

(출처: ofox.ai 분석, VentureBeat 보도, Artificial Analysis Intelligence Index 기준)

가장 많은 관심을 받는 코딩 성능에서 결과가 엇갈렸다. 자율 에이전트 방식의 복잡한 다단계 작업을 측정하는 Terminal-Bench에서 GPT-5.5가 82.7%로 압도적으로 앞선다. 반면 실제 GitHub 이슈를 수정하는 능력을 측정하는 SWE-Bench Pro에서는 Claude Opus 4.7이 64.3%로 GPT-5.5(58.6%)를 앞선다.

결론은 용도에 따라 달라진다. 에이전트 방식의 자율 실행 코딩이나 장문 문서 처리라면 GPT-5.5가 유리하고, 정밀한 버그 수정이나 기존 코드 리뷰 작업이라면 Claude Opus 4.7이 아직 강세다. 두 모델을 병행 사용하는 전략이 현실적인 선택이다.

핵심 기능 4가지 상세 해설

GPT-5.5의 핵심 기능 4가지를 실제 사용 시나리오와 함께 설명한다.

에이전트 작업 수행 능력. 에이전트(agentic) 기능이란 AI가 여러 단계의 작업을 스스로 계획하고 실행하는 능력을 말한다. GPT-5.5에 "경쟁사 5곳의 최신 가격 데이터를 수집해서 비교표를 만들어줘"라고 요청하면 웹 검색→데이터 정리→표 작성 단계를 순서대로 처리한다. 중간에 막히면 대안을 찾아가며 완료까지 진행하는 방식이다. 이전 모델에서는 각 단계마다 사용자가 개입해야 했다는 점에서 체감 차이가 크다.

옴니모달 통합 처리. 텍스트, 이미지, 오디오, 비디오를 단일 시스템에서 처리한다. 사진을 찍어 올려 "이 영수증에서 항목별로 정리해줘"라고 하면 문자 인식과 데이터 정리가 동시에 이루어진다. 회의 녹음 파일 요약, 영상 링크 기반 보고서 작성 같은 작업도 자연스럽게 처리된다. 이전 모델들처럼 형식을 먼저 지정할 필요가 없다는 게 실사용에서의 차이다.

토큰 효율 40% 향상. 같은 작업을 수행할 때 GPT-5.4보다 40% 적은 토큰을 소비한다(OpenAI 공식 자료 기준). API 요금이 2배 올랐지만 실제 소비 토큰이 40% 줄었으니, 비용 증가폭은 수치상 2배보다 훨씬 작다. 또한 GPT-5.4와 실사용 응답 지연 속도(latency)가 동일하게 유지된다는 점도 OpenAI 측이 강조한 부분이다.

컴퓨터 직접 제어. OSWorld-Verified 벤치마크에서 78.7%를 기록한 이 기능은 실제 소프트웨어 화면을 보고 클릭·입력을 직접 수행할 수 있다. 엑셀 파일을 열고, 데이터를 정리하고, 저장하는 과정 전체를 AI가 대신 처리하는 방식이다. 현재는 ChatGPT Business 이상 플랜에서 Codex 워크스페이스와 연동해 사용 가능하다.

ChatGPT에서 GPT-5.5 사용하는 방법

GPT-5.5를 직접 써보려면 세 가지 경로 중 하나를 선택하면 된다.

ChatGPT 웹·앱에서 즉시 사용. ChatGPT.com 또는 ChatGPT 모바일 앱에서 로그인 후, 화면 상단 모델 선택 드롭다운에서 "GPT-5.5"를 고르면 된다. Plus 이상 플랜 사용자라면 별도 설정 없이 바로 접근 가능하다. Pro 플랜 사용자는 추가로 "GPT-5.5 Pro"를 선택할 수 있다. 무료 플랜(Free) 사용자는 GPT-5.5에 접근이 안 된다 — 이전 GPT-5.4와 같은 정책이다.

Codex 에이전트 워크스페이스. ChatGPT Business·Enterprise·Edu 플랜 사용자는 Codex 워크스페이스에서 팀 단위 AI 에이전트를 구성할 수 있다. GPT-5.5의 에이전트 기능이 가장 잘 발휘되는 환경이다. 관리자 계정에서 역할 기반 권한을 설정한 뒤 팀원에게 배포하는 방식으로 운영한다. 출시 당시 연구 프리뷰(research preview) 단계로 공개됐으며 접근 기회를 순차적으로 확대하고 있다.

OpenAI API 직접 호출. 개발자라면 API를 통해 직접 연동할 수 있다. 모델 ID는 gpt-5.5 또는 gpt-5.5-pro다. API 배치 처리(Batch API)를 활용하면 표준 요금의 50% 할인이 적용되므로, 대량 처리 업무에는 배치 모드를 먼저 검토하는 것이 유리하다.

실사용 팁 하나. GPT-5.5를 처음 사용할 때 복잡한 작업을 한 프롬프트에 통으로 지시하면 결과가 더 좋다. "A를 완료하면 B를 해줘, 이후 C도 마무리해줘"처럼 연결된 작업을 한 번에 넣으면 GPT-5.5가 스스로 순서를 판단해 실행한다.

GPT-5.5 가격 완벽 정리 (한국 사용자 기준)

ChatGPT 구독과 API 요금을 분리해서 정리한다. 두 가격 체계는 완전히 별개다.

플랜 월 요금 GPT-5.5 접근 주요 특징
Free 무료 불가 GPT-5.4까지 사용 가능
Plus $20 (약 ₩29,000) GPT-5.5 가능 개인 사용자 표준 플랜
Pro $100 GPT-5.5 + Pro 가능 무제한 사용, 최고 성능 모델
Business $30/인 GPT-5.5 + Codex 에이전트 팀 관리 기능 포함

한국에서 ChatGPT Plus를 사용 중이라면 추가 업그레이드 없이 GPT-5.5를 바로 쓸 수 있다. 한국 신용카드 결제 시 월 약 29,000원 수준이다. 해외 결제 수수료(약 1~1.5%)가 붙는 카드도 있으니 결제 전 확인하는 게 좋다.

API 요금 기준으로는 GPT-5.5 표준이 입력 100만 토큰당 $5, 출력 100만 토큰당 $30이다. GPT-5.5 Pro API는 입력 $30, 출력 $180으로 정밀 작업용 프리미엄 옵션이다. GPT-5.4 대비 2배 인상됐지만 토큰 효율이 40% 개선되었기 때문에 동일 작업 기준 실질 비용 증가폭은 약 20% 수준으로 추정된다. 대용량 처리가 필요한 경우 배치 API를 이용하면 표준 요금의 절반으로 동일한 기능을 사용할 수 있다.

GPT-5.5를 쓰기 전 꼭 알아야 할 한계

GPT-5.5가 강력한 모델인 건 분명하지만, 무조건 신뢰하면 곤란한 부분도 있다.

가장 눈여겨봐야 할 부분은 사실 오류 가능성이다. GPT-5.5가 자신 있게 내놓는 정보가 틀린 경우가 있다. 이를 AI 할루시네이션(hallucination)이라고 하는데, ofox.ai의 분석에 따르면 GPT-5.5의 hallucination rate가 상당히 높은 편으로 보고되었다. 공식 수치는 아니므로 참고 수준으로만 받아들이되, 계약서 작성, 의료 정보 확인, 법률 판단처럼 사실 정확도가 중요한 작업에서는 반드시 사람이 직접 검토해야 한다는 원칙은 여전히 유효하다.

코딩 부문의 한계도 있다. 앞서 정리한 것처럼, 실제 코드베이스에서 버그를 수정하는 SWE-Bench Pro 기준으로는 Claude Opus 4.7(64.3%)이 GPT-5.5(58.6%)를 앞선다. 에이전트 방식의 자율 코딩이나 신규 코드 작성에서는 GPT-5.5가 강하지만, 기존 코드의 정밀한 수정이나 버그 리뷰에서는 Claude Opus 4.7이 유리할 수 있다. 코딩이 주 목적이라면 두 모델을 모두 테스트해 보는 걸 권한다.

Pro 플랜 요금 부담도 따져봐야 한다. GPT-5.5 Pro를 쓸 수 있는 ChatGPT Pro 플랜은 월 $100으로 개인 사용자에게 부담이 크다. Plus 플랜($20, 한국 약 ₩29,000)에서도 GPT-5.5 기본 버전은 충분히 사용할 수 있으니, 먼저 Plus에서 한 달 써본 뒤 Pro 업그레이드를 결정하는 게 합리적이다.

GPT-5.5는 OpenAI가 오랜만에 내놓은 진짜 새 모델이다. 에이전트 작업과 긴 문서 처리에서의 성능 도약은 실질적인 업무 적용 가능성을 높였고, 한국의 ChatGPT Plus 사용자라면 추가 비용 없이 지금 당장 경험해볼 수 있다. 단, 중요한 작업에서는 AI 출력물을 그대로 쓰지 말고 반드시 교차 검증하는 습관을 함께 갖추는 게 현명한 활용법이다.

반응형