본문 바로가기
AI

클로드 미토스 총정리: 역대 최강 AI 성능, 비공개 이유, GPT-5.4 비교

by AI 써먹기 2026. 4. 16.
반응형

2026년 3월 26일, 앤트로픽의 콘텐츠 관리 시스템에서 약 3,000건의 미공개 자산이 유출되는 사고가 있었습니다. 이 사고로 세상에 드러난 이름이 바로 클로드 미토스(Claude Mythos)입니다. 앤트로픽이 개발한 역대 가장 강력한 AI 모델이죠. 소프트웨어 코딩, 대학원 수준 과학 문제, 수학 올림피아드까지 전 영역에서 기존 모델을 압도하는 성능을 보여줬습니다.

그런데 4월 7일 공식 발표에서 앤트로픽은 이 모델을 일반에 공개하지 않겠다고 밝혔어요. 사이버보안 능력이 지나치게 뛰어나 악용 위험이 크다는 판단 때문입니다. 미국 연방준비제도와 재무부가 긴급 회의를 소집할 만큼 파장이 상당했어요. 4월 16일 기준, 클로드 미토스의 성능 데이터와 비공개 이유, 경쟁 모델과의 차이까지 짚어봤습니다.

목차

클로드 미토스, 유출에서 공식 발표까지

3월 26일 사건은 앤트로픽의 CMS 설정 오류에서 비롯됐습니다. 업로드된 자산이 기본적으로 '공개' 상태로 설정되면서, 미발행 블로그 자산 약 3,000건이 외부에 노출된 거예요. 이때 드러난 내부 코드명이 캐피바라(Capybara)였습니다.

유출 직후 업계가 술렁였어요. 곳곳에서 벤치마크 수치가 퍼지기 시작했고, 앤트로픽은 2주 뒤인 4월 7일 클로드 미토스 프리뷰를 공식 발표합니다(앤트로픽 공식 블로그 기준). 프로젝트 글래스윙(Project Glasswing)이라는 사이버보안 연합 프로그램도 이때 함께 공개됐죠. 앤트로픽의 설명에 따르면, 미토스는 "전반적으로 강력하면서도 컴퓨터 보안 작업에서 현저히 뛰어난 범용 언어 모델"입니다.

여기서 주목할 점은 '범용 모델'이라는 사실이에요. 사이버보안에 특화해서 만든 게 아닙니다. 코드 작성과 추론 능력이 워낙 향상되다 보니, 취약점 발견과 악용까지 자연스럽게 잘하게 된 거죠.

벤치마크로 확인하는 클로드 미토스의 실력

숫자로 보면 격차가 분명합니다. 소프트웨어 개발 능력을 평가하는 SWE-bench Verified에서 클로드 미토스는 93.9%를 기록했어요. 이전 최강 모델이던 클로드 오푸스 4.6이 80.8%, GPT-5.4가 약 72% 수준이었으니 한 단계가 아니라 두 단계 이상 뛰어넘은 셈이죠.

벤치마크 클로드 미토스 클로드 오푸스 4.6 GPT-5.4
SWE-bench Verified (코딩) 93.9% 80.8% ~72%
GPQA Diamond (과학 추론) 94.6% 77.1% ~90%
USAMO (수학 올림피아드) 97.6% 51.2% -
Cybench (해킹 과제) 100% - -
GraphWalks BFS (장문맥) 80.0% 38.7% 21.4%

대학원 수준의 과학 문제를 푸는 GPQA Diamond에서는 94.6%, 수학 올림피아드 USAMO에서는 97.6%를 달성했습니다. 앤트로픽은 이를 "이전 성능 추세 대비 4.3배 증가"라고 표현했어요(앤트로픽 공식 발표 기준). 단순히 점수가 높은 것을 넘어, 기존 AI 발전 속도의 예측선을 크게 벗어난 '이상치'에 해당하는 성능인 셈입니다.

사이버보안 능력, 왜 세계가 긴장하나

수치가 충격적입니다. 웹 브라우저 파이어폭스의 취약점을 악용하는 테스트에서, 클로드 오푸스 4.6은 수백 번 시도해 겨우 2번 성공했어요. 클로드 미토스는 같은 과제에서 181번 성공합니다. 단순한 성능 차이가 아니라 질적으로 다른 수준이죠.

한 번은 4개의 취약점을 연쇄적으로 엮어 브라우저의 렌더러 샌드박스와 OS 샌드박스를 모두 탈출하는 복합 익스플로잇을 스스로 작성하기도 했어요. 보안 전문가도 며칠이 걸리는 작업입니다.

영국 AI 안전 연구소(AISI)가 독립적으로 실시한 평가 결과도 눈에 띕니다. 32단계로 구성된 기업 네트워크 공격 시뮬레이션 'TLO'에서, 미토스 프리뷰는 10회 시도 중 3회를 처음부터 끝까지 완주했어요. 인간 전문가에게 약 20시간이 걸리는 이 과제를 완주한 AI는 미토스가 처음이거든요(영국 AISI 평가 보고서 기준). 차선 모델인 오푸스 4.6은 평균 16단계에서 멈췄습니다.

앤트로픽 내부에서도 예상 밖의 결과가 나왔어요. 보안 교육을 받지 않은 일반 엔지니어가 미토스에게 "밤새 원격 코드 실행 취약점을 찾아달라"고 요청했는데, 다음 날 아침 완성된 익스플로잇이 준비되어 있었죠. 27년 된 OpenBSD 버그와 16년 된 FFmpeg 취약점까지 자동으로 발견한 사례도 보고됐습니다.

프로젝트 글래스윙, 방어를 위한 AI 연합

앤트로픽이 미토스를 비공개로 유지하면서 선택한 방식이 프로젝트 글래스윙입니다. 마이크로소프트, 아마존, 구글, 애플, 시스코, 엔비디아, 리눅스 재단, JP모건체이스 등이 참여하는 대규모 사이버보안 연합이에요.

목표는 명확합니다. 미토스의 취약점 탐지 능력을 '공격'이 아닌 '방어'에 활용하겠다는 거죠. 실제로 미토스가 발견한 취약점의 99% 이상이 아직 패치되지 않은 상태라, 보안 전문가의 수동 검증을 거쳐 최대 135일(90일 + 연장 45일)의 책임 있는 공개 절차를 따릅니다.

접근 권한은 극도로 제한적이에요. 약 50개 기업만 프로젝트 글래스윙을 통해 미토스를 사용할 수 있습니다. 가격도 입력 토큰 기준 25달러, 출력 토큰 기준 125달러(백만 토큰당)로 오푸스 4.6의 5배에 달하죠. 일반 사용자가 API로 접근하는 것은 불가능합니다.

미국 정부도 사태를 심각하게 받아들였어요. 연방준비제도와 재무부가 긴급 회의를 열어 미토스로 인한 사이버 리스크를 논의했고, 금융기관에 관련 위험을 인지하도록 권고했습니다(CNBC 보도 기준).

GPT-5.4와 비교하면 어떤 차이가 있을까

현재 일반 사용자가 쓸 수 있는 최강 모델은 OpenAI의 GPT-5.4입니다. 클로드 미토스와 직접 비교하면 어떨까요.

비교 항목 클로드 미토스 GPT-5.4
코딩 (SWE-bench) 93.9% ~72%
과학 추론 (GPQA) 94.6% ~90%
장문맥 (GraphWalks) 80.0% 21.4%
컴퓨터 활용 (OSWorld) 79.6% 75%
가격 (백만 토큰당) $25 / $125 $2.50 / $10
접근성 제한 공개 (~50개사) 전면 공개

코딩과 추론에서는 미토스의 우위가 압도적이에요. SWE-bench Verified 기준 93.9% 대 약 72%로 20%p 이상 차이가 납니다. 장문맥 처리 능력에서도 격차가 뚜렷하죠. GraphWalks BFS 벤치마크에서 미토스는 80%, GPT-5.4는 21.4%를 기록해 약 4배 차이를 보였습니다.

반면 GPT-5.4가 앞서는 영역도 있어요. 컴퓨터 활용 테스트인 OSWorld에서 75%로 강세를 보이고, 전문 직무 평가에서도 높은 점수를 받았거든요. 무엇보다 GPT-5.4는 누구나 API를 통해 바로 쓸 수 있고, 가격도 백만 토큰당 2.5달러/10달러로 미토스의 10분의 1 수준입니다.

OpenAI도 사이버보안 분야에서 대응에 나섰어요. 4월 14일 GPT-5.4-Cyber를 발표해, 방어적 사이버보안에 특화된 모델을 보안 전문가에게 제공하기 시작했습니다. 미토스가 촉발한 'AI 보안 경쟁'이 본격화된 셈이죠.

현실적으로 보면, 지금 당장 AI 모델이 필요한 사용자에게 GPT-5.4나 클로드 오푸스 4.6이 실질적인 선택지인 셈이에요. 미토스는 성능이 월등하지만 접근 자체가 불가능하니까요.

 

일반 사용자에게는 어떤 의미가 있을까

클로드 미토스 자체는 쓸 수 없지만, 간접적인 영향은 분명합니다. 앤트로픽은 향후 클로드 오푸스 모델에 미토스에서 개발한 보안 장치를 이식할 계획이라고 밝혔어요. 위험한 출력을 감지하고 차단하는 새로운 안전 시스템을, 미토스보다 위험이 낮은 모델에서 먼저 테스트하겠다는 방침이죠.

경쟁사도 움직이고 있습니다. OpenAI는 GPT-5.4-Cyber를 발표했고, 구글 역시 Gemini 3.1 Pro에서 보안 관련 기능을 강화하는 중이죠. AI 업계 전체가 '보안 AI'를 새로운 경쟁 전선으로 삼고 있는 상황입니다.

한국 사용자 입장에서 주목할 부분은 미토스의 기반 기술이 일반 클로드 모델에 녹아들 가능성이에요. 코딩과 추론 성능이 대폭 향상된 차기 클로드 모델이 공개 버전으로 나온다면, 업무에 클로드를 활용하는 사람들에게 체감할 수 있는 성능 향상을 가져다줄 수 있거든요. 미토스가 증명한 것은 AI 성능의 천장이 우리 예상보다 훨씬 높다는 사실이기도 합니다.

클로드 미토스는 AI가 사이버보안의 판도를 바꿀 수 있음을 처음으로 증명한 모델입니다. 너무 강력해서 공개를 못 한다는 앤트로픽의 결정이 옳은지에 대해서는 전문가마다 의견이 갈려요. 하지만 한 가지는 분명합니다. AI의 보안 능력이 이 속도로 발전한다면, 소프트웨어를 만들고 지키는 방식 자체가 근본적으로 달라질 거라는 점이죠. 앤트로픽이 밝힌 대로, 지금은 방어자가 먼저 준비할 시간을 버는 것이 가장 시급한 과제입니다.

반응형