
프랑스 AI 기업 미스트랄이 2026년 4월 29일 플래그십 모델 Mistral Medium 3.5를 공개하면서 같은 날 Le Chat에 Work 모드(미리보기)를 함께 풀었습니다. 새 모델은 128B 파라미터의 단일 가중치로 채팅·추론·코딩을 모두 처리하고, 256k 토큰의 긴 컨텍스트를 지원합니다. SWE-Bench Verified 77.6%, τ³-Telecom 91.4점이라는 수치는 이전 세대 Claude Sonnet 4.5(SWE-Bench 77.2%)를 살짝 앞서는 정도지만(The Decoder 4월 30일 분석), 가격은 입력 100만 토큰 $1.5·출력 $7.5로 GPT-5.5·Claude Opus 4.7 대비 절반 이하입니다. 가중치가 Modified MIT 라이선스로 풀려 4 GPU 서버에 자체 호스팅이 가능하다는 점도 ChatGPT·Gemini가 줄 수 없는 카드입니다. 무엇이 새롭고, 한국에서 어떻게 써볼 수 있을지 핵심만 추려 정리했습니다.
목차
- 3분 요약: Medium 3.5와 Work 모드의 핵심
- 128B 단일 모델로 통합한 이유 — Magistral·Devstral을 흡수하다
- Le Chat Work 모드는 무엇이 다른가
- Vibe 원격 에이전트와 GitHub·Linear 코딩 워크플로우
- GPT-5.5·Claude Opus 4.7과 1:1 비교
- 한국에서 가입·결제·실제로 쓸 만한가
3분 요약: Medium 3.5와 Work 모드의 핵심
먼저 큰 그림부터 정리합니다. Medium 3.5는 미스트랄이 그동안 따로 공개해온 일반 모델 Medium 3.1, 추론 전용 Magistral, 코딩 특화 Devstral 2를 한 덩어리로 합친 결과물입니다. 사용자는 같은 모델에 reasoning_effort 파라미터만 바꿔 빠른 답변과 깊은 추론을 오갈 수 있죠. 멀티 모델 운영의 비용·복잡도를 한 번에 줄이려는 설계입니다.
Le Chat 쪽 변화도 크게 두 갈래입니다. 채팅창에 새로 생긴 Work 모드는 한 번 던진 지시를 여러 단계에 걸쳐 자율 수행하는 에이전트 모드이고, 별도 제품 Mistral Vibe는 클라우드에서 비동기로 돌아가는 코딩 에이전트입니다. 두 기능 모두 새 Medium 3.5를 두뇌로 사용합니다.
| 항목 | 내용 |
|---|---|
| 출시일 | 2026년 4월 29일 (Public Preview) |
| 모델 크기 | 128B dense, 256k 컨텍스트 |
| API 가격 | 입력 $1.5 / 출력 $7.5 (1M 토큰) |
| 주요 벤치마크 | SWE-Bench Verified 77.6%, τ³-Telecom 91.4 |
| 라이선스 | Modified MIT (대형 매출 기업 제한 조항 포함) |
| 자체 호스팅 | 최소 4 GPU에서 가능 |
| 새 기능 | Le Chat Work 모드, Mistral Vibe 원격 에이전트 |
한국 사용자가 가장 먼저 체감할 변화는 웹·모바일 Le Chat의 Work 모드 토글입니다. Pro·Team·Enterprise 플랜에서 글로벌하게 풀렸고, 미리보기 단계라 일부 커넥터가 시간차로 열리는 중이라고 미스트랄은 안내합니다(Testing Catalog 4월 29일 보도).
128B 단일 모델로 통합한 이유 — Magistral·Devstral을 흡수하다
2025년 말부터 미스트랄은 모델 카탈로그가 너무 갈래졌다는 비판을 받아왔습니다. 일반 채팅용 Medium 3.1, 수학·추론 강화 Magistral, 코딩 전용 Devstral 2가 따로 돌아가니 라우팅·예산 관리가 번거로웠죠. Medium 3.5는 이 셋의 강점을 하나의 가중치 안에 녹여, 호출 시점에 추론 강도만 조절하는 구조로 갈아탔습니다.
아키텍처 자체는 128B dense 모델로, MoE(전문가 혼합) 구조 대신 모든 파라미터를 매 토큰마다 사용하는 전통적 방식입니다. 256k 컨텍스트 창은 책 한 권 분량을 한 번에 넣어도 끊김 없이 답하기에 충분한 크기죠. 미스트랄은 이미지 처리용 비전 인코더도 가변 해상도·종횡비를 직접 다룰 수 있게 새로 만들어 멀티모달 입력을 통합했다고 설명합니다.
벤치마크에서 가장 눈에 띄는 숫자는 SWE-Bench Verified 77.6%입니다. 실제 깃허브 이슈를 받아 코드 변경 PR을 만들어내는 평가에서 Devstral 2와 Qwen3.5 397B A17B를 모두 앞섰지만, 같은 시점 Anthropic Sonnet 4.6(79.6%)에는 한 발 모자랍니다. 에이전트 환경 평가인 τ³-Telecom에서는 91.4점을 기록해 통신 분야 멀티 스텝 작업에 강점을 드러냈습니다(Mistral 공식 블로그 4월 29일).
주목할 점은 라이선스 변경입니다. Mistral은 그동안 모델을 Apache 2.0으로 풀어왔지만, Medium 3.5는 Modified MIT로 바뀌었습니다. 일정 매출 이상의 기업은 별도 상업 라이선스를 받아야 하는 단서가 붙었죠. 그래도 가중치가 Hugging Face에 그대로 올라와 있어 개인 개발자·소규모 팀은 자체 호스팅이 자유롭습니다(Hugging Face 모델 카드).

Le Chat Work 모드는 무엇이 다른가
Le Chat은 그동안 "프랑스판 ChatGPT" 같은 이미지가 강했습니다. 이번 Work 모드 추가로 비로소 ChatGPT의 Tasks·Claude의 Computer Use·Gemini의 Workspace Intelligence와 같은 줄에 서게 됐습니다. 채팅창 좌측 모드 셀렉터에서 Work를 켜면, 한 번의 지시가 여러 단계 도구 호출로 펼쳐지는 에이전트 세션이 시작됩니다.
실제 시나리오를 가정해보죠. 출장 다녀온 다음 날 Le Chat에 "지난주 부재중 메일·캘린더·슬랙을 모두 훑어 우선순위가 높은 답신 5건의 초안을 만들어 두라"고 던집니다. Work 모드는 메일·캘린더·메신저 커넥터를 차례로 호출해 미수신 항목을 모으고, 회의록과 첨부 문서를 요약한 뒤, 답신 초안을 사용자 톤에 맞춰 작성합니다. 마지막에 "이메일을 실제로 발송할지" 같은 민감 행동은 사용자 승인 버튼이 한 번 더 떠야 진행되도록 설계됐습니다.
Mistral은 Work 모드의 작동 원칙으로 세 가지를 강조합니다. 첫째, 세션은 여러 차례 도구 호출과 사용자 응답을 오가도 컨텍스트가 유지됩니다. 둘째, 모든 도구 호출은 화면에 펼쳐 보이고, 메일 발송·결제·파일 삭제 같은 행위에는 명시적 승인 프롬프트가 뜹니다. 셋째, 커넥터는 기본 활성화이지만 사용자가 워크스페이스 단위로 끄거나 권한을 좁힐 수 있습니다.
지원 커넥터는 미리보기 시점 기준으로 메일(Outlook·Gmail)·캘린더·문서·메신저 계열이 우선 풀렸고, 이후 영업 CRM과 코드 저장소를 추가한다는 로드맵이 공유됐습니다(Open Data Science 4월 29일 분석). 이는 ChatGPT의 커넥터, Claude의 MCP 기반 도구와 비슷한 그림입니다. 차이라면 Le Chat Work는 "긴 시간 돌아가는 단일 세션"을 전제로 설계됐다는 점입니다 — ChatGPT Tasks가 짧은 호흡의 단발 자동화에 가깝다면, Work 모드는 한두 시간짜리 워크플로우 한 덩어리를 끌고 가는 데 무게를 둡니다.
Vibe 원격 에이전트와 GitHub·Linear 코딩 워크플로우
이번 발표의 또 다른 축은 별도 제품 Mistral Vibe입니다. 기존에는 Devstral 2를 로컬 CLI에서 돌리는 IDE 도우미 같은 형태였다면, 이번 업데이트로 Vibe는 클라우드에서 비동기로 돌아가는 원격 에이전트가 됐습니다. 개발자는 자기 PC가 꺼져 있어도 GitHub 이슈 라벨링이나 Jira 티켓 정리 같은 작업을 던져두고 결과만 받을 수 있게 됐습니다.
흐름은 이렇습니다. 로컬 CLI에서 작업하던 세션을 한 줄 명령으로 클라우드로 "텔레포트"시키면, 같은 컨텍스트가 격리된 샌드박스에서 이어집니다. 거기서 에이전트는 GitHub·Linear·Jira·Sentry·Slack·Teams 같은 외부 도구를 호출하면서 작업을 마치고, 결과물을 raw 로그가 아닌 풀 리퀘스트 형태로 돌려줍니다. 동시에 여러 작업을 병렬로 띄울 수 있다는 점이 핵심 변화입니다.
이 모델은 GitHub Copilot Workspace·Cursor의 백그라운드 에이전트·Claude Code의 자동 PR 기능과 같은 줄에 서 있습니다. 차별 포인트는 두 가지입니다. 하나는 두뇌 모델이 가중치 공개된 Medium 3.5라는 점 — 보안이 중요한 조직은 같은 에이전트 골격을 자체 인프라에 옮겨 돌릴 여지가 있습니다. 다른 하나는 가격 — 토큰당 $1.5/$7.5라는 단가가 그대로 적용되면, 동일 작업량에서 Claude Opus 4.7 대비 명백히 저렴합니다.
물론 한계도 있습니다. The Decoder는 분석에서 "코딩 벤치마크는 강하지만 금융 시나리오에서는 Claude에 크게 밀린다"고 짚었습니다. 자체 호스팅 진입 장벽도 만만치 않죠. 4 GPU가 최소 사양이라고 미스트랄은 적었지만, 이는 H100급 GPU가 4장 필요한 수준이라 사실상 데이터센터·전문 클라우드 외에는 실현이 어렵습니다.
GPT-5.5·Claude Opus 4.7과 1:1 비교
같은 시점에 활동 중인 OpenAI GPT-5.5(2026년 4월 23일 출시), Anthropic Claude Opus 4.7(2026년 4월 중순 출시)과 직접 비교해 보겠습니다. 모두 일반 사용자가 챗 인터페이스로 만날 수 있는 모델입니다.
| 항목 | Mistral Medium 3.5 | OpenAI GPT-5.5 | Claude Opus 4.7 |
|---|---|---|---|
| 출시일 | 2026-04-29 | 2026-04-23 | 2026-04 중순 |
| API 가격 (입력/출력 1M) | $1.5 / $7.5 | 플래그십 라인 단가 (각 사 공식 가격표 참조) | 플래그십 라인 단가 (각 사 공식 가격표 참조) |
| 컨텍스트 창 | 256k | 수십만 토큰급 | 최대 1M (옵션) |
| 가중치 공개 | 예 (Modified MIT) | 아니오 | 아니오 |
| SWE-Bench Verified | 77.6% | 공식 비교 수치 비공개 | 약 79.6% (직전 세대 Sonnet 4.6 공개치) |
| 대표 에이전트 기능 | Le Chat Work 모드, Vibe 원격 에이전트 | ChatGPT Tasks, Workspace Agents | Claude Code, 컴퓨터 사용 |
가장 직관적인 차이는 토큰 단가입니다. 동급 플래그십 라인의 공식 가격표와 비교하면 Mistral의 $1.5/$7.5는 의미 있게 낮은 위치에 자리합니다. API 위에 자체 서비스를 얹는 스타트업이라면 한 달치 청구서에 즉시 반영되는 격차죠. 반대로 일반 사용자가 챗 인터페이스로만 쓴다면 Pro 구독료(월 단위) 자체는 세 서비스가 비슷합니다.
성능은 영역별로 갈립니다. 코딩·에이전트 시나리오에서 Mistral과 Anthropic이 사실상 동급이고, OpenAI는 멀티모달·음성·도구 통합에서 강합니다. 금융·법률처럼 단어 하나가 큰 차이를 만드는 영역은 Claude 쪽이 우위라는 평가가 일관됩니다. 컨텍스트 길이만 보면 Claude의 1M이 가장 길지만, 256k 창도 일반 문서 처리에 부족하지 않습니다.
가중치 공개라는 변수는 일반 사용자에게는 추상적이지만, 회사 단위에서는 무게가 다릅니다. 인사·재무처럼 외부 API 호출이 부담스러운 데이터를 다뤄야 한다면, "Medium 3.5를 사내 GPU 서버에 올려 같은 인터페이스를 쓴다"는 선택지가 처음으로 현실적인 후보로 등장한 셈입니다.

한국에서 가입·결제·실제로 쓸 만한가
한국 사용자가 가장 먼저 부딪히는 질문은 "그래서 Le Chat을 한국 계정으로 쓸 수 있나"입니다. 결론부터 말하면 가능합니다. chat.mistral.ai에 일반 이메일로 가입하면 Free 플랜이 즉시 열리고, Pro·Team·Enterprise는 신용카드 결제로 업그레이드할 수 있습니다. 한국 발급 카드 결제는 대체로 무리 없이 통과됩니다. Work 모드는 Pro 이상에서 모드 셀렉터에 노출됩니다.
한국어 품질은 일반 채팅·요약·번역 작업에서는 ChatGPT·Claude와 큰 차이를 느끼기 어렵습니다. 다만 미세한 호칭, 한국어 메일 격식, 법률·계약 문구처럼 톤이 중요한 영역에서는 여전히 Claude Opus 4.7 쪽이 매끈한 결과를 줍니다. 이미지 인식·차트 해석은 한국어 라벨이 섞여 있을 때 인식률이 안정적이라는 점은 장점이었습니다.
주의할 점도 분명합니다. Work 모드의 커넥터 가운데 일부는 미국·유럽 SaaS 위주로 먼저 풀렸기 때문에, 카카오 메일·네이버 캘린더·국내 ERP 같은 한국 내 서비스 연결은 아직 제한적입니다. 또 Vibe 원격 에이전트는 GitHub·Linear·Jira처럼 글로벌 도구에 집중돼 있어, JIRA 한국어 티켓에 한자·약어가 섞이면 라벨링 정확도가 떨어지는 사례가 보고되고 있습니다. 이런 작업은 당분간 사람 검수를 한 번 끼우는 편이 안전합니다.
AI 도구를 직접 사용하면서 비교하는 입장에서 솔직히 말하면, 지금 시점에서 한국 일반 사용자에게 1순위로 추천할 만한 카드는 아직 ChatGPT·Claude입니다. 다만 두 가지 경우에는 Le Chat이 명확하게 매력적입니다. 첫째, API 비용이 매월 청구서에 큰 비중을 차지하는 1인 개발자·작은 스타트업 — 토큰 단가 차이가 수십 퍼센트 단위로 누적됩니다. 둘째, "데이터를 외부에 보내기 곤란한데 그래도 최신 모델은 써야 한다"는 사내 시스템 — 가중치 공개가 결정적인 선택지를 만들어 줍니다. 반대로 챗 인터페이스만 쓰는 일반 직장인이 굳이 ChatGPT Plus 구독을 해지하고 옮길 만한 결정적 한 방은 아직 없습니다.
실제로 무엇부터 시도해볼지 추천 순서는 이렇습니다. ① 무료 Free 플랜에서 한국어 채팅·요약 품질을 한 시간 정도 직접 비교한다. ② 마음에 들면 Pro로 한 달만 결제해 Work 모드 커넥터를 본인 메일·캘린더에 연결해본다. ③ 코딩 작업이 많다면 Vibe CLI를 별도로 깔아 GitHub 토큰만 연결해 두고, 짧은 이슈 한두 건을 던져 결과물 PR을 직접 검토한다. 이 세 단계만 거쳐도 본인 워크플로우에 Mistral이 자리할 자리가 있는지 확실히 답이 나옵니다.
Mistral Medium 3.5의 등장이 의미 있는 진짜 이유는 벤치마크 한두 자리 숫자보다도, "오픈웨이트로 풀린 모델이 처음으로 GPT·Claude 동급 라인에 진입했다"는 신호 그 자체입니다. AI 모델 선택지가 한쪽으로 쏠리는 흐름에 균형추가 하나 더 생긴 셈이고, 그 변화의 가장 큰 수혜자는 결국 가격·정책·성능을 비교해 고르는 사용자 본인입니다.
이 글은 미스트랄 공식 발표 페이지(mistral.ai/news), Hugging Face 모델 카드, The Decoder의 4월 30일 분석, Testing Catalog의 미리보기 보도, Open Data Science의 Vibe 분석 등 5개 출처를 교차 검증해 작성했습니다. 토큰 가격·벤치마크 수치는 미스트랄 공식 자료에서 직접 확인했고, GPT-5.5·Claude Opus 4.7과의 비교 표는 같은 시점 자사 블로그에 정리해둔 출시 글들과 공식 문서를 토대로 작성자가 다시 정리했습니다.
'AI' 카테고리의 다른 글
| Claude Mythos & Project Glasswing 완벽 정리 - Anthropic이 공개를 막은 AI (0) | 2026.05.06 |
|---|---|
| Gemini 3.1 Flash-Lite 완벽 가이드 — 가격·성능·한국 무료 사용법 (0) | 2026.05.05 |
| Google Stitch 사용법 완벽 가이드 2026: 무료 AI UI 디자인 도구 총정리 (0) | 2026.05.02 |
| 구글 제미나이 파일 생성 완벽 가이드 – PDF·워드·엑셀을 채팅으로 만드는 법 (0) | 2026.05.01 |
| Claude Design 사용법 완벽 가이드 — AI로 프로토타입·피치덱 만드는 법 (0) | 2026.04.30 |