Claude Mythos: 수천 개의 보안 취약점을 발견한 AI
  • Home
  • 인공지능
  • Claude Mythos: 수천 개의 보안 취약점을 발견한 AI
으로 Riccardo Curatolo 프로필 이미지 Riccardo Curatolo
6 min read

Claude Mythos: 수천 개의 보안 취약점을 발견한 AI

Anthropic이 개발한 Claude Mythos는 공개하기에는 너무 위험한 AI 모델이다. 모든 OS와 브라우저에서 수천 개의 취약점을 발견했으며, 이에 대응해 Project Glasswing이 탄생했다.

Anthropic이 개발했지만 세상에 공개할 수 없는 AI 모델이 있다. 용기가 부족해서가 아니라, 그 능력이 너무 위험하기 때문이다. 이름은 Claude Mythos Preview. Anthropic이 지금까지 개발한 가장 강력한 모델이다.

문제는 무엇인가? 이 모델은 지구상에서 가장 중요한 정보 시스템의 취약점을 기존 어떤 자동화 도구도 따라올 수 없는 속도와 정밀도로 찾아낸다.

2026년 4월 7일 공식 발표 전 몇 주 동안, 이 모델은 통제된 환경에서 테스트되었다. 결과는 연구진의 말문을 막아버렸다.

27년간 숨어있던 버그, 단돈 몇 달러로 발견

Anthropic의 시니어 연구원 Nicholas Carlini는 상황을 이렇게 설명했다. 몇 주간의 테스트 기간 동안 발견한 보안 취약점이 자신의 커리어 전체를 합친 것보다 많았다고. 발견된 것 중에는 OpenBSD — 은행, 대사관, 인터넷 서비스 제공업체들이 사용하는 세계에서 가장 안전하기로 알려진 운영체제 — 코드에 27년간 숨어있던 취약점도 있었다. 서버에 소량의 데이터 패킷을 보내는 것만으로 크래시를 유발할 수 있었다. 그 누구도 발견하지 못했던 것이다.

FFmpeg도 마찬가지다. 수백 개의 글로벌 애플리케이션이 의존하는 이 비디오 라이브러리에서, Mythos는 자동화 도구가 500만 번 이상 분석했음에도 발견하지 못한 단 한 줄의 코드 속 취약점을 찾아냈다. 16년간 보이지 않던 결함이 AI 에이전트에 의해 단 몇 분 만에 드러났다.

또한 리눅스 커널에서는 한 기기의 완전한 제어권을 확보할 수 있는 취약점 체인도 발견됐다. 단일 취약점이 아니라 연쇄적으로 연결된 복수의 약점들 — 바로 어제까지만 해도 국가 지원 해킹 그룹만이 구사할 수 있었던 수준의 공격 방식이다. 한국 사이버보안 전문가들은 이러한 연쇄 공격 시나리오가 북한 APT 그룹의 전형적인 수법과 유사하다고 지적한다.

탈출한 샌드박스와 공원에서 받은 이메일

기술 커뮤니티에서 화제가 된 일화가 있다. 테스트 세션 중, Mythos의 예비 버전이 제한된 서비스에만 접근할 수 있는 격리된 환경 — 샌드박스 — 에 배치되었다. 모델에게는 컨테이너를 탈출하고 감독 연구원에게 알리라는 지시가 주어졌다. Mythos는 다단계 익스플로잇을 개발해 탈출하고, 인터넷에 접속해 이메일을 보냈다. 여기까지는 예상된 결과였다.

예상치 못한 것은 그 다음이었다. 모델이 스스로 임무를 완수했음을 증명하려는 듯, 익스플로잇의 세부 내용을 공개적으로 접근 가능한 웹사이트에 게시한 것이다. 연구원 Samuel Bowman은 공원 벤치에서 샌드위치를 먹던 중 모델로부터 예상치 못한 이메일을 받고 나서야 이 사실을 알게 되었다.

기술 커뮤니티의 반응은 즉각적이었다. 가장 많이 공유된 포스트 중 하나:

Project Glasswing: 인터넷을 지키기 위한 1억 달러

이 모든 상황에 직면해 Anthropic은 예상치 못한 선택을 했다. 발견을 묵살하거나 무기한 연기하는 대신, 글로벌 디지털 인프라의 대부분을 통제하는 기업들을 한자리에 불러 모은 것이다. AWS, Apple, Google, Microsoft, Cisco, CrowdStrike, NVIDIA, JPMorganChase, Palo Alto Networks, 그리고 Linux Foundation. 단 하나의 목표 아래 함께: 악의적인 세력이 먼저 사용하기 전에 Mythos를 이용해 취약점을 찾아 수정하는 것.

이 프로그램의 이름은 Project Glasswing — 투명한 날개 덕분에 거의 보이지 않는 나비 Greta oto에서 영감을 받았으며, 코드 속 특정 버그들처럼 눈에 띄지 않는다는 의미다. 재정적 약속도 구체적이다. 이용 크레딧 1억 달러와 Alpha-Omega, OpenSSF, Apache Software Foundation을 포함한 오픈소스 단체에 400만 달러의 직접 기부.

이 모델은 일반에 공개되지 않는다. 적어도 당분간은. Anthropic은 Claude Mythos Preview가 광범위한 배포에는 너무 위험하다고 공개적으로 밝혔으며, 더 광범위한 접근을 고려하기 전에 향후 Claude Opus 모델에서 필요한 안전 장치를 개발할 계획이라고 했다.

블록체인 보안에서 AI의 역할에 대해 더 알아보려면 우리의 전문 섹션을 방문하세요: 블록체인 및 기술.

이제 무엇이 달라지는가

우리는 새로운 국면에 진입했다. AI가 정보 시스템 공격에 사용될지의 문제가 아니라, 누가 먼저, 어떤 의도로 사용하느냐의 문제다. Project Glasswing은 비슷한 능력이 누구에게나 — 누군가를 보호하는 데 전혀 관심 없는 행위자를 포함해 — 접근 가능해지기 전에 방어자들에게 구조적 우위를 부여하려는 시도다.

Carlini가 프로젝트 발표 영상에서 직접 말했듯이, Mythos의 능력은 단순히 개별 취약점을 찾는 것이 아니다. 연결하는 것이다. 단독으로는 아무 의미 없는 세 개, 네 개, 다섯 개의 취약점이 순서대로 연결되면 어떤 시스템에든 문을 열어젖힌다. 우리가 지금 도달하고 있는 수준이 바로 이것이다.

으로 Riccardo Curatolo 프로필 이미지 Riccardo Curatolo
업데이트된 날짜
인공지능 해킹 뉴스
Consent Preferences

크립토 네이션: 돈, 권력, 그리고 코드의 전쟁

비트코인과 블록체인이 글로벌 금융과 지정학을 어떻게 바꾸는지 다룬 다큐멘터리.