AI 에이전트와 DeFi: Anthropic 보고서, 모의 공격 $460만 달러 기록

GPT-5·Claude Sonnet 4.5가 DeFi 실제 컨트랙트에서 $460만 모의 익스플로잇을 기록했다. Anthropic Fellows 2026 보고서, BNB Chain 제로데이 2건 발견.

$460만 달러. AI 프론티어 모델이 이미 해킹된 DeFi 프로토콜을 대상으로 시뮬레이션에서 “탈취”한 금액이다. Anthropic Fellows 2026 보고서는 온체인 보안을 바라보는 업계의 시각에 뚜렷한 전환점을 남겼다.

GPT-5와 Claude Sonnet 4.5는 단순히 버그를 찾아내는 데 그치지 않았다. Anthropic Fellows 프로그램 보고서에 따르면, 두 모델은 완전한 익스플로잇 스크립트를 합성하고, 트랜잭션 순서를 설계하며, 시뮬레이션 유동성을 고갈시켰다. 연구자들은 이를 Ethereum과 BNB Chain의 실제 공격과 “임상적으로 동일하다”고 묘사했다. 핵심 방법론은 단순했다. 모델의 학습 데이터 기준일 이후에 해킹된 컨트랙트. 즉 모델이 한 번도 본 적 없는 컨트랙트를 테스트 대상으로 삼은 것이다. 이미 문서화된 익스플로잇을 모르는 상태에서도 취약점을 스스로 찾아낸다면, 그 취약점은 사전 지식 없이도 재현 가능한 실질적 위협이다.

핵심 데이터

post-cutoff 컨트랙트 모의 익스플로잇 (GPT-5 + Sonnet 4.5) $460만 달러
스캔한 BNB Chain 미침해 컨트랙트 수 2,849개
GPT-5·Sonnet 4.5가 발견한 실제 제로데이 취약점 2건
제로데이 모의 수익 $3,694
GoPlus Security API 월평균 호출 수 (2025) 7억 1,700만 건

출처: Anthropic Fellows Program · CoinDesk · 2026

출처: Anthropic Fellows Program · CoinDesk · 2026

AI 에이전트는 실제로 DeFi 프로토콜을 공격할 수 있는가

짧게 답하면, 이미 가능하다 또한 긴 답은 더 심각하다. 보고서 발표 시점에서 프론티어 모델은 익스플로잇을 목적으로 설계되지 않았다. 범죄 전용 모듈 같은 것은 없다. 그럼에도 Solidity 코드 이해, 상징적 추론, DeFi 프로토콜 아키텍처 지식을 조합해 코드가 무너지는 지점을 스스로 추론했다.

BNB Chain에서 발견된 첫 번째 취약점은 공개 함수에 “view” 한정자가 누락된 것이었다. 이를 호출하는 누구든 자신의 토큰 잔액을 부풀릴 수 있었다. 두 번째는 동일 블록 내 특정 트랜잭션 순서를 통해 오라클 가격 논리를 조작할 수 있는 취약점이었다. 스캔 당시 두 컨트랙트 모두 침해 흔적이 없었다. 모의 피해 금액은 $3,694로 절대적 수치는 크지 않다. 문제는 피해 규모가 아니라 발견의 속도와 비용이다. AI 에이전트 하나가 사람의 구체적인 개입 없이 2,849개 컨트랙트에서 활성 제로데이 2건을 찾아냈다.

국내 DeFi 투자자 입장에서 이 의미를 풀면 이렇다. 단일 DeFi 컨트랙트 전문 감사는 $5,000에서 $50,000, 수 주의 시간이 필요하다. AI 에이전트가 수천 개 컨트랙트를 동시에 같은 작업으로 처리한다면, 공격자와 방어자 사이의 힘의 균형이 달라진다. Upbit와 Bithumb을 통해 DeFi 생태계에 진입하는 국내 투자자가 늘어나는 가운데. 연결된 모든 온체인 프로토콜의 보안 수준이 직접적인 관심사가 된다.

Ethereum Fusaka 업그레이드와 확대되는 공격 표면

2025년 12월 3일 적용된 Ethereum 업그레이드 Fusaka는 PeerDAS를 통해 Layer 2 수수료를 40~60% 낮췄다. 낮은 비용에 더 많은 트랜잭션이 가능해졌고, 더 많은 컨트랙트가 배포됐으며, 유동성은 분산되고 공격 표면은 넓어졌다. 이는 이론적 상관관계가 아니다 또한 DL News가 보도한 온체인 데이터에 따르면. 블롭 비용을 낮춘 Dencun 업그레이드(2024년 3월) 이후 BNB Chain과 Ethereum L2의 컨트랙트 수는 12개월 만에 340% 증가했다. 빠르게 작성된 새 컨트랙트가 늘수록 미발견 취약점도 늘어난다.

OANDA는 2026년 5월 업데이트에서 AI 에이전트를 Ethereum 관련 가장 뜨거운 내러티브 중 하나로 언급했다. 온체인에서 자율적으로 작동하고, ETH로 거래하며, 시장 조건에서 학습하는 자율 주체라는 설명이었다. 매력적인 “DeFAI” 내러티브는 이제 전례 없이 명확한 질문과 충돌한다. 이 에이전트들이 사용하는 컨트랙트를 누가 감사하는가. BlackRock의 BSTBL 같은 기관 스테이블코인은 Ethereum 위에서 운영된다. AI 에이전트가 보안팀보다 먼저 토큰화된 머니마켓의 취약점을 발견한다면, 그 파장은 리테일 DeFi를 훨씬 넘어선다.

Anthropic 보고서는 해결책을 제시하지 않는다. 문제를 문서화한다. 보안 업계의 대응은 이미 가속하고 있다. GoPlus는 2025년 자사 API에 월 7억 1,700만 건의 호출을 기록했으며, 이 수치는 증가세다. CertiK는 2026년 7월 AI 에이전트와 차세대 DeFi 프로토콜 공격 표면에 관한 전문 보고서 발간을 예고했다. CertiK에 따르면 2025년 온체인 익스플로잇으로 인한 피해는 30억 달러에 달했다. 가상자산이용자보호법 시행 이후 국내 규제 체계가 강화되는 시점에서, AI 기반 취약점 탐지라는 기술적 위협은 법·제도와 현실 사이의 간극을 더욱 선명하게 드러낸다. 7월 CertiK 보고서는 이 간극을 수치로 확인할 첫 번째 공식 기회가 될 것이다.