Anthropic Managed Agents — AI 에이전트 인프라를 플랫폼에 넘기다
AI 에이전트를 프로덕션에 올리는 것과 로컬에서 돌리는 건 완전히 다른 문제다. 세션 상태를 어떻게 유지할 건지, 실행 환경을 어떻게 격리할 건지, 자격증명은 어떻게 처리할 건지. 이 인프라를 직접 구축하는 데 수개월이 걸린다.
Anthropic이 이 문제를 플랫폼 레벨에서 해결하겠다고 나섰다.
Managed Agents가 뭔가
기존에 AI 에이전트를 프로덕션에서 운영하려면 팀이 직접 만들어야 하는 것들이 있었다.
| 구성 요소 | 기존 방식 | Managed Agents |
|---|---|---|
| 오케스트레이션 | 직접 구현 | 플랫폼 제공 |
| 세션 상태 관리 | 직접 구현 | 플랫폼 제공 |
| 샌드박스 처리 | 직접 구현 | 플랫폼 제공 |
| 자격증명 처리 | 직접 구현 | 플랫폼 제공 |
| 데이터 지속성 | 직접 구현 | 플랫폼 제공 |
| 에이전트 행동/도구/제약 | 직접 구현 | 여전히 직접 정의 |
마지막 행이 핵심이다. 에이전트가 무엇을 할 수 있고 어떻게 동작할지는 여전히 개발자가 정의한다. 그 에이전트를 실행하고 유지하는 인프라를 플랫폼이 담당한다.
비유하면 클라우드 함수 서비스와 같다. AWS Lambda를 쓰면 서버를 직접 관리하지 않아도 된다. 코드만 작성하면 실행 환경은 AWS가 책임진다. Managed Agents는 AI 에이전트 버전의 서버리스다.
아키텍처: 메타-하네스 접근
[💡 잠깐! 이 용어는?] 하네스(Harness): AI 에이전트의 실행 환경과 도구 연결을 관리하는 프레임워크. 에이전트가 어떤 도구를 쓸 수 있고, 어떤 권한을 가지며, 어떻게 메시지를 주고받는지를 정의한다.
Managed Agents는 메타-하네스 구조로 동작한다. 여러 에이전트 워크플로우가 공유 실행 계층 위에서 돌아간다.
┌──────────────────────────────────────────┐
│ 개발자가 정의하는 영역 │
│ 에이전트 행동 / 도구 / 제약조건 │
├──────────────────────────────────────────┤
│ Managed Agents 플랫폼 │
│ 오케스트레이션 / 세션 상태 / 샌드박스 │
│ 자격증명 처리 / 데이터 지속성 │
├──────────────────────────────────────────┤
│ Claude API (기반 모델) │
└──────────────────────────────────────────┘
이 구조에서 에이전트 로직과 실행 인프라가 명확히 분리된다.
비용 구조
세션당 8센트라는 가격이 공개됐다. 이게 비싼지 싼지는 대안과 비교해야 한다.
직접 인프라를 구축한다면:
- 개발자 인건비 (초기 구축 수개월)
- 서버 운영 비용
- 모니터링, 로깅, 유지보수 비용
단순한 에이전트 워크플로우를 자체 인프라로 운영하면 세션당 비용이 더 높아지는 경우가 많다. 규모가 커지면 달라질 수 있지만, 초기 단계에서는 관리형 서비스가 경제적일 수 있다.
API 사용 방식
import anthropic
client = anthropic.Anthropic()
# 에이전트 생성
agent = client.beta.agents.create(
name="code-reviewer",
model="claude-opus-4-5",
instructions="""
코드 리뷰를 수행하는 에이전트다.
보안 취약점, 성능 문제, 코드 품질을 분석한다.
""",
tools=[
{"type": "code_execution"},
{"type": "file_read"},
]
)
# 세션 시작 (상태가 플랫폼에서 유지됨)
session = client.beta.agents.sessions.create(
agent_id=agent.id
)
# 작업 실행
response = client.beta.agents.sessions.messages.create(
session_id=session.id,
messages=[{
"role": "user",
"content": "이 PR의 코드를 리뷰해줘: https://github.com/..."
}]
)
print(response.content)세션 ID가 플랫폼에서 관리되기 때문에, 다음 요청에서 같은 session_id를 사용하면 이전 컨텍스트가 유지된다. 개발자가 상태를 직접 저장하고 로드할 필요가 없다.
보안과 샌드박싱
에이전트가 코드를 실행하거나 파일에 접근할 때 격리된 환경이 필요하다. 이걸 직접 구현하면 상당히 복잡하다.
Managed Agents는 각 에이전트 실행을 격리된 샌드박스 환경에서 처리한다. 에이전트가 예상치 못한 파일에 접근하거나 의도치 않은 코드를 실행하는 것을 플랫폼이 차단한다.
자격증명(API 키, OAuth 토큰 등) 처리도 플랫폼이 담당한다. 에이전트 코드에 직접 비밀 값을 넣지 않아도 된다.
플랫폼 종속성 트레이드오프
이 서비스를 사용하면 Anthropic의 SDK와 형식에 의존하게 된다. 개발자 커뮤니티에서 제기되는 우려다.
| 관점 | 내용 |
|---|---|
| 장점 | 인프라 구축 불필요, 빠른 개발 |
| 단점 | Anthropic SDK에 종속, 다른 모델로 이전 어려움 |
| 중립 | 오픈 표준(MCP, A2A)과의 호환성은 미정 |
AWS를 쓰면 AWS에 종속되는 것처럼, Managed Agents를 쓰면 Anthropic 플랫폼에 종속된다. 이게 문제인지 아닌지는 제품의 규모와 요구사항에 달려 있다.
초기에는 관리형 서비스로 빠르게 검증하고, 규모가 커지면 자체 인프라로 이전하는 전략도 있다. 이 경우 에이전트 로직이 인프라에서 분리되어 있기 때문에 이전이 용이하다.
어떤 팀에 맞는가
- AI 에이전트를 빠르게 프로덕션에 올려야 하는 스타트업: 인프라 구축 시간을 절약
- 사이드 프로젝트: 세션당 과금이므로 초기 비용 부담이 적다
- 엔터프라이즈: 거버넌스, 감사 기능이 내장되어 있어 규정 준수에 유리
반면 이미 자체 인프라가 있는 팀, 특수한 실행 환경이 필요한 경우, 멀티 모델 전략을 쓰는 팀은 직접 구축이 더 맞을 수 있다.
마무리
- Managed Agents는 에이전트 인프라를 플랫폼에 위임하는 서비스다
- 에이전트 행동 정의는 여전히 개발자 몫이다
- 세션당 8센트로, 초기 단계에서는 직접 구축보다 경제적일 수 있다
- Anthropic 종속성이 생긴다는 트레이드오프가 있다
- 아이디어에서 프로덕션까지 수개월에서 며칠로 줄어든다
AI 에이전트의 인프라 복잡성은 실제로 상당하다. 이걸 플랫폼이 추상화해주는 방향은 웹 개발에서 PaaS가 걸어온 길과 같다. 트레이드오프를 이해하고 선택하는 게 중요하다.
참고:
관심 있을 만한 포스트
Claude Code 프롬프트 재현성 — 암묵지를 제거하는 자동 튜닝 워크플로우
작성자와 평가자를 분리하고 서브에이전트로 반복 실행해 프롬프트 품질을 객관적으로 끌어올리는 실전 방법론을 정리한다.
mini-swe-agent — 100줄짜리 AI가 GitHub 이슈를 해결하는 방법
SWE-bench verified 74% 달성에도 핵심 코드가 100줄인 최소주의 AI 코딩 에이전트의 아키텍처와 동작 원리를 분석한다.
AWS DevOps Agent — MTTR 75% 감소를 만든 자율 인시던트 대응 에이전트
Amazon Bedrock AgentCore 기반의 AWS DevOps Agent가 인시던트를 자율 조사하는 방식과 MCP 확장, 94% 루트 코즈 정확도를 분석한다.
Cloudflare AI 코드 리뷰 — 48,000건 MR을 AI로 검토한 실전 아키텍처
Cloudflare가 48,095건의 머지 요청에 AI 코드 리뷰를 적용한 방식과 리스크 티어, 조정자 패턴, 프롬프트 주입 방지 구현을 분석한다.
webpage-mcp — 기존 브라우저를 AI 에이전트 MCP 서버로 바꾸는 도구
Chrome 확장으로 브라우저를 MCP 서버로 변환해 AI 에이전트가 기존 로그인 세션을 활용한 웹 자동화를 가능하게 하는 도구를 살펴본다.
VS Code 1.109 — 에디터 하나에서 Claude, Codex, Copilot을 동시에 돌리는 시대
VS Code 1.109가 도입한 멀티 에이전트 개발 환경의 3가지 실행 모드와 MCP Apps 지원을 분석한다.
4명이 16명처럼 일하는 비밀 — 컬리 OMS팀의 역할 기반 AI 오케스트레이션
PM 1명과 엔지니어 3명이 12개 MSA를 운영하는 OMS팀이 Claude AI를 도입해 16명 규모 조직처럼 일하게 된 과정.
Claude Code + Figma MCP — UX 라이팅 리소스 50% 절감 실전기
수치화된 톤 스펙트럼과 Figma MCP 자동화로 반복 작업을 AI에게 넘기고 팀이 맥락과 사용자 경험에 집중하게 만든 과정을 정리한다.