Cloudflare Agents Week 2026 — 에이전트 클라우드가 온다
Cloudflare가 이번 주 "Agents Week"를 열고 에이전트 인프라에 관한 발표를 쏟아냈다. 양이 많아서 전체를 따라가기 어렵다. 핵심만 뽑아 정리한다.
핵심 메시지는 하나다. Cloud 2.0 = 에이전트 클라우드. 기존 클라우드 모델은 하나의 앱이 다수 사용자를 지원하는 구조였다. 에이전트 시대엔 수백만 개의 동시 에이전트 세션을 처리해야 한다. 인프라를 다시 설계해야 한다는 게 Cloudflare의 주장이다.
컴퓨팅(Compute)
Artifacts — Git이 에이전트 저장소가 된다
Artifacts는 Git 호환 저장소다. 에이전트가 생성한 코드, 데이터, 중간 결과물을 버전 관리한다. 에이전트 작업을 커밋처럼 추적할 수 있다.
[💡 잠깐! 이 용어는?] Durable Objects: Cloudflare Workers에서 상태를 유지하는 단위. 각 DO는 독립적인 SQLite 데이터베이스를 갖는다.
Sandboxes GA
에이전트용 격리된 컴퓨팅 환경이 정식 출시됐다. 셸, 파일시스템, 백그라운드 프로세스를 포함한다. 에이전트가 코드를 실행하거나 외부 명령을 돌릴 때 안전하게 격리된 공간이 필요했는데, 이걸 관리형으로 제공한다.
Workflows v2
5만 동시성, 초당 300 생성 속도를 지원한다. 장기 실행 에이전트 파이프라인을 Workers 위에서 오케스트레이션할 수 있다.
| 기능 | v1 | v2 |
|---|---|---|
| 동시성 | 제한적 | 50,000 |
| 생성 속도 | 낮음 | 초당 300 |
| 격리 | 공유 | Durable Object 기반 |
보안(Security)
Managed OAuth — 에이전트의 사용자 대리 인증
RFC 9728을 채택해서 에이전트가 사용자를 대신해서 인증할 수 있게 했다. 에이전트가 사용자의 캘린더를 읽거나 이메일을 보내는 시나리오에서 토큰 관리를 자동화한다.
MCP 엔터프라이즈 아키텍처
Cloudflare Access와 AI Gateway로 MCP 서버를 관리한다. 기업 환경에서 MCP 배포의 표준 패턴을 제시한다.
클라이언트 에이전트
→ Cloudflare Access (인증/인가)
→ AI Gateway (레이트 리밋, 로깅, 캐시)
→ MCP 서버API 토큰 개선
스캔 가능한 토큰, 리소스별 권한 제한, 자동 취소 기능이 추가됐다. 에이전트가 토큰을 오남용해도 피해 범위를 제한할 수 있다.
에이전트 도구상자
Agent Memory — 지속적 기억 서비스
에이전트가 세션을 넘어서 기억을 유지하는 관리형 서비스다. 컨텍스트 윈도우를 아무리 늘려도 "컨텍스트 부패(context rot)" 문제는 해결되지 않는다는 관찰에서 출발했다. 별도 포스트로 상세히 다룬다.
AI Platform — 통합 추론 계층
14개 이상의 AI 공급자 모델을 단일 엔드포인트로 통합한다. 공급자 전환, 폴백, 레이트 리밋 처리를 Workers 위에서 관리형으로 제공한다.
AI Search — 에이전트용 검색 프리미티브
동적 검색 인스턴스를 생성하고 하이브리드 검색(벡터 + 전문 검색)을 지원한다. 에이전트가 실시간으로 웹이나 내부 문서를 검색해야 할 때 쓰는 빌딩 블록이다.
Cloudflare Email Service (공개 베타)
에이전트가 이메일을 보내고 받을 수 있다. 에이전트가 사용자 대신 이메일을 처리하는 워크플로우를 만들 수 있다.
Browser Run 업데이트
라이브 뷰, 인간 피드백 루프, 동시성 4배 향상이 포함됐다. 에이전트가 브라우저를 조작할 때 사람이 실시간으로 보고 개입할 수 있는 UI가 생겼다.
프로토타입에서 프로덕션으로
Flagship — AI 시대의 피처 플래그
KV와 Durable Objects 기반 피처 플래그 서비스다. 평가 지연이 1ms 이하다. AI 코드베이스처럼 빠르게 변하는 환경에서 롤아웃 제어를 에지에서 처리한다.
[💡 잠깐! 이 용어는?] 피처 플래그(Feature Flag): 코드를 배포하지 않고 특정 기능을 켜고 끄는 메커니즘. A/B 테스트나 단계적 롤아웃에 사용한다.
PlanetScale + Workers 통합
Workers에서 PostgreSQL과 MySQL 데이터베이스를 직접 배포할 수 있다. 에이전트 워크플로우에서 관계형 데이터베이스를 붙이는 게 훨씬 간단해진다.
cf CLI — 3,000개 이상 API 통합
Cloudflare 대시보드의 거의 모든 기능을 CLI로 조작한다. 에이전트가 CLI를 통해 인프라를 프로그래밍 방식으로 관리할 수 있다.
에이전트 웹(Agentic Web)
Agent Readiness Score
웹사이트가 AI 에이전트에게 얼마나 잘 대응하는지 점수로 매긴다. robots.txt 설정, 구조화된 데이터, 응답 속도, API 가용성 등을 측정한다.
Unweight — LLM을 22% 압축
손실 없는 추론 시점 LLM 압축 기술이다. 모델 품질을 유지하면서 크기를 22% 줄인다. Cloudflare 에지에서 더 빠르고 저렴하게 LLM을 실행할 수 있다.
공유 딕셔너리 압축
에이전트와 서버 간 반복적인 데이터 패턴을 딕셔너리로 압축한다. 에이전트 통신량이 많아질수록 효과가 커진다.
전체 그림
이번 Agents Week 발표를 하나의 그림으로 보면 이렇다.
[에이전트 실행] Sandboxes GA, Workflows v2, Artifacts
[에이전트 기억] Agent Memory, Vectorize
[에이전트 통신] MCP 엔터프라이즈, Managed OAuth, Email Service
[에이전트 검색] AI Search, Browser Run
[에이전트 추론] AI Platform (14개 공급자), Unweight
[에이전트 배포] Flagship, PlanetScale, cf CLI
[에이전트 보안] Cloudflare Mesh, API 토큰 개선각각을 별도 서비스로 붙이는 게 아니라, Workers라는 단일 실행 환경 위에서 조합하는 구조다. 에이전트 워크플로우를 Workers 하나로 끝내겠다는 방향성이 보인다.
마무리
Cloudflare의 에이전트 인프라 투자는 "에이전트가 기본 워크로드가 되는 세상"을 전제로 한다. 지금 당장 모든 걸 쓸 필요는 없다. 그러나 에이전트 기반 서비스를 Workers 위에서 구축한다면, 이번 발표들이 하나씩 퍼즐 조각이 된다.
- 에이전트가 상태를 유지해야 한다면 → Agent Memory + Durable Objects
- 에이전트가 외부 서비스를 인증해야 한다면 → Managed OAuth
- 에이전트가 데이터베이스를 써야 한다면 → PlanetScale + Workers
참고:
- Building the agentic cloud: https://blog.cloudflare.com/agents-week-in-review/
관심 있을 만한 포스트
Cloudflare Agent Memory — 에이전트가 기억을 갖는 방법
Cloudflare가 공개한 관리형 Agent Memory 서비스의 수집·검색 파이프라인과 실제 API 사용법을 분석한다.
Cloudflare Code Mode — 2,500개 API를 1,000 토큰에 담는 MCP의 새로운 패턴
Cloudflare가 공개한 Code Mode는 AI 에이전트에게 수천 개의 API 엔드포인트를 단 2개 도구로 제공하는 MCP 서버 설계 패턴이다.
AI 에이전트 프로토콜 완전 정리 — MCP, A2A, AG-UI 무엇을 언제 쓰나
AI 에이전트 생태계를 지탱하는 6가지 표준 프로토콜의 역할 차이와 선택 기준을 정리한다.
Google WebMCP — 웹사이트가 AI 에이전트에게 '메뉴판'을 건네는 시대
Chrome 146에 탑재된 WebMCP의 Declarative·Imperative API 구조와 웹 개발자가 준비해야 할 변화를 분석한다.
Accept: text/markdown — AI 에이전트가 HTML 대신 마크다운을 받는 시대
Cloudflare가 AI 에이전트를 위해 HTML을 마크다운으로 자동 변환하는 기능의 동작 원리와 의미를 살펴본다.
VS Code 1.109 — 에디터 하나에서 Claude, Codex, Copilot을 동시에 돌리는 시대
VS Code 1.109가 도입한 멀티 에이전트 개발 환경의 3가지 실행 모드와 MCP Apps 지원을 분석한다.
Google Cloud 멀티 에이전트 — A2A와 MCP로 만드는 5가지 통합 패턴
에이전트 간 통신을 위한 A2A와 외부 도구 연결을 위한 MCP가 Google Cloud에서 어떻게 통합되는지, 5가지 패턴으로 정리한다.
Agent Harness Engineering — AI 에이전트 성능을 결정하는 진짜 변수
모델보다 harness가 에이전트 성능을 더 크게 좌우한다는 사실을 Terminal Bench 결과와 함께 검증한다.