Cloudflare Agents Week 2026 — 에이전트 클라우드가 온다

9 min read
CloudflareAI AgentWorkersMCP에이전트 인프라
Cloudflare Agents Week 2026 — 에이전트 클라우드가 온다

Cloudflare가 이번 주 "Agents Week"를 열고 에이전트 인프라에 관한 발표를 쏟아냈다. 양이 많아서 전체를 따라가기 어렵다. 핵심만 뽑아 정리한다.

핵심 메시지는 하나다. Cloud 2.0 = 에이전트 클라우드. 기존 클라우드 모델은 하나의 앱이 다수 사용자를 지원하는 구조였다. 에이전트 시대엔 수백만 개의 동시 에이전트 세션을 처리해야 한다. 인프라를 다시 설계해야 한다는 게 Cloudflare의 주장이다.


컴퓨팅(Compute)

Artifacts — Git이 에이전트 저장소가 된다

Artifacts는 Git 호환 저장소다. 에이전트가 생성한 코드, 데이터, 중간 결과물을 버전 관리한다. 에이전트 작업을 커밋처럼 추적할 수 있다.

[💡 잠깐! 이 용어는?] Durable Objects: Cloudflare Workers에서 상태를 유지하는 단위. 각 DO는 독립적인 SQLite 데이터베이스를 갖는다.

Sandboxes GA

에이전트용 격리된 컴퓨팅 환경이 정식 출시됐다. 셸, 파일시스템, 백그라운드 프로세스를 포함한다. 에이전트가 코드를 실행하거나 외부 명령을 돌릴 때 안전하게 격리된 공간이 필요했는데, 이걸 관리형으로 제공한다.

Workflows v2

5만 동시성, 초당 300 생성 속도를 지원한다. 장기 실행 에이전트 파이프라인을 Workers 위에서 오케스트레이션할 수 있다.

기능v1v2
동시성제한적50,000
생성 속도낮음초당 300
격리공유Durable Object 기반

보안(Security)

Managed OAuth — 에이전트의 사용자 대리 인증

RFC 9728을 채택해서 에이전트가 사용자를 대신해서 인증할 수 있게 했다. 에이전트가 사용자의 캘린더를 읽거나 이메일을 보내는 시나리오에서 토큰 관리를 자동화한다.

MCP 엔터프라이즈 아키텍처

Cloudflare Access와 AI Gateway로 MCP 서버를 관리한다. 기업 환경에서 MCP 배포의 표준 패턴을 제시한다.

MCP 엔터프라이즈 구성
클라이언트 에이전트
  → Cloudflare Access (인증/인가)
  → AI Gateway (레이트 리밋, 로깅, 캐시)
  → MCP 서버

API 토큰 개선

스캔 가능한 토큰, 리소스별 권한 제한, 자동 취소 기능이 추가됐다. 에이전트가 토큰을 오남용해도 피해 범위를 제한할 수 있다.


에이전트 도구상자

Agent Memory — 지속적 기억 서비스

에이전트가 세션을 넘어서 기억을 유지하는 관리형 서비스다. 컨텍스트 윈도우를 아무리 늘려도 "컨텍스트 부패(context rot)" 문제는 해결되지 않는다는 관찰에서 출발했다. 별도 포스트로 상세히 다룬다.

AI Platform — 통합 추론 계층

14개 이상의 AI 공급자 모델을 단일 엔드포인트로 통합한다. 공급자 전환, 폴백, 레이트 리밋 처리를 Workers 위에서 관리형으로 제공한다.

AI Search — 에이전트용 검색 프리미티브

동적 검색 인스턴스를 생성하고 하이브리드 검색(벡터 + 전문 검색)을 지원한다. 에이전트가 실시간으로 웹이나 내부 문서를 검색해야 할 때 쓰는 빌딩 블록이다.

Cloudflare Email Service (공개 베타)

에이전트가 이메일을 보내고 받을 수 있다. 에이전트가 사용자 대신 이메일을 처리하는 워크플로우를 만들 수 있다.

Browser Run 업데이트

라이브 뷰, 인간 피드백 루프, 동시성 4배 향상이 포함됐다. 에이전트가 브라우저를 조작할 때 사람이 실시간으로 보고 개입할 수 있는 UI가 생겼다.


프로토타입에서 프로덕션으로

Flagship — AI 시대의 피처 플래그

KV와 Durable Objects 기반 피처 플래그 서비스다. 평가 지연이 1ms 이하다. AI 코드베이스처럼 빠르게 변하는 환경에서 롤아웃 제어를 에지에서 처리한다.

[💡 잠깐! 이 용어는?] 피처 플래그(Feature Flag): 코드를 배포하지 않고 특정 기능을 켜고 끄는 메커니즘. A/B 테스트나 단계적 롤아웃에 사용한다.

PlanetScale + Workers 통합

Workers에서 PostgreSQL과 MySQL 데이터베이스를 직접 배포할 수 있다. 에이전트 워크플로우에서 관계형 데이터베이스를 붙이는 게 훨씬 간단해진다.

cf CLI — 3,000개 이상 API 통합

Cloudflare 대시보드의 거의 모든 기능을 CLI로 조작한다. 에이전트가 CLI를 통해 인프라를 프로그래밍 방식으로 관리할 수 있다.


에이전트 웹(Agentic Web)

Agent Readiness Score

웹사이트가 AI 에이전트에게 얼마나 잘 대응하는지 점수로 매긴다. robots.txt 설정, 구조화된 데이터, 응답 속도, API 가용성 등을 측정한다.

Unweight — LLM을 22% 압축

손실 없는 추론 시점 LLM 압축 기술이다. 모델 품질을 유지하면서 크기를 22% 줄인다. Cloudflare 에지에서 더 빠르고 저렴하게 LLM을 실행할 수 있다.

공유 딕셔너리 압축

에이전트와 서버 간 반복적인 데이터 패턴을 딕셔너리로 압축한다. 에이전트 통신량이 많아질수록 효과가 커진다.


전체 그림

이번 Agents Week 발표를 하나의 그림으로 보면 이렇다.

Cloudflare 에이전트 스택
[에이전트 실행]      Sandboxes GA, Workflows v2, Artifacts
[에이전트 기억]      Agent Memory, Vectorize
[에이전트 통신]      MCP 엔터프라이즈, Managed OAuth, Email Service
[에이전트 검색]      AI Search, Browser Run
[에이전트 추론]      AI Platform (14개 공급자), Unweight
[에이전트 배포]      Flagship, PlanetScale, cf CLI
[에이전트 보안]      Cloudflare Mesh, API 토큰 개선

각각을 별도 서비스로 붙이는 게 아니라, Workers라는 단일 실행 환경 위에서 조합하는 구조다. 에이전트 워크플로우를 Workers 하나로 끝내겠다는 방향성이 보인다.


마무리

Cloudflare의 에이전트 인프라 투자는 "에이전트가 기본 워크로드가 되는 세상"을 전제로 한다. 지금 당장 모든 걸 쓸 필요는 없다. 그러나 에이전트 기반 서비스를 Workers 위에서 구축한다면, 이번 발표들이 하나씩 퍼즐 조각이 된다.

  • 에이전트가 상태를 유지해야 한다면 → Agent Memory + Durable Objects
  • 에이전트가 외부 서비스를 인증해야 한다면 → Managed OAuth
  • 에이전트가 데이터베이스를 써야 한다면 → PlanetScale + Workers

참고:

관심 있을 만한 포스트

Cloudflare Agent Memory — 에이전트가 기억을 갖는 방법

Cloudflare가 공개한 관리형 Agent Memory 서비스의 수집·검색 파이프라인과 실제 API 사용법을 분석한다.

CloudflareAI Agent

Cloudflare Code Mode — 2,500개 API를 1,000 토큰에 담는 MCP의 새로운 패턴

Cloudflare가 공개한 Code Mode는 AI 에이전트에게 수천 개의 API 엔드포인트를 단 2개 도구로 제공하는 MCP 서버 설계 패턴이다.

CloudflareMCP

AI 에이전트 프로토콜 완전 정리 — MCP, A2A, AG-UI 무엇을 언제 쓰나

AI 에이전트 생태계를 지탱하는 6가지 표준 프로토콜의 역할 차이와 선택 기준을 정리한다.

MCPA2A

Google WebMCP — 웹사이트가 AI 에이전트에게 '메뉴판'을 건네는 시대

Chrome 146에 탑재된 WebMCP의 Declarative·Imperative API 구조와 웹 개발자가 준비해야 할 변화를 분석한다.

WebMCPAI Agent

Accept: text/markdown — AI 에이전트가 HTML 대신 마크다운을 받는 시대

Cloudflare가 AI 에이전트를 위해 HTML을 마크다운으로 자동 변환하는 기능의 동작 원리와 의미를 살펴본다.

CloudflareAI Agent

VS Code 1.109 — 에디터 하나에서 Claude, Codex, Copilot을 동시에 돌리는 시대

VS Code 1.109가 도입한 멀티 에이전트 개발 환경의 3가지 실행 모드와 MCP Apps 지원을 분석한다.

VS CodeAI Agent

Google Cloud 멀티 에이전트 — A2A와 MCP로 만드는 5가지 통합 패턴

에이전트 간 통신을 위한 A2A와 외부 도구 연결을 위한 MCP가 Google Cloud에서 어떻게 통합되는지, 5가지 패턴으로 정리한다.

멀티 에이전트A2A

Agent Harness Engineering — AI 에이전트 성능을 결정하는 진짜 변수

모델보다 harness가 에이전트 성능을 더 크게 좌우한다는 사실을 Terminal Bench 결과와 함께 검증한다.

AI AgentHarness