Claude Managed Agents - 프로덕션 속도를 10배 더 빠르게
(claude.com)- 클라우드 환경에서 대규모 에이전트를 구축·배포할 수 있는 조합형 API 제품군으로, 프로토타입을 며칠 내 프로덕션으로 전환 가능
- 보안 샌드박싱, 자격 증명 관리, 권한 제어 등 프로덕션급 인프라를 자동 처리해 사용자는 작업 정의에만 집중 가능
- 장시간 세션, 다중 에이전트 협업, 신뢰 기반 거버넌스를 지원하며, Claude 모델과 긴밀히 통합되어 자율적 반복 수행과 성능 향상 제공
- Notion, Rakuten, Asana, Sentry 등 주요 기업이 이를 활용해 10배 빠른 배포와 자동화된 워크플로우를 실현
- 사용량 기반 과금으로 제공되며, 조직의 운영 효율과 개발 생산성을 근본적으로 향상시키는 플랫폼임
Claude Managed Agents 개요
- Claude Managed Agents는 클라우드에서 대규모 에이전트를 구축·배포할 수 있는 조합형 API 제품군으로 공개 베타로 제공됨
- 기존에는 보안 인프라, 상태 관리, 권한 제어, 모델 업그레이드 대응 등으로 인해 에이전트 개발에 수개월이 소요되었으나, Managed Agents는 프로토타입에서 프로덕션까지 며칠 내 전환 가능
- 단일 작업 실행기부터 복잡한 다중 에이전트 파이프라인까지 지원하며, 사용자는 운영 오버헤드 없이 사용자 경험에 집중 가능
10배 빠른 에이전트 구축 및 배포
- 프로덕션 수준의 에이전트를 배포하려면 샌드박스 코드 실행, 체크포인트, 자격 증명 관리, 권한 범위 설정, 엔드투엔드 추적이 필요함
- Managed Agents는 이러한 복잡성을 대신 처리하며, 사용자는 작업·도구·가드레일만 정의하면 됨
- 내장된 오케스트레이션 하니스가 도구 호출 시점, 컨텍스트 관리, 오류 복구를 자동으로 수행
- 주요 기능:
- 프로덕션급 에이전트: 보안 샌드박싱, 인증, 도구 실행 자동 처리
- 장시간 세션: 수 시간 동안 자율적으로 동작하며, 연결이 끊겨도 진행 상황과 출력 유지
- 다중 에이전트 협업: 다른 에이전트를 생성·지시하여 복잡한 작업 병렬화 (리서치 프리뷰 단계)
- 신뢰 기반 거버넌스: 권한 범위, ID 관리, 실행 추적 내장
Claude 모델과의 통합 설계
- Claude 모델은 에이전트 중심 작업에 최적화되어 있으며, Managed Agents는 이를 최대한 활용하도록 설계됨
- 사용자는 결과와 성공 기준만 정의하면 Claude가 자체 평가·반복 수행하여 목표 달성 (리서치 프리뷰 제공)
- 필요 시 기존의 프롬프트-응답형 워크플로우도 지원
- 내부 테스트에서 구조화된 파일 생성 작업 시 표준 프롬프트 루프 대비 최대 10포인트 성능 향상
- 세션 추적, 통합 분석, 문제 해결 가이드가 Claude Console에 내장되어 모든 도구 호출과 결정 과정을 점검 가능
실제 활용 사례
- 다양한 팀이 Managed Agents를 통해 10배 빠른 프로덕션 배포를 실현
- 코딩 에이전트: 코드베이스 분석, 수정 계획 수립, PR 생성
- 생산성 에이전트: 프로젝트 참여, 작업 수행, 결과물 제공
- 재무·법무 에이전트: 문서 처리 및 핵심 정보 추출
- 주요 기업 사례:
-
Notion
- 워크스페이스 내에서 Claude에게 직접 작업을 위임할 수 있는 Custom Agents 알파 버전 운영
- 엔지니어는 코드 배포, 지식 근로자는 웹사이트·프레젠테이션 제작 등 수십 개 작업 병렬 수행
-
Rakuten
- Slack·Teams에 통합된 전사 에이전트를 제품·영업·마케팅·재무·HR 부문에 배포
- 각 전문 에이전트를 1주일 내 배포
-
Asana
- AI Teammates를 통해 인간과 협업하는 에이전트를 프로젝트 내에 통합
- Managed Agents로 고급 기능을 수주 내 구현
-
Vibecode
- 프롬프트에서 앱 배포까지 연결되는 AI 네이티브 앱 인프라를 Managed Agents로 구현
- 동일 인프라를 10배 빠르게 구축 가능
-
Sentry
- 디버깅 에이전트 Seer와 Claude 기반 패치 작성 에이전트를 결합
- 버그 탐지에서 PR 생성까지 단일 플로우로 자동화, 수개월 걸리던 통합을 수주 내 완성
-
고객 인용
- Ansh Nanda (공동 창업자): 과거에는 LLM을 샌드박스에서 수동 관리해야 했으나, 이제는 몇 줄의 코드로 10배 빠른 인프라 구축 가능, AI 네이티브 앱 급증 전망
- Indragie Karunaratne (Sentry AI/ML 엔지니어링 디렉터): Managed Agents는 보안·완전 관리형 런타임을 제공해 개발자 경험 개선과 운영 부담 제거
- Sanchan Saxena (Atlassian 제품 총괄): Jira 워크플로우에 에이전트를 통합, 샌드박싱·세션·권한 관리 자동화로 엔지니어링 효율 향상
- Javed Qadrud-Din (CTO): Managed Agents가 필요한 도구를 즉석에서 생성해 모든 사용자 질의 처리 가능, 개발 시간 10배 단축
- John Han (공동 창업자): 회의 준비 에이전트를 수일 내 프로덕션 수준으로 구현, 외부 시스템 연결과 웹 검색을 자동 처리
- Eric Liu (Notion PM): 장시간 세션과 메모리 관리로 복잡한 개방형 작업 위임 가능
- Yusuke Kaji (Rakuten AI 총괄): 각 부문 전문 에이전트를 1주일 내 배포, 안전한 확장과 혁신 민주화 실현
- Amritansh Raghav (Asana CTO): AI Teammates 개발 속도를 대폭 가속화, 엔터프라이즈급 협업 경험 강화
시작하기
- Managed Agents는 사용량 기반 과금제로, 표준 Claude Platform 토큰 요율에 세션 시간당 $0.08 추가
- 자세한 요금은 공식 문서에서 확인 가능
- Claude Console 또는 CLI를 통해 첫 에이전트를 배포할 수 있으며, Claude Code 및 claude-api Skill과 통합 지원
- “start onboarding for managed agents in Claude API” 명령으로 온보딩 시작 가능
조직 운영 혁신
- Managed Agents는 조직의 운영 방식을 근본적으로 전환할 수 있는 도구로,
개발자와 팀이 인프라 대신 생산성과 사용자 경험에 집중하도록 지원 - Claude Platform을 통한 지속적 업데이트와 커뮤니티 확장 예정
Hacker News 의견들
-
나는 이게 최적의 오케스트레이션으로 이어질 것 같다는 의심이 있음
오픈소스가 더 나은 대안을 제때 내놓지 못할 수도 있음
지금까지 가장 좋은 성능은 여러 회사의 에이전트들을 혼합했을 때 나왔음
‘플래너’보다 중요한 건 ‘워커’임. 어떤 에이전트는 특정 작업에 훨씬 뛰어남
예를 들어 Opus 4.6은 버그 탐지 면에서 GPT 5.4 xhigh와는 비교가 안 됨
현실 세계에서 다양한 사고방식이 팀의 견고함을 높이듯, 에이전트 혼합도 비슷한 효과를 보임- Anthropic이 최고의 버전을 만들려면 모든 세부 작업(기술 문서, 다이어그램, 버그 탐지 등)에서 다른 AI 회사들을 전부 이겨야 함
하지만 그들의 스택 안에서 Codex 같은 외부 모델을 호출하게 해줄 리는 없음 - 내가 걱정하는 건 이게 최적의 오케스트레이션 언어로 귀결될 가능성임
예를 들어 Claude가 모든 에이전트 간 통신을 수메르어로 바꾼다면?
특정 회사만 그 언어 전문성을 독점하게 될 수도 있음 - 나도 여러 회사의 모델을 섞어 쓰는 게 최고였음
Opus로 스펙을 작성 → Gemini로 수정 → 다시 Opus로 피드백 → 내가 검토 → Qwen3.5로 빌드 → Opus로 리뷰
이 흐름이 완벽했는데, Anthropic이 정책을 바꾸면서 깨졌음 - 지금 AI 회사들은 마치 양동이 속의 바닷가재 같음
한 회사가 폐쇄 모델을 내놓으면, 다른 회사들이 그걸 분석해 개선하고 오픈소스로 공개함
결국 서로 발목을 잡다가, 나중엔 카르텔처럼 될 수도 있음
- Anthropic이 최고의 버전을 만들려면 모든 세부 작업(기술 문서, 다이어그램, 버그 탐지 등)에서 다른 AI 회사들을 전부 이겨야 함
-
Anthropic이 개발자들을 자사 플랫폼으로 끌어들이려는 게 보임
IPO를 위해선 단순한 모델 제공자가 아니라 플랫폼 기업이 되어야 함
지금 하는 모든 움직임이 그 방향을 가리킴 -
Claude Code를 매일 쓰지만, 고객 시스템을 Anthropic에 의존하게 만드는 건 위험함
품질 엔지니어링이 그들의 강점은 아님. 가용성도 ‘single 9’ 수준이면 곤란함 -
지금은 에이전트 프레임워크의 초창기, 마치 PHP 이전 웹 시절 같음
매주 새로운 패턴과 모델이 나오면서 모든 프레임워크가 다시 만들어짐
LangChain이 Next.js/Vercel처럼 되려 하지만, 대부분은 직접 구축하길 권장함
Anthropic은 모델을 직접 보유하므로 진입장벽이 낮은 솔루션으로 일정 수요를 얻겠지만, 락인과 기술 변화 속도는 여전히 문제임- 나도 동의함. 지금은 블로그나 GitHub에 반쯤 완성된 솔루션이 수백 개 떠다니는 시기임
LangChain이 가장 근접했지만 여전히 DIY 느낌이 강함
게다가 모두가 서로 다른 벡터DB와 리랭킹 모델을 섞어 쓰고 있음
- 나도 동의함. 지금은 블로그나 GitHub에 반쯤 완성된 솔루션이 수백 개 떠다니는 시기임
-
나도 비슷한 걸 직접 만들고 있었는데, Anthropic의 접근이 병행 아이디어처럼 보여 놀랐음
단일 모델 제공자에 묶이는 건 절대 피해야 함
작은 팀엔 괜찮을지 몰라도, 복잡한 시스템에선 자살 행위임
여러 모델을 비교·조합해 자신만의 스타일로 관리해야 함. 마치 요리처럼, 상황에 따라 다른 풍미 선택이 필요함- 사실 모두가 비슷한 걸 만들고 있음. 갈 수 있는 방향이 한정적임
- 락인을 피해야 하는 이유가 단순히 성능 때문인지, 아니면 Anthropic이 텔레메트리 데이터를 이용해 나중에 경쟁자로 변할 수 있어서인지 궁금함
- 나도 같은 입장임. openrouter 같은 집계 플랫폼 위에 이런 시스템을 올리는 건 꽤 간단함
-
그 에이전트들이 만든 페이지가 너무 엉망이라 후기 텍스트가 겹쳐서 읽을 수 없었음
- 나는 아예 검은 화면만 보였음
-
나는 Anthropic Agentic SDK로 Jekyll 사이트를 만드는 도커 컨테이너를 돌리고 있음
인프라 구축은 어렵지 않았고, 진짜 어려운 건 에이전트가 원하는 대로 행동하게 만드는 일이었음
언젠가 다른 제공자나 셀프호스팅으로 옮길 수도 있으니, 자유를 유지하고 싶음 -
난 여전히 pydantic ai와 dbos/temporal/celery 조합을 쓸 예정임
특정 업체에 묶이고 싶지 않음. 어떤 LLM이든 자유롭게 쓰고 싶음
오픈소스 오케스트레이션의 발전을 계속 밀어야 함 -
겉보기엔 멋지지만, 비용 폭탄이 될 수도 있음
AWS처럼 부주의하면 수천 개의 에이전트가 돌아가며 청구서가 폭증할 것임
Anthropic에겐 엄청난 수익 모델이 될 듯함 -
이런 방향은 예상된 수순이었음
모델을 더 똑똑하게 만들지 않고도 수익을 늘리고, 사용자 락인을 강화하는 쉬운 방법임
관련 분석은 이 글에 잘 정리되어 있음