클로드 ‘매니지드 에이전트’ 공개 — 실사용 단계 전환의 신호
에이전트를 직접 운영하기 부담스러웠다면, 이번엔 다릅니다. Anthropic이 인프라까지 맡는 ‘매니지드 에이전트’를 열었고, 가격과 기능이 현실적으로 나왔어요.
한 줄 요약
Anthropic이 에이전트 배포용 ‘Managed Agents’ 공개 베타를 열었어요.
Big Tech
OpenAI, Promptfoo 인수로 에이전트 보안 강화
OpenAI가 2024년에 설립된 AI 보안 스타트업 Promptfoo를 인수했어요. Promptfoo는 대형 모델을 공격 시나리오로 테스트하고 에이전트 워크플로의 보안 약점을 평가하는 도구를 만들었고, OpenAI는 이를 OpenAI Frontier에 통합해 자동 레드팀, 위험·컴플라이언스 모니터링을 제공하겠다고 했습니다. Promptfoo는 포춘 500의 25% 이상이 사용한다고 밝혔고, 오픈소스 제공도 이어갈 계획이에요. 1
이 인수는 ‘에이전트가 실제 일할 때’ 필요한 증빙—데이터 유출 방지와 조작 대응—에 대한 수요를 보여줘요. 모델 성능만이 아니라 거버넌스와 모니터링을 포함한 ‘운영 가능한 자동화’가 기업 선택 기준이 되는 흐름과 맞닿아 있습니다. 거래 금액은 비공개지만, 통합 대상은 OpenAI의 엔터프라이즈 에이전트 플랫폼이에요. 1
툴을 고를 때 이제 “보안 내장”이 기본값이 됩니다. 자동 레드팀과 트레이스 기반 평가가 로드맵에 있는지 확인하세요. 단순한 프롬프트 개선만으로는 운영 신뢰를 얻기 어렵습니다. 1
Industry & Biz
Cohere–Aleph Alpha 합병 논의: 유럽–캐나다 연합 가능성
로이터에 따르면 캐나다의 Cohere와 독일의 Aleph Alpha가 합병을 논의 중이며, 베를린이 잠재적 거래를 지지하고 결합 회사의 핵심 고객이 되는 방안까지 검토 중이라고 해요. 올해 초 시작된 논의는 진전된 단계로 알려졌고, 본사는 양국에 두는 구상도 거론됐습니다. Aleph Alpha는 전략적 파트너십 논의가 업계 표준이라며 세부 언급을 피했고, Cohere는 유럽에서의 성장 기회를 지속 검토 중이라고 밝혔습니다. 2
만약 성사되면 미국 빅테크 대안이 될 ‘주권 친화형’ 옵션이 늘어날 수 있어요. 특히 공공·규제 산업에서 지역 요구사항을 중시하는 고객에게 선택지가 될 수 있죠. 다만 일정과 구조는 아직 확정되지 않았습니다. 3
한편 인프라 제휴는 빨라지고 있어요. 예로 Anthropic은 CoreWeave와 다년 계약을 맺고 Claude 워크로드를 해당 데이터센터에서 운영합니다. 이런 모델–인프라 결합은 가용성, 지연시간, 지역 배포 옵션에 직접적 영향을 주니, 공급사 선택 시 참고할 포인트예요. 4
미 행정부 AI 국가 프레임워크: 연방 기준·아동 보호 강조
백악관은 2026년 3월 20일 AI 국가 정책 프레임워크를 공개했어요. 핵심은 일부 주(州) 법을 연방 기준으로 선제해 단일 표준을 만들되, 아동·소비자 보호, AI 인프라 관련 조닝, 주 정부의 자체 AI 조달·사용 권한은 남긴다는 거예요. 새로운 AI 전담 규제기관은 두지 않고 규제 샌드박스와 기존 부처 중심 감독을 권고하며, 저작권 데이터 학습은 법원의 판단에 맡기겠다는 입장을 밝혔습니다. 5
단기적으로는 의회 입법이 필요하기 때문에 ‘과도기적 혼합 규제’가 이어질 전망이에요. 앞선 행정명령은 연방 차원의 소송 태스크포스를 만들어 과도한 주 법을 다투고, 일부 연방 자금 집행 시 주의 AI 정책을 조건으로 삼는 방안도 검토합니다. 즉, 연방 기준과 충돌하는 의무 공개 조항 등에 대한 견제가 강화될 수 있어요. 6
법률 분석에 따르면 우선순위가 명확합니다: 아동 보호(연령 확인, 보호자 도구), 새로운 규제기관 불가, 샌드박스·데이터 접근 확대. 여러 주에서 소비자 보호법을 통해 AI를 감독해온 만큼, 기업은 주기반 소비자 보호 준수를 계속 최우선에 둬야 해요. 7
New Tools
Anthropic: 클라우드형 ‘Managed Agents’ 공개 베타
Anthropic이 Claude Platform에서 클라우드 호스팅 에이전트 구축·배포용 ‘Managed Agents’를 공개 베타로 열었어요. 샌드박스 코드 실행, 상태 체크포인팅, 자격증명 관리, 인증, 엔드투엔드 트레이싱을 제공하고, 수시간 동안 이어지는 장기 세션과 연결 끊김 복구도 지원합니다. 초기 이용사로 Notion, Rakuten, Asana, Vibecode, Sentry가 소개됐고, 요금은 토큰 비용 외 활성 런타임 시간당 0.08달러가 추가돼요. 8
멀티에이전트 조정(서브에이전트 생성·병렬 수행)과 성공 기준을 향한 자기 평가 루프는 리서치 프리뷰로 공개됐고, 구조화 파일 생성 과제의 내부 테스트에서 표준 프롬프트 루프 대비 최대 10%p 성공률 향상이 확인됐습니다. 필요 시 전통적 프롬프트–응답 방식과 에이전트 오케스트레이션을 혼용할 수 있어요. 8
왜 중요할까요? 프로덕션 전환의 병목은 보통 프롬프트가 아니라 운영 배관—실행 격리, 상태, 자격증명, 관측·권한—이에요. Managed Agents는 이를 묶어 제공해, 코드베이스 읽고 PR을 열거나 문서에서 구조화 데이터를 뽑는 등 실무 자동화를 소규모 팀도 빠르게 띄우게 합니다. 9
비개발자에게는 더 간단해요. 팀즈·슬랙·노션처럼 이미 쓰는 공간에서, 다단계 업무를 Claude에 위임하고 콘솔에서 ‘무엇을 했는지’ 추적할 수 있다는 뜻입니다. Notion은 워크스페이스 내부 커스텀 에이전트를, Rakuten은 슬랙·팀즈 연계를 통해 스프레드시트·슬라이드·앱 산출을 시연했어요. 8
Databricks, Quotient AI 인수로 에이전트 평가 강화
Databricks가 Quotient AI를 인수해 AI 에이전트의 지속 평가·강화학습 역량을 보강합니다. Quotient는 전체 에이전트 트레이스를 분석해 환각, 추론 실패, 잘못된 도구 사용을 감지하고, 이를 클러스터링해 모니터링과 미세조정에 쓰는 데이터셋·리워드 신호로 전환해요. 10
Databricks는 이 역량을 Genie(데이터 대화형 에이전트), Genie Code(데이터·ML 워크플로 자율 에이전트), Agent Bricks(자체 데이터로 에이전트 구축·확장) 전반에 심겠다고 밝혔습니다. 목표는 ‘돌아가는 에이전트’를 넘어 ‘쓰일수록 좋아지는 에이전트’예요. 10
팀 입장에서는 기준선이 바뀝니다. 배포 전 정적 벤치마크 대신, 실제 트레이스 기반 신호를 품질 지표로 삼아야 해요. 앞으로 플랫폼 로드맵에서 트레이스 수집·분석·피드백 루프가 ‘에이전트 품질 운영’의 핵심이 될 가능성이 큽니다. 10
커뮤니티 반응
Hacker News (41↑) — Anthropic의 에이전트 마케팅에 회의적이며, 과대평가·보안 위험을 우려하는 분위기예요.
"언제나 정도의 문제라는 말이 맞아요. Opus도 해킹을 잘 못 하는 편은 아니죠. 가끔 실수로 '해킹'을 하기도 해요. Mythos가 그걸 더 잘한다면, 어느 시점에선 문제가 될 수 있습니다. 특히 감독 없이 작동할 때요." — Hacker News 8
나에게 주는 의미
-
챗봇에서 ‘팀 동료’로: 호스팅 에이전트는 다단계 업무(예: 브리프로 슬라이드 초안, 문서 묶음에서 표 추출, 소규모 코드 변경 제안)를 운영 배관 없이 위임하게 해요. 시간 기록과 활동 로그가 따라오는 단기 아르바이트를 쓴다고 생각하면 이해가 쉬워요. 8
-
거버넌스가 기본값: OpenAI–Promptfoo는 자동 레드팀, 트레이싱, 정책 제어가 ‘있어야 하는 기능’이 됐다는 신호예요. 상사가 “개인정보 안 건드렸지?”라고 물으면, 공급사 네이티브 추적과 권한 스코프를 바로 보여줄 수 있어야 안심을 줍니다. 1
-
전략적 유연성: Cohere–Aleph Alpha 논의와 Anthropic–CoreWeave 같은 모델–인프라 결합은 통합 스택을 늘리는 대신 락인을 키울 수 있어요. 슬랙·팀즈·노션 같은 ‘이미 쓰는 표면’에서 파일럿을 시작해, 뒷단 엔진을 바꿔도 업무 흐름은 지킬 수 있게 하세요. 2
-
정책 체크: 연방 프레임워크는 일부 주 규제를 선제하려 하지만, 소비자·아동 보호는 주 권한으로 남아요. 여러 주에서 운영한다면 공개·연령 확인·콘텐츠 안전 기능을 최신으로 유지하세요. 나중에 연방 조정이 오더라도 지금은 주 집행이 현실이에요. 5
지금 할 일
- Claude Managed Agent 파일럿 실행: Claude 콘솔에서 ‘PDF 묶음 요약 → 스프레드시트 작성’ 같은 간단한 다단계 작업을 정의하고, 세션 트레이싱으로 실행 과정을 직접 확인해 보세요.
- 도구 권한 스코프 연습: 읽기 전용 드라이브나 레포 같은 저위험 자격증명을 만들어 Managed Agent에 연결하고, 접근 로그와 권한 설정을 점검해 보세요.
- 에이전트 품질 체크리스트 작성: Databricks의 Quotient AI 글을 읽고 환각·도구 오류 등 ‘트레이스 기반 신호’ 중 배포 전 반드시 보고 싶은 항목으로 사내 go/no-go 체크리스트를 만드세요.
- AI 보안 소스 구독: 미 행정부 AI 프레임워크 요약을 북마크하고, AI Sec Watch 같은 보안 인텔리전스 피드를 업무용 북마크에 추가해 최신 이슈를 따라가세요.
댓글 (0)