오픈AI 1,220억 달러 조달·AWS 2GW 트레이니엄 협력, 엔비디아 Vera CPU 공개… 엔터프라이즈 에이전트가 ‘더 빠르고 더 통제된’ 모습으로 일로 들어온 한 주
에이전트 플랫폼과 가드레일이 출하되고, ChatGPT는 기본으로 더 빨라졌으며, 엔비디아는 새 CPU로 에이전트 병목을 겨냥했고, 오픈AI는 대규모 자금과 AWS 용량을 확보했다 — 파일럿에서 프로덕션으로 에이전트를 옮기는 데 방점이 찍힌 한 주.
이번 주 한 줄
오픈AI가 1,220억 달러를 조달하고 AWS 트레이니엄 2GW 협력을 체결했으며, 엔비디아는 에이전트용 Vera CPU를 공개했다. 구글은 엔터프라이즈 에이전트 플랫폼을 출시했고, ChatGPT 기본 모델이 GPT‑5.5 Instant로 바뀌었다 — 더 빠르고, 더 거버넌스가 갖춰진 에이전트가 일상 업무로 이동 중이다.
이번 주 숫자
- 1,220억 달러 — 오픈AI가 “AI의 다음 단계를 가속”한다며 발표한 신규 조달 규모로, 기업가치 8,520억 달러 기준. 1
- 88코어 — 엔비디아 Vera CPU가 비GPU 에이전트 작업 가속을 위해 탑재한 Arm 기반 Olympus 코어 수. 2
- 2GW — 확대된 AWS 파트너십 하에서 오픈AI가 사용하기로 합의한 Trainium 용량. 3
- 6.5배 — 이미지 모델 출시가 챗봇 업그레이드 대비 앱 다운로드 상승에 미치는 효과(추정치, Appfigures). 4
- 220,000 GPU — Anthropic이 더 높은 Claude 한도와 연계해 활용 가능하다고 밝힌 SpaceX Colossus 1의 연산 자원. 5
- 10억 유로+ — SAP가 표형(tabular) AI를 핵심 제품에 넣기 위해 Prior Labs를 인수하며 4년에 걸쳐 집행하는 투자 규모. 6
- 1,000,000 토큰 — 장기·에이전트형 작업을 겨냥한 엔비디아 Nemotron 3 Super의 컨텍스트 윈도우. 7
TOP 뉴스
오픈AI, 1,220억 달러 조달… 에이전트 중심 ‘슈퍼앱’과 멀티클라우드 스택 구상 공개
오픈AI는 “AI의 다음 단계를 가속”한다며 1,220억 달러를 조달(기업가치 8,520억 달러)했다고 발표하며, 컴퓨트와 제품 통합을 핵심 우위로 내세웠다. 다중 클라우드·다양한 칩과 브로드컴과 협력하는 사내 칩을 포함한 폭넓은 인프라 전략, 그리고 ChatGPT·코딩·검색·브라우징을 하나의 에이전트 중심 인터페이스로 통합하는 계획을 제시했다. 또한 주간 활성 사용자 9억 명, 유료 구독자 5,000만+ 명, 월 매출 20억 달러, 분당 150억 토큰을 처리하는 API, 1억 달러 ARR을 상회한 광고 파일럿 등 규모 지표를 공개했다. 비전문가에게는 ‘대화’가 아니라 ‘다단계 업무’를 수행하는 AI가 온다는 신호다. 1
오픈AI·아마존: 2GW 트레이니엄, 베드록 통합, 상태 보존 런타임
오픈AI와 아마존은 Amazon Bedrock을 통해 제공될 “상태 보존(Stateful) 런타임 환경”을 공동 제작하고, 오픈AI 프론티어의 제3자 클라우드 독점 유통사로 AWS를 지정하기로 합의했다. 이번 합의에는 약 2GW 규모의 AWS 트레이니엄 용량이 포함되며, 기존 380억 달러 계약을 향후 8년에 걸쳐 1,000억 달러 증액하고, 아마존의 500억 달러 투자(선납 150억 달러 + 조건부 350억 달러)가 추가된다. AWS를 쓰는 기업에겐 베드록 권한·모니터링과 정렬된 오픈AI 에이전트를 예고하는 신호다. 3
엔비디아, 에이전트 병목을 푸는 Vera CPU 공개
Vera는 대형 언어 모델(LLM)을 둘러싼 ‘접착(glue)’ 작업 — 코드 실행, 툴 호출, 오케스트레이션 루프 — 을 가속하려 설계된 데이터센터 CPU다. Arm 기반 Olympus 코어 88개, 최대 1.2 TB/s 메모리 대역폭, NVLink‑C2C를 통한 루빈(Rubin) GPU와의 최대 1.8 TB/s 코히어런트 대역폭을 제공하며, 전통적 CPU 대비 “샌드박스” 성능이 최대 50% 빠르다고 한다. 랙당 최대 256개의 액체 냉각 Vera CPU를 통합해 동시 22,500+개의 CPU 환경을 지원, 에이전트 워크플로의 지연 편차를 줄이는 것을 목표로 한다. 8 2
ChatGPT, 기본 모델을 GPT‑5.5 Instant로 전환
오픈AI는 ChatGPT 기본 모델을 GPT‑5.5 Instant로 바꾸며, 더 빠른 응답과 민감 주제 오답 감소, 그리고 답변을 만든 컨텍스트를 사용자가 보고 편집할 수 있는 “메모리 소스” 표기를 강조했다. GPT‑5.3 Instant 대비 더 높은 점수(예: AIME 2025 81.2 vs 65.4)와 GPT‑5.4와의 지연 시간 동등성이 보고됐다. API에서는 GPT‑5.5가 “chat‑latest”로 나타나며, 유료 사용자는 3개월 동안 GPT‑5.3을 선택해 동작을 비교할 수 있다. 9 10
구글, 업무용 Gemini 엔터프라이즈 에이전트 플랫폼 출시
구글 클라우드는 임직원용 AI 에이전트를 구축·확장·거버넌스·모니터링하도록 설계된 Gemini Enterprise Agent Platform(기존 Vertex AI의 진화형)을 공개했다. 에이전트 제작 도구(Agent Studio, 업그레이드된 Agent Development Kit), 장시간 실행 Agent Runtime과 Memory Bank, 거버넌스를 위한 아이덴티티/레지스트리/게이트웨이, 시뮬레이션·평가·가시성 기반 품질 통제, Model Garden의 200+ 모델 접근을 묶어 제공한다. 메시지는 분명하다: IT가 통제하고 현업이 만들 수 있게 표준화된 툴체인을 제공하겠다는 것. 11
Gemini File Search, 페이지 단위 인용을 갖춘 멀티모달 검색 추가
구글은 Gemini API의 File Search를 확장해 텍스트·이미지를 가로지르는 검색, 커스텀 메타데이터 필터, 페이지 레벨 인용을 지원하도록 했다 — 근거 검증이 핵심인 RAG(검색 증강 생성) 워크플로에 직접적인 강화다. Gemini Embedding 2로 구동되며, 개발자들은 정량 개선을 보고했다(예: 한 사례에서 Recall@1 +40%, 또 다른 사례에서 Match@20 60%→약 87%), 단일 요청에 혼합 입력도 지원한다. 팀 관점에선 ‘정확히 그 페이지와 스크린샷’을 가리키는 답변을 얻게 된다. 12 13
마이크로소프트, Agent Governance Toolkit 오픈소스로 공개
마이크로소프트는 정책 집행, 제로 트러스트 아이덴티티, 실행 샌드박싱, 신뢰성 엔지니어링 패턴을 OWASP Agentic Top 10 리스크에 매핑한 Agent Governance Toolkit을 공개했다. 5월 5일 기준 v3.4.0인 활성 리포지토리는 문서와 퀵스타트를 포함하고, 기여자 리스크 경보의 오탐을 줄이는 최근 수정도 반영됐다. 툴 콜링 에이전트를 파일럿하는 팀에겐 가드레일을 빠르게 갖출 수 있는 패키지형 베이스라인이다. 14
Anthropic, SpaceX Colossus 연산력 확보… 사용 한도 상향
Anthropic은 Colossus 1 데이터센터 전체 접근을 발표했다 — 300MW 이상, 엔비디아 GPU 220,000대 이상 — 와 함께 Claude Pro/Max 및 API 티어의 레이트 리밋을 올렸다. 아마존, 구글/브로드컴, 애저 등과의 약정을 포함한 수 기가와트 용량 증설의 일환이라고 회사는 설명했다. 여유 용량은 워크플로를 바꾸지 않고도 더 긴 코딩·분석 세션을 가능하게 한다. 5
엔비디아, 에이전트형 AI용 Nemotron 3 Super(및 Nano Omni) 공개
Nemotron 3 Super는 멀티에이전트 계획과 툴 사용에 특화된 오픈 웨이트 모델로(파라미터 120B, 활성 12B), 1,000,000 토큰 컨텍스트로 장기 작업을 유지하며 이전 세대 대비 처리량이 최대 5배 높다고 한다. 동반 오픈 멀티모달 모델 Nemotron 3 Nano Omni는 비전·오디오 인코더를 통합해 핸드오프 지연을 줄이고, 유사 상호작용성 구간에서 다른 오픈 ‘옴니’ 모델 대비 최대 9배 처리량을 주장한다. 오픈 웨이트와 NIM 패키징은 로컬에서 클라우드까지 배포 선택지를 넓힌다. 7 15
애플, iOS 27에서 모델 선택 기능 테스트 중이라는 보도
애플은 iOS 27(그리고 iPadOS/macOS 27)에서 사용자가 Siri와 Writing Tools 같은 기능에 사용할 서드파티 AI 모델을 고를 수 있는 “Extensions” 설정을 도입하는 것으로 전해진다. 초기 테스트에는 구글과 Anthropic의 통합이 포함되어, 네이티브 앱 안에서 사용자 중심의 멀티모델 경험을 시사한다. 덕분에 사람들은 앱을 오가지 않고도 작업별로 모델의 강점을 매칭할 수 있게 될 전망이다. 16 17
이번 주 트렌드 분석
이번 주 에이전트 소프트웨어는 한층 단단해졌다: 플랫폼과 가드레일이 함께 출시되고, 검증 가능한 검색이 더해졌다. 구글의 Gemini Enterprise Agent Platform은 빌드에서 거버넌스까지의 워크플로를 정식화했고, 마이크로소프트의 Agent Governance Toolkit은 정책·아이덴티티·샌드박스를 포괄했다. 구글 File Search의 페이지 단위 인용은 RAG를 ‘답변’에서 감사 가능한 ‘증거’로 옮긴다. 팀 입장에선 추적 가능한 산출물로 파일럿에서 프로덕션까지의 경로가 깔끔해졌다. 11 14 12
인프라는 에이전트 병목과 장기 지평에 더 기울었다. 엔비디아 Vera CPU는 LLM 호출 사이에서 에이전트를 멈추게 하는 CPU 경합 단계를 겨냥하고, 오픈AI의 2GW AWS 딜과 베드록 기반 상태 보존 런타임은 지속 상태와 클라우드 정렬을 시사한다. 엔비디아 Nemotron 3 Super는 컨텍스트를 1,000,000 토큰으로 늘려 재프롬프트 없이도 에이전트가 전체 작업 상태를 유지하도록 한다. 공통점은 ‘더 짧은 대기’와 ‘더 적은 취약한 핸드오프’다. 8 3 7
자본과 용량은 엔터프라이즈 배포를 중심으로 더 집중됐다. 오픈AI의 1,220억 달러 조달은 연구를 지속 가능한 제품으로 전환하려는 의지를 강조하고, Anthropic의 SpaceX Colossus 220,000 GPU 접근과 수 기가와트급 약정은 당장 쓸 수 있는 여유를 넓힌다. AWS 베드록과의 결합은 기존 엔터프라이즈 클라우드에서 에이전트 스택의 조달과 거버넌스를 더 매끈하게 할 신호다. 요지는 기업이 이미 쓰는 시스템 안으로 더 많은 AI가 들어온다는 것. 1 5 3
사용자 경험도 보조를 맞췄다: ChatGPT는 편집 가능한 “메모리 소스”와 함께 GPT‑5.5 Instant로 이동했고, 구글의 파일 기반 답변은 이제 정확한 페이지를 인용한다. 애플은 기능별 모델 선택을 시험 중인 것으로 전해진다. 이 변화가 합쳐지면, 더 빠르고 투명하며 과업·톤에 맞춤화하기 쉬운 어시스턴트가 ‘일상 앱’ 안으로 들어온다. 9 12 16
주목할 포인트
- “Stateful Runtime Environment” — 관련 프리뷰나 문서를 보게 된다면, 오픈AI와 AWS가 베드록에 영속 에이전트 상태를 들여오는 신호다. 엔터프라이즈 파일럿의 온램프로 유력. 3
- “iOS 27 Extensions” — 기능별 모델 선택은 기본 앱 안에서 멀티모델 사용을 표준화할 것. 어떤 제공자가 리스트에 오를지 주시. 16
- “2027년 12월 2일(EU 고위험 AI)” — EU 잠정 합의로 일부 고위험 의무가 유예되고, 12월 2일부터 친밀 딥페이크 금지가 추가된다. 컴플라이언스 운영 지침이 조정될 전망. 18
이번 주 오픈소스
- Agent Governance Toolkit — 자율 에이전트를 위한 정책 게이트·제로 트러스트 아이덴티티·샌드박싱·신뢰성 패턴을 제공하는 거버넌스 베이스라인. microsoft/agent-governance-toolkit
- Solace Agent Mesh — 비즈니스 앱 전반의 이벤트를 받아 멀티에이전트를 오케스트레이션하는 이벤트 기반 프레임워크. 통합이 많은 팀에 적합. SolaceLabs/solace-agent-mesh
- Ollama — 오픈 웨이트 모델을 로컬에서 간단히 실행하는 일체형 런너(인스톨러·도커 이미지·공식 Python/JS 클라이언트 제공). 빠른 로컬 프로토타입에 유용. ollama/ollama
- Pi (agent harness) — 통합 LLM API, 코딩 에이전트 CLI, TUI/웹 UI, 슬랙 봇, vLLM 배포 스캐폴딩을 묶은 에이전트 킷. 다양한 인터페이스에 코딩 에이전트를 깔끔히 올릴 때 유용. earendil-works/pi
- ColorBench — 색 지각·강건성에 초점을 둔 비전-언어 벤치마크. 시각 착시에 취약한 지점을 점검하기 좋다. tianyi-lab/ColorBench
이번 주 해볼 것
- 인용 필수 답변 요구: 긴 PDF와 관련 스크린샷을 Gemini File Search에 업로드하고, 업무 질문 5개를 던져 페이지 단위 인용과 시각 자료를 검증. 12
- 가드레일 추가: 마이크로소프트 Agent Governance Toolkit 퀵스타트를 돌리고, 정책 게이트 1개와 툴 콜 샌드박스를 테스트 워크플로에 적용. 14
- ChatGPT에서 작업 재실행: 최근 브리프나 스프레드시트를 GPT‑5.5 Instant로 처리하고 ‘메모리 소스’를 점검해 오래된 컨텍스트를 수정. 9
- AWS 파일럿 구상서: “상태 보존 런타임” 활용 사례(입력, 권한, 성공 지표) 1페이지를 작성해 AWS 담당자에게 타이밍과 접근 권한을 문의. 3
- 폴링을 웹훅으로 대체: 장기 실행 작업에 Gemini API 이벤트 기반 웹훅을 설정하고, 자동 재시도와 서명 검증을 점검. 19
댓글 (0)