GPT‑5.5 공개, DeepSeek 100만 컨텍스트 예고, 구글의 앤스로픽 최대 400억 달러 약정, 지메일 AI 오버뷰 탑재
에이전트가 활약한 한 주: GPT‑5.5가 다단계 업무에 도전하고, DeepSeek가 장문 컨텍스트 비용을 낮췄으며, 구글은 앤스로픽을 위해 수십억 달러 규모의 컴퓨트를 확보했다 — 지메일과 어도비는 보조원을 일상 워크플로에 들였다.
이번 주 한 줄
OpenAI가 ‘일을 끝내는’ GPT‑5.5를 공개했고, DeepSeek는 100만 토큰 컨텍스트 모델을 저가 토큰으로 예고, 구글은 앤스로픽에 현금 100억 달러(컴퓨트 포함 최대 400억 달러)를 약정했으며, 지메일에는 AI 오버뷰가 추가됐다 — 일상 도구가 더 빠르고 저렴해지며 에이전트화되고 있다.
이번 주 숫자
- 82.7% — 복잡한 커맨드라인 워크플로를 측정하는 Terminal‑Bench 2.0에서 GPT‑5.5가 기록한 점수. 1
- $0.14/100만 토큰 — DeepSeek V4 Flash 입력 단가; 출력은 $0.28/100만. 2
- 100억 달러(최대 400억 달러) — 컴퓨트 접근 권한을 묶은 구글의 앤스로픽 현금 약정. 3
- 5 GW — 앤스로픽이 AWS로부터 확보한 컴퓨트 용량(1,000억 달러, 10년 지출 계획과 병행). 4
- 약 40% 더 빠름 — OpenAI는 Responses API(응용프로그램 인터페이스)의 WebSockets 사용 시 에이전트 루프가 약 40% 빨라졌다고 밝혔다. 5
- 5.1억 달러 — IPO 신청서에서 공개된 Cerebras의 2025년 매출. 6
- 2–5배 — Siemens는 신규 엔지니어링 에이전트가 수작업 대비 2~5배 빠르게 워크플로를 완료한다고 밝혔다. 7
TOP 뉴스
오픈AI, 에이전트형 컴퓨터 활용 위한 GPT‑5.5 출시
OpenAI가 ChatGPT의 Plus, Pro, Business, Enterprise에 GPT‑5.5를 도입했다. 다단계 작업을 계획하고 소프트웨어와 도구를 조작해 세세한 지시 없이 결과를 마무리하도록 설계됐으며, 토큰당 지연은 GPT‑5.4 수준을 유지한다. 성능은 Terminal‑Bench 2.0 82.7%, SWE‑Bench Pro 58.6%, GDPval 84.9%, OSWorld‑Verified 78.7% 등을 기록했다. 1
OpenAI는 이를 더 ‘에이전트적이고 직관적인 컴퓨팅’을 향한 이정표로 규정하며, 내부/외부 안전 프레임워크 하의 테스트와 약 200곳의 얼리 액세스 파트너 피드백을 거쳤다고 밝혔다. 현재는 ChatGPT 등급 전반에 배포 중이며, 추가 안전장치 적용 후 API 접근을 제공할 계획이다. 8
DeepSeek V4 프리뷰: 100만 토큰 컨텍스트와 낮은 토큰 가격
DeepSeek는 MoE(전문가 혼합) 아키텍처의 V4 Flash와 V4 Pro 두 모델을 예고했다. 두 모델 모두 1,000,000‑토큰 컨텍스트 윈도우를 제공하며, V4 Pro는 1.6T 파라미터(요청당 활성 49B), Flash는 284B(활성 13B) 구성을 갖췄다. 보도에 따르면 코딩 성능 경쟁력이 확인됐으나 현재는 텍스트 전용 입출력을 지원한다. 2
가격은 경쟁사를 압박한다. V4 Flash는 입력 $0.14/100만, 출력 $0.28/100만이고, V4 Pro는 입력 $0.145/100만, 출력 $3.48/100만이다. 별도 보도는 일부 작업에서 최상위 폐쇄형 시스템 대비 여전히 격차가 남아 있음을 지적한다. 9
구글, 앤스로픽에 현금+컴퓨트 최대 400억 달러 약정
Axios에 따르면 구글은 현금 100억 달러에 더해 최대 300억 달러 추가 가능성을 열어두고, 구글 인프라에서 5GW 컴퓨트 접근 권한을 묶어 제공하기로 했다. 거래는 앤스로픽의 기업가치 3,500억 달러 기준으로 체결됐으며, 컴퓨트 통제가 자본만큼이나 핵심이 됐음을 보여준다. 3
이와 병행해 앤스로픽은 AWS와의 협약으로 최대 5GW 용량을 확보하고 10년에 걸쳐 1,000억 달러 지출을 약정, 전력과 칩을 대규모로 선점하는 멀티클라우드 전략을 드러냈다. 4
ChatGPT Images 2.0, 웹 근거·일관된 시리즈 생성 추가
OpenAI가 ChatGPT에 Images 2.0을 도입했다. Thinking 모델과 결합하면 웹을 참조하고, 프롬프트당 최대 8장의 이미지를 동일한 캐릭터/스타일로 일관되게 생성하며, 더 다양한 종횡비와 최대 2K 해상도를 지원하고 비라틴 문자 렌더링도 개선했다. 10
팀을 위한 접근 옵션도 중요하다. 유료 등급은 GPT‑5.3 Instant 또는 GPT‑5.4 Thinking을 선택할 수 있으며, 수동 Thinking 사용량은 Plus/Business에서 주당 최대 3,000건으로 제한된다. 더 큰 컨텍스트 윈도우와 ‘생각 시간’ 토글로 속도와 깊이를 균형 있게 조절할 수 있다. 11
오픈AI, ‘DeployCo’ 추진과 에이전트 루프 가속
Private Equity Wire에 따르면 OpenAI는 사모자본과 연계한 벤처(‘DeployCo’)에 최대 15억 달러를 투입하는 방안을 협의 중이다. 바이아웃 펀드 포트폴리오 전반에 자사 도구를 심고, OpenAI가 과반을 보유하며 현장 배치 엔지니어 모델을 채택, 기업가치 약 100억 달러를 겨냥한다. 12
한편 OpenAI는 Responses API(응용프로그램 인터페이스)에 WebSockets를 도입해 에이전트 워크플로 지연을 약 40% 단축했다. 최종 사용자 체감 처리속도를 초당 약 65 토큰에서 거의 1,000 토큰으로 끌어올리고, 버스트는 초당 약 4,000 TPS(tokens per second)에 도달한다고 밝혔다. 5
OpenAI는 또한 Codex 도입 사례와 함께 액센추어, 캡제미니, CGI, 코그니전트, 인포시스, PwC, TCS 등 시스템 통합 파트너 네트워크를 통해 수천 개 조직의 파일럿을 프로덕션으로 전환 중이라고 밝혔다. 13
어도비, 마케팅 에이전트 모음 ‘CX Enterprise’ 출시
어도비가 디지털 마케팅 자동화·개인화를 위한 AI 에이전트 제품군 CX Enterprise를 공개했다. 출시 당일 주가는 장중 2.2% 상승세를 보였다. 14
‘Coworker’ 에이전트는 다른 에이전트를 조율하고 관련 데이터를 수집·구성할 수 있으며, 아마존, 마이크로소프트, 앤스로픽, OpenAI, 엔비디아와의 파트너십을 기반으로 거버넌스가 적용된 엔터프라이즈형 에이전트 도입 경로를 제시한다. 15
Siemens, PLC 코딩용 AI 엔지니어링 에이전트 출시
Siemens는 TIA Portal 환경에서 PLC(Programmable Logic Controller) 코딩, HMI(Human–Machine Interface) 시각화, 장치 구성 자동화를 지원하는 Eigen Engineering Agent를 공개했다. 19개국 100개사 이상의 파일럿에서 수작업 대비 2~5배 속도, 해결 품질 최대 80% 향상, 엔지니어링 효율 50% 향상을 주장했다. 7
하노버 메세에서는 로크웰이 디지털 트윈 시뮬레이션, AI 보조 코드 생성, 검증을 잇는 AI 오케스트레이션 워크플로를 시연해 AI 네이티브 엔지니어링으로의 전환을 부각했다. 16
Cerebras, 웨이퍼‑스케일 AI 칩으로 IPO 신청
Cerebras가 상장을 신청하며 2025년 매출 5.1억 달러, GAAP 순이익 2.378억 달러, 비GAAP 순손실 7,570만 달러를 공개했다. 학습·추론에서 GPU 클러스터 대안으로 웨이퍼‑스케일 하드웨어를 제시한다. 6
지메일 업무용 계정에 AI 오버뷰 도입
구글이 업무용 지메일에 AI 오버뷰를 순차 도입한다. 자연어로 질문하면 각 스레드를 열어보지 않고도 여러 메일에서 요지를 추려 요약을 제공한다. 워크스페이스용 Gemini와 관련 스마트 기능을 관리자가 활성화한 환경에서는 기본적으로 켜진다. 17
Cohere, Aleph Alpha와 합병해 ‘주권형 AI’ 공략
Cohere는 독일의 Aleph Alpha와 합쳐 기업과 정부에 데이터·배포 통제를 강화한 옵션을 제공할 계획이다. 슈바르츠 그룹의 5억 유로(약 6억 달러) 약정과 함께, 합산 기업가치 약 200억 달러가 거론된다. 18
로이터는 합병 후 지분 구조가 Cohere 주주 약 90%, Aleph Alpha 주주 약 10%가 될 전망이라고 전하며, 유럽 및 그 너머의 규제 산업을 중심으로 확장을 모색한다고 보도했다. 19
이번 주 트렌드 분석
에이전트 우선 워크플로가 일상 도구 속으로 파고들었다. GPT‑5.5는 다단계 업무를 계획·실행하려 하고, 지메일의 AI 오버뷰는 복잡한 스레드를 답변으로 압축하며, 어도비의 CX Enterprise는 마케팅 작업을 조율한다. OpenAI의 워크스페이스 에이전트(Business/Enterprise/Edu/Teachers)는 일을 끊기지 않게 이어가는 내장형 보조원의 등장을 예고한다. 콘텐츠를 작성할 뿐 아니라 소프트웨어를 조작하고 거버넌스된 스택에 연결되는 보조원이 표준이 되는 흐름이다. 1 17
컴퓨트 전략은 한층 공고해졌다. 구글의 앤스로픽 100억 달러(최대 400억 달러) 패키지와 앤스로픽의 별도 AWS 1,000억 달러/5GW 약정은 ‘틈날 때마다’가 아닌 멀티클라우드·멀티GW 조달로의 전환을 보여준다. Cerebras의 IPO 신청과 데이터 플랫폼 자금 조달은 칩과 스토리지가 모두 병목이며, 이제 팀이 명시적으로 예산을 책정하는 항목임을 상기시킨다. 비전문가에게는 벤더의 기반 용량 확장에 따라 더 안정적인 쿼터, 명확한 SLA, 더 빠른 응답이 기대된다는 신호다. 3 6
오픈 가중치 효율은 비용을 낮췄다. DeepSeek V4의 100만 토큰 컨텍스트와 저가 과금은 복잡한 청크 없이 장문 문서·대규모 코드베이스를 겨냥한다. 동시에 구글 Gemma 4와 다른 오픈 패밀리는 로컬 우선 에이전트 워크플로와 긴 컨텍스트를 범용 런타임 전반에 강조한다. 핵심은 거버넌스와 평가가 뒷받침된다면 더 많은 작업이 더 저렴한 스택, 심지어 자체 하드웨어로 이동할 수 있다는 점이다. 2 20
주목할 포인트
- “DeployCo” — OpenAI의 사모지원 벤처가 성사되면, 포트폴리오 전반에서 현장 배치 엔지니어와 함께하는 임베디드 롤아웃이 늘어날 수 있다. 12
- “추론 칩” — 구글의 전용 추론 실리콘 드라이브는 지연시간·비용 경쟁을 예고한다. 가용성과 파트너 수주를 주시할 것. 21
- “플로리다 검찰 수사” — 총격 사건에서 ChatGPT 연루 의혹과 관련한 OpenAI 형사 수사가 책임·정책 이슈를 던진다. 22
이번 주 오픈소스
- browser‑harness — Chrome DevTools Protocol 위의 미니멀 자가복구 브라우저 에이전트 하니스; 작업 도중 에이전트가 하니스를 수정할 수도 있다. 무거운 프레임워크보다 신뢰성을 중시하는 팀에 유용. browser-use/browser-harness
- screenpipe — “화면을 위한 AI 메모리.” 백그라운드 에이전트가 회의를 요약하고 작업 중 맥락을 띄운다; 데스크톱 활발한 개선 진행. 개인 생산성 파일럿에 적합. screenpipe/screenpipe
- Hermes Agent — 상시 동작하는 서버 측 어시스턴트로 재사용 가능한 ‘스킬’을 학습하며 장기 메모리와 멀티 플랫폼 채팅 게이트웨이를 제공. MIT 라이선스. NousResearch/hermes-agent
- nanobot — 초경량 퍼스널 에이전트. PyPI에서 손쉬운 설치, Windows와 Python 3.14 지원 추가; 단순한 로컬 도우미가 필요한 사용자에게. HKUDS/nanobot
- Harvard CS249r + TinyTorch — 실습형 머신러닝 시스템 교재와 랩(한국어 포함 다국어 문서). 최신 TinyTorch는 더 풍부한 텐서 API와 보안 패치를 포함. harvard-edge/cs249r_book
이번 주 해볼 것
- 진짜 다단계 업무에 GPT‑5.5 투입: “자료 찾기, 슬라이드 초안, 스프레드시트 작성”까지 시키고 계획·검증 절차를 점검해 보자. 1
- ChatGPT Images 2.0으로 한 번의 프롬프트에 6–8장 일관 세트 생성; 가로/세로 극단 종횡비도 시험. 10
- 업무용 지메일에서 AI 오버뷰 켜기(관리자에게 Workspace용 Gemini와 스마트 기능 활성 요청), 그런 뒤 “지난주 SOW에서 뭐가 바뀌었지?”를 물어보자. 17
- 상시 동작 데스크톱 에이전트 체험: screenpipe 설치 후 업데이트된 ‘회의 요약’ 흐름을 테스트. 23
댓글 (0)