AI, ‘대화’에서 ‘실제 실행’로: 에이전트화 가속
이번 주 에이전트가 현실화됐다: Claude 4.7은 장시간 코딩을 조여 붙였고, 구글 AI 모드는 답을 페이지 옆에 붙였으며, 메타는 멀티 기가와트 칩을 고정하고 OpenAI는 AWS와 더 깊어졌다 — 계획하고 실행하며 시간을 절약하는 AI로 수렴 중이다.
이번 주 한 줄
Anthropic의 Claude Opus 4.7, 구글의 AI 모드 분할 화면, 메타의 멀티 기가와트급 맞춤 칩, OpenAI–AWS 심화 동맹으로 AI가 채팅을 넘어 실제 일을 수행하는 ‘에이전트’로 수렴 중.
이번 주 숫자
- 월 100달러 — OpenAI의 새로운 ChatGPT Pro 요금제. 코덱스 헤비 유저를 겨냥해 20달러 Plus와 200달러 Pro 사이의 수요를 메운다. 1
- 1GW+ — 메타가 브로드컴과 체결한 맞춤형 AI 칩 초기 용량 약정. 2029년까지 멀티 기가와트로 스케일. 2
- 500억 달러 — 아마존이 OpenAI에 수년간 투자 계획과 함께 Frontier의 서드파티 클라우드 독점 유통 파트너로 합류. 3
- 50억 달러 — 액셀의 레이트 스테이지 신규 펀드. AI 소프트웨어·하드웨어·로보틱스·데이터센터 전반에 평균 2억 달러 내외로 약 20건 투자 예정. 4
- 22% 더 빠르게, 출력 토큰 M당 19.50달러 — 마이크로소프트 MAI‑Image‑2‑Efficient, 기존 대비 이미지 생성 비용 약 41% 절감, GPU당 처리량 4배. 5
- 1,300만 명 / 시드 이후 2,200만 달러 A라운드 — 학습 앱 기즈모의 사용자 규모와 신규 투자로 AI 학습 도구 확장. 6
- 1.5B 밸류에 1.5억 달러 — 자율 코딩 에이전트 스타트업 ‘Factory’의 조달 추진 보도. 7
TOP 뉴스
Anthropic, 고난도 코딩·장시간 작업용 Claude Opus 4.7 출시
Anthropic이 지시 이해, 자기 점검, 고해상도 비전을 강화한 Claude Opus 4.7을 공개했다. 다단계 소프트웨어 작업과 수시간 에이전트 실행을 겨냥하며 4.6과 동일한 가격(입력 M당 5달러, 출력 M당 25달러)이다. 개발자 벤치마크에서 SWE‑bench Pro 64.3%, SWE‑bench Verified 87.6%로 상용 모델 중 선도 성능을 보였고, 파트너들은 툴 오류 감소와 실패 복구력 개선을 보고했다. 사이버 보안 안전장치가 강화됐고 토크나이저 변경으로 동일 입력 대비 토큰 수가 늘 수 있어 예산 반영이 필요하다. 일반 사용자에겐 “대화”를 넘어 “실제 수행”의 신뢰성이 높아졌다는 의미다. 8 9
구글 AI 모드, 분할 화면 브라우징과 매장 통화 보조 추가
구글은 AI 모드에서 웹페이지를 AI 패널과 나란히 열 수 있게 해 탭 이동을 줄이고, 현재 보고 있는 페이지에 근거한 응답을 유지하도록 했다. 여행 계획과 일상 심부름을 위해 근처 매장에 재고 확인 전화를 걸어주며, 검색은 호텔 개별 가격 추적과 이메일 알림도 제공한다. 결과적으로 크롬과 검색이 지속적인 조사·쇼핑 워크스페이스로 바뀌며, 정보·상품·가격 비교 방식이 달라진다. 10 11
메타·브로드컴, 2029년까지 맞춤형 AI 칩 협력 확대
메타는 브로드컴과의 파트너십을 확장해 여러 세대의 맞춤형 AI 가속기를 공동 개발한다. 초기 1기가와트 이상의 컴퓨트에서 시작해 멀티 기가와트로 스케일하며, 브로드컴은 칩 설계·첨단 패키징·고속 네트워킹을 제공하고 MTIA 실리콘은 2나노 공정으로 이행한다. 사용자 관점에선 메타 앱의 AI 기능이 더 안정적이고 빠르며 잠재적으로 더 저렴해질 수 있다는 신호다. 2 12
OpenAI·아마존, 클라우드와 실리콘 전반 전략적 파트너십 공식화
OpenAI와 AWS는 Amazon Bedrock에서 에이전트 애플리케이션을 위한 상태 유지 런타임을 발표하고, AWS를 OpenAI Frontier 플랫폼의 서드파티 클라우드 독점 유통사로 지정했다. 아마존은 OpenAI에 최대 500억 달러 투자와 대규모 Trainium 용량(Trainium3/4 합산 약 2GW)을 약속해, AWS 스택에 표준화한 엔터프라이즈의 주요 채널로 자리매김한다. 팀 입장에선 AWS 위에서 조달·거버넌스가 단순화되고, 프로덕션 에이전트 운용을 위한 용량 여유가 커진다. 3
마이크로소프트, 자체 모델 3종과 더 저렴·고속 이미지 티어 출시
마이크로소프트는 Foundry와 MAI Playground를 통해 MAI‑Transcribe‑1, MAI‑Voice‑1, MAI‑Image‑2를 공개하며 25개 언어에서 선도적 전사 정확도와 강력한 크리에이티브 성능을 주장했다. 이어 MAI‑Image‑2‑Efficient를 출시해 입력 토큰 M당 5달러, 이미지 출력 토큰 M당 19.50달러로 가격을 낮추고, 생성 속도 22% 향상과 GPU당 처리량 4배를 달성했다. 핵심 방향은 공통 AI 작업을 마이크로소프트 제품 내부로 끌어들여 비용을 낮추고 Teams·Copilot·마케팅 워크플로의 채택을 쉽게 하는 것이다. 13 5
어도비, 크로스앱 크리에이티브 에이전트 ‘Firefly AI Assistant’ 공개
어도비는 Photoshop, Premiere, Lightroom, Illustrator, Express, Frame.io 전반에서 다단계 작업을 실행하는 대화형 에이전트 Firefly AI Assistant를 발표했다. 사용자가 원하는 결과를 설명하면 에이전트가 단계를 오케스트레이션하며, 세션 메모리와 Anthropic Claude 등 서드파티 모델도 통합한다. 디자이너와 마케터에겐 반복 자산 세트와 리뷰 사이클을 한 스레드로 압축해주는 도구다. 14
OpenAI, ‘Trusted Access for Cyber’ 아래 GPT‑5.4‑Cyber 공개
OpenAI는 취약점 연구 등 방어적 보안 작업에 맞춘 GPT‑5.4‑Cyber를 발표하고, 검증된 벤더·조직·연구자에게만 접근을 제한한다. 프로그램은 수천 명의 개별 디펜더와 수백 개 팀으로 확대되며, 신원 검증 단계에 따라 더 강력한 기능이 순차적으로 열린다. Anthropic의 제한적 Mythos 프리뷰에 이은 조치로, 민감 역량은 오픈 릴리스가 아니라 신원과 프로그램 기반 접근으로 거버넌스되는 흐름이 뚜렷해졌다. 15 16
이번 주 트렌드 분석
메이저 벤더들이 ‘일에 대해 대화’에서 ‘일을 실제로 수행’하는 방향으로 소비자·엔터프라이즈 접점을 재편했다. Claude Opus 4.7은 에이전트형 코딩의 신뢰성과 장시간 작업을 강화했고, 구글 AI 모드는 브라우저에 분할 화면 조사와 매장 통화 에이전트를 더했다. 어도비 Firefly AI Assistant는 크리에이티브 핸드오프를 하나의 대화로 압축했다. 결과적으로 계획–단계 실행–도구 실패 복구까지 아우르는 어시스턴트가 보편화되며, 문서·코드 수정·캠페인 자산의 턴어라운드가 체감상 빨라진다. 14
보이지 않는 층에선 누가 어떤 비용으로 워크로드를 돌릴지가 계속 이동 중이다. 메타의 멀티 기가와트 브로드컴 딜과 OpenAI–AWS 동맹(500억 달러 투자와 Trainium 용량)은 더 많은 AI를 맞춤형 실리콘과 익숙한 엔터프라이즈 레일로 옮긴다. 마이크로소프트의 자체 MAI 모델(더 저렴·고속 이미지 티어 포함)은 비용·통제 플레이북을 재확인한다: 공통 작업을 1자사 모델로 이관, 플래그십 앱에 임베드, 에이전트 기능의 COGS를 절감. 바이어에겐 기존 도구 내 단가 하락과 조달 예측 가능성이 커진다. 2 3 5
접근권 자체가 역량만큼 전략적 요소가 되고 있다. OpenAI의 GPT‑5.4‑Cyber와 Anthropic의 Mythos 프리뷰는 검증 프로그램을 통해 배포되며, 듀얼 유스 영역이 ‘모두를 위한 모델’이 아니라 ‘검증된 사용자용 모델’로 이동 중임을 시사한다. 이는 조달(신원 검증·로깅), 규제(지역별 비대칭 접근), 점점 강력해지는 도구와 함께·맞서 설계해야 하는 보안팀에 파급효과를 준다. 15 16
끝으로, 자본은 에이전트형 소프트웨어와 인프라의 후기 단계에 모이고 있다. 액셀의 50억 달러 펀드와 Factory의 15억 달러 밸류에이션 보도는 ‘에이전트+인프라’ 카테고리에 베팅이 쏠린다는 신호다. 다만 채택은 데모가 아니라 사이클타임·오류율 개선의 가시적 수치로 판가름난다. 에이전트 파일럿을 프로세스 변화로 대하고, 계측 후 증거 기반으로만 확장하자. 4 7
주목할 포인트
- “Stateful runtime on Bedrock” — AWS Bedrock에서 메모리를 가진 프로덕션 에이전트 팀을 운영하기 위한 OpenAI–AWS의 매니지드 기반을 가리킨다. 3
- “Tokenizer change” — Anthropic Opus 4.7은 일부 입력을 더 많은 토큰으로 매핑한다. 전환 시 태스크별 토큰 예산을 점검하자.
- “Split‑screen AI Mode” — 크롬이 AI와 웹페이지를 나란히 보여주면서 퍼블리셔·마케터는 참여 지표 변화를 주시할 필요가 있다. 11
이번 주 오픈소스
- browser-harness — 에이전트가 타이핑·클릭·파일 업로드를 수행하고, 태스크 도중 누락된 헬퍼 함수를 작성해 ‘자가 치유’할 수 있게 해주는 최소 Chrome DevTools Protocol 하니스. 네이티브 컴퓨터 사용을 실험하는 빌더에게 적합. browser-use/browser-harness
- fireworks-tech-graph — 자연어 설명을 또렷한 SVG/PNG 기술 다이어그램(예: UML, RAG, 멀티 에이전트 플로우)으로 변환. 시스템 문서화가 필요한 PM·엔지니어에게 유용. yizhiyanhua-ai/fireworks-tech-graph
- Hermes Agent + HUD — 자가 호스팅·지속형 개인/팀 에이전트. 하든드 코어, 모바일 지원, Fast Mode 라우팅, 실시간 웹 HUD로 가시성 제공. 제어와 로그를 원하는 운영자에게 적합. NousResearch/hermes-agent joeynyc/hermes-hudui
- Web3Hermes — 중국어권 사용자를 위한 Hermes Agent 지역화 커뮤니티 WebUI 포크로, 간소화된 설정 제공. 지역 친화적 배포에 유리. Web3CZ/Web3Hermes
- LLM Internals — 토크나이제이션, 어텐션, 양자화, 배포까지 단계별 학습 레포. API 의존을 넘어서는 엔지니어를 위한 발판. amitshekhariitbhu/llm-internals
이번 주 해볼 것
- 크롬 AI 모드에서 분할 화면 리서치 파일럿: 긴 아티클을 열고 결과를 클릭해 소스를 나란히 비교한 뒤, 플러스 메뉴로 최근 탭이나 PDF를 추가해보자. 탭 전환 시간이 줄었는지 기록.
- Firefly AI Assistant로 크로스앱 크리에이티브 세트 생성: 퍼블릭 베타 대기열에 등록하고 소셜 에셋 팩을 브리핑해 현재 플로 대비 핸드오프 시간을 측정. 14
- 이미지 생성 비용 비교: MAI‑Image‑2‑Efficient와 현재 툴에서 소규모 배치를 돌려 $/에셋과 레이턴시를 비교. 5
- 텍스트에서 기술 다이어그램 만들기: fireworks‑tech‑graph로 현재 AI 파이프라인을 SVG/PNG로 렌더링해 다음 기획서에 삽입. 17
- 보안 자격이 있다면 Trusted Access for Cyber 신청: GPT‑5.4‑Cyber를 비프로덕션 코드 트리아지에 시험하고, 차단 해제되는 거부 사례를 문서화. 16
댓글 (0)