제01권 · 제10호 데일리 디스패치 2026년 4월 19일

최신 AI 뉴스 모음집

AI · 논문데일리 큐레이션공개 아카이브
AI 뉴스Business
약 19분

에이전트가 ‘일’을 시작한 주: OpenAI–AWS 500억 달러 협력, Meta 1GW+ 칩, Claude 4.7·GPT‑5.4·Chrome 업데이트

AWS가 OpenAI의 핵심 유통사가 되고, Meta는 1GW+ 커스텀 AI 칩을 예약했으며, Anthropic은 난도 높은 코딩을 겨냥해 Claude를 업그레이드했고, Chrome의 AI 모드는 분할 화면으로 진화했다. 결론: 에이전트는 단순한 대화를 넘어 실제 일을 점점 더 해낸다.

읽기 모드

이번 주 한 줄

OpenAI와 Amazon이 Bedrock 중심의 다년간 500억 달러 계획으로 파트너십을 공식화했고, Meta는 Broadcom과 2029년까지 1GW+급 커스텀 AI 칩을 확보했으며, Anthropic은 난도 높은 코딩을 겨냥한 Claude Opus 4.7을 출시했고, Chrome의 AI 모드는 분할 화면으로 진화 — AI가 단순 채팅에서 실제 업무 수행으로 이동 중이다.

이번 주 숫자

  • 500억 달러 — Amazon의 OpenAI 파트너십에 연계된 다년간 투자 계획과, Bedrock에서 Frontier의 제3자 독점 유통. 3
  • >1 GW — Meta가 차세대 커스텀 가속기에 약속한 컴퓨트(멀티기가와트 롤아웃 1단계). 1
  • 1M tokens — 장기 계획·컴퓨터 사용을 위한 GPT‑5.4의 네이티브 컨텍스트 윈도우. 1
  • 64.3% — SWE‑bench Pro에서 Claude Opus 4.7의 점수(일반 공개 동급 대비 선두). 2
  • $19.50 — Microsoft MAI‑Image‑2‑Efficient의 1M 이미지 출력 토큰당 가격(기존 MAI‑Image‑2 대비 약 41%↓). 10
  • 50억 달러 — Accel의 레이트스테이지 신규 펀드 규모(약 20개 AI 중심 베팅, 평균 수표 약 2억 달러). 4
  • $100 — OpenAI의 새 ChatGPT Pro 요금제: Plus($20)와 Pro($200) 사이, 무거운 Codex 사용자 타깃. 1

TOP 뉴스

OpenAI–AWS, 클라우드·실리콘 대형 파트너십 발표

Amazon은 Amazon Bedrock에서 OpenAI Frontier의 제3자 독점 클라우드 유통사가 되며, 양사는 프로덕션 에이전트 애플리케이션을 구동할 Stateful Runtime Environment를 공동 구축한다. Amazon은 다년간 500억 달러 투자(초기 150억 달러에 조건부 최대 350억 달러 추가)를 계획하고, OpenAI는 Trainium3·Trainium4 전반에 약 2GW의 Trainium 용량을 배정하기로 했는데, 이는 대규모 배포를 위한 컴퓨트 공급과 유통을 사실상 잠그겠다는 신호다. 이미 AWS를 쓰는 엔터프라이즈 팀에는 기존 조달·보안 통제를 통해 OpenAI 서비스를 평가하는 경로가 단순화될 수 있다. 3

Meta, Broadcom과 2029년까지 커스텀 AI 실리콘 확보

Meta는 Broadcom과의 파트너십을 확대해 MTIA(Meta Training and Inference Accelerator) 칩의 다세대를 공동 개발하며, 1GW 초과 용량에서 시작해 멀티기가와트 수준으로 확장하고; Broadcom은 칩 설계, 고속 네트워킹, 첨단 패키징을 제공한다. 애널리스트들은 이를 희소하고 비싼 외부 GPU 의존도를 낮추고, 피드·추천 전반의 실시간 추론을 뒷받침하려는 움직임으로 본다. 양사는 차세대 MTIA 실리콘에 2나노미터 공정을 예고했다. 1 2

Anthropic, 고난도 소프트웨어 작업에 맞춘 Claude Opus 4.7 공개

Opus 4.7은 멀티스텝 코딩과 수시간 단위 작업을 겨냥해 지시 준수·자기 점검을 강화하고, UI·슬라이드·문서 분석을 위한 고해상도 비전(긴 변 최대 2,576px)으로 업그레이드됐으며 가격은 4.6과 동일하다. 주요 개발 벤치마크에서 SWE‑bench Pro 64.3%, SWE‑bench Verified 87.6%를 기록했고, 파트너들은 툴 오류가 줄고 실패 상황에서도 실행 복원력이 높아졌다고 전한다. 엔터프라이즈는 동일 입력에서 토큰 수가 늘 수 있는 토크나이저 변경을 유의해야 한다. 1 2

OpenAI, 네이티브 컴퓨터 사용과 1M 컨텍스트의 GPT‑5.4 출시

GPT‑5.4는 왕복 질의응답을 줄이고 실제 오피스 업무를 처리하도록 설계됐으며, 장기 계획, 스크린샷·입력 이벤트 기반 데스크톱/브라우저 제어, 강화된 리서치·스프레드시트·프리젠테이션 능력을 결합한다. 에이전트형 컴퓨터 사용 벤치마크에서 SOTA에 도달하고(OSWorld‑Verified 75.0% 등), 최대 1M 토큰 컨텍스트를 지원하며, 초기 사용자는 더 빠른 세션과 더 적은 토큰 사용을 보고했다. 개발자에게는 컴퓨터 사용과 툴 검색/병렬화가 복잡한 작업에서 오케스트레이션 부담을 줄여준다. 1

Microsoft, 사내 모델 3종과 더 저렴한 이미지 변형 공개

Microsoft는 Microsoft Foundry와 MAI Playground를 통해 MAI‑Transcribe‑1(음성‑텍스트), MAI‑Voice‑1(텍스트‑음성), MAI‑Image‑2(이미지 생성)를 발표하며, 전사적 전사·보이스오버·크리에이티브 에셋 등 실무용을 겨냥했다. 이후 MAI‑Image‑2‑Efficient를 추가해 입력 토큰 100만 개당 $5, 이미지 출력 토큰 100만 개당 $19.50로 책정(이미지 출력 기준 약 41% 저렴), GPU당 처리량 4배에 생성 속도 22% 향상을 주장하며, 대용량 크리에이티브 워크로드를 노린다. 9 10

Google DeepMind, Apache 2.0으로 Gemma 4 공개

Gemma 4는 추론·에이전트 워크플로우용 오픈 웨이트 계열로 등장했으며, Effective 2B, Effective 4B, 26B MoE(Mixture of Experts), 31B Dense로 구성되고, 대형 모델은 최대 256K 컨텍스트를 지원한다. 31B는 Arena AI 오픈 텍스트 리더보드에서 3위, 26B MoE는 6위를 기록했고, 온디바이스(E2B/E4B)·워크스테이션·클라우드에 걸친 배포 경로와 vLLM, llama.cpp, MLX, NVIDIA NIM 등 폭넓은 지원을 제공한다. Apache 2.0 라이선스는 상업적 활용을 단순화한다. 4

Chrome AI 모드, 분할 뷰·매장 전화 기능 추가

Google은 AI 모드에서 웹페이지를 AI 패널과 나란히 열어 탭 전환을 줄이고, 최근 탭·이미지·PDF를 질문에 곧바로 추가할 수 있게 했다. 쇼핑·여행의 경우 인근 매장에 전화를 걸어 재고를 확인하고 결과를 돌려주는 에이전트형 기능을 AI 모드에 통합하고, 검색에는 호텔 가격 추적 알림을 추가했다. 일상적인 리서치·계획 작업을 한 화면에 모으는 효과가 있다. 1 2

OpenAI, 보안 수호자용 제한 접근 모델 GPT‑5.4‑Cyber 공개

OpenAI는 합법적 취약점 연구를 위해 더 관대한 행위를 허용하는 보안 특화 변형을 도입했으며, 초기에는 Trusted Access for Cyber 프로그램을 통해 검증된 벤더·조직·연구자에게만 제공된다. 이는 Anthropic의 Mythos 제한적 롤아웃과 궤를 같이하며, 민감한 역량이 모델 측 가드레일만으로가 아니라 신원 검증 기반 접근으로 이동하고 있음을 시사한다. 1 2

Accel, 레이트스테이지 AI 베팅에 50억 달러 조성

Accel은 Leaders Fund V에 40억 달러를 포함해 총 50억 달러를 클로즈했으며, 약 20건의 레이트스테이지 투자를 평균 수표 약 2억 달러로 겨냥하고, AI 소프트웨어·하드웨어·로보틱스·국방기술·데이터센터 인프라를 중점으로 둔다. 이번 자금은 레이트스테이지 AI 금융이 이제 인프라 규모의 자본과 유사해지며, 명확한 매출·운영 규율을 갖춘 소수 기업에 더 큰 수표가 집중되는 흐름을 반영한다. 4

Factory, 자율 코딩 에이전트로 15억 달러 가치에 1.5억 달러 조달 추진

WSJ에 따르면 Factory는 감독을 줄인 상태에서 브리프부터 구현까지 코딩 작업을 처리하는 에이전트를 위해 15억 달러 가치평가에서 1.5억 달러 조달을 논의 중이다. 톱티어 투자자들의 관심은 ‘에이전트형’ 개발 도구에 대한 지속적 수요를 시사하지만, 바이어들은 약속된 사이클타임 단축을 검증하려면 이슈 종료 수, PR 재작업률 등 나란히 비교 가능한 지표가 여전히 필요하다. 4

이번 주 트렌드 분석

AI가 ‘질문에 답해줘’에서 ‘일을 해줘’로 이동했다. GPT‑5.4는 네이티브 컴퓨터 사용, 긴 컨텍스트, 계획을 묶어냈고, Claude Opus 4.7은 도구 실패를 줄인 멀티스텝 코딩에 초점을 맞췄다. 소비자 측면에서는 Chrome의 AI 모드가 분할 화면 작업 공간으로 바뀌고 매장에 전화까지 할 수 있게 되며, 일상 브라우징에도 에이전트 패턴이 드러난다. 팀 관점에서는 자율권 부여 전에 권한 관리, 로깅, 휴먼‑인‑더‑루프 설계가 표준이 될 전망이다. 1 1

오픈 옵션은 클로즈드 역량과 나란히 강화됐다. Google의 Gemma 4는 관대한 라이선스의 에이전트 준비형 계열로 긴 컨텍스트와 폭넓은 도구 지원을 제공했고, NVIDIA의 Nemotron 3 Super는 백만 토큰 컨텍스트를 위한 오픈 웨이트와 효율을 강조했다. 함께 보면 더 많은 조직이 벤더 종속 없이 접근 가능한 하드웨어에서 장시간 에이전트를 시범 적용할 수 있음을 시사한다. 4 1

컴퓨트와 유통 딜이 배경을 이룬다. OpenAI의 AWS 협력은 Bedrock에서의 제3자 독점 유통을 다년간 500억 달러 계획과 약 2GW의 Trainium 용량에 묶었고, Meta와 Broadcom은 멀티기가와트 스케일을 향해 1GW+ 커스텀 MTIA 실리콘을 약정했다. Accel의 50억 달러 같은 레이트스테이지 펀드는 이런 인프라를 마진과 생산성으로 전환할 수 있는 기업에 연료를 보탠다. 3 1 4

민감한 역량은 점차 게이팅된다. OpenAI의 GPT‑5.4‑Cyber와 Anthropic의 제한 프로그램은 듀얼유스 기능이 순수 모델 가드레일이 아니라 신원 검증 기반 접근으로 옮겨가고 있음을 보여준다. 최근 보안 노트(예: Mac 클라이언트 업데이트)는 데스크톱과 API 워크플로우에서 방어적 에러 처리와 업데이트를 기본에 녹일 것을 상기시킨다. 조달은 모델 선택과 함께 접근 계층화와 검증을 포함하게 될 전망이다. 1 4

주목할 포인트

  • “Frontier on Bedrock” — AWS가 OpenAI 엔터프라이즈 플랫폼의 제3자 독점 유통사가 되는 만큼, 프리뷰 일정·지역·가격 공개를 주시. 3
  • “2 nm MTIA” — Meta의 차세대 커스텀 가속기가 프로덕션으로 진입하는 신호는 앱 내 추론 비용과 지연을 바꿀 수 있다. 2
  • “MAI‑Image‑2‑Efficient” — 대량 크리에이티브 워크로드에서 채택과 토큰당 가격 인하 압력이 다른 이미지 제공사에도 파급될 수 있다. 10

이번 주 오픈소스

  • 프로젝트: browser-harness — 에이전트가 실제로 브라우저를 구동하고 작업 중 누락된 헬퍼 함수를 즉시 패치해 자가 복구하도록 돕는 최소 Chrome DevTools Protocol 하네스. 네이티브 컴퓨터 사용 루프를 실험하는 빌더에게 적합. browser-use/browser-harness
  • 도구: Fireworks Tech Graph — 자연어 설명을 출판급 시스템 다이어그램(SVG/PNG)으로 변환; UML·AI 패턴 프리셋 제공. 파이프라인 문서화가 필요한 PM/엔지니어에게 유용. yizhiyanhua-ai/fireworks-tech-graph
  • 업데이트: Hermes Agent v0.9.0 — 운영을 염두에 둔 셀프 호스팅 에이전트 업데이트. 패스트 레인, iMessage/WeChat 어댑터, Android 지원, 광범위한 보안 하드닝 포함. NousResearch/hermes-agent v2026.4.13
  • 대시보드: Hermes Web UI — Hermes Agent의 세션·채널·스케줄·스킬·애널리틱스를 한곳에서 관리. EKKOLearnAI/hermes-web-ui
  • 학습 자료: LLM Internals — 토크나이제이션, 어텐션, 양자화, 배포 기초까지 단계별 학습 리포지터리. 단순 API 호출을 넘어서는 엔지니어에게 적합. amitshekhariitbhu/llm-internals

이번 주 해볼 것

  1. Chrome의 AI 모드 분할 화면 쓰기: 데스크톱에서 AI 모드를 열고 결과를 클릭해 페이지를 나란히 비교, 질문에 최근 탭이나 PDF를 추가해 보자. 1
  2. Claude Opus 4.7을 실전에 투입: 작은 레포 이슈를 수정하거나 이미지가 포함된 복잡한 PDF를 분석해 현재 모델 대비 품질과 토큰 수를 체감하자. 1
  3. 브라우저 반복 작업 자동화: browser-harness를 클론하고 코딩 어시스턴트로 파일 업로드나 폼 작성 단계를 끝까지 배선해 보자. 5
  4. 텍스트로 AI 파이프라인 다이어그램 만들기: Fireworks Tech Graph로 SVG를 생성해 팀의 시스템 문서화를 표준화하자. 15

출처 22

[1] Aboutamazon OpenAI and Amazon announce strategic partnership [2] Cnbc Meta commits to one gigawatt of custom chips with Broadcom as Hock Tan agrees to leave board [3] Amazon Accelerating decode-heavy LLM inference with speculative decoding on AWS Trainium and vLLM [4] Thenextweb Meta and Broadcom extend their AI chip deal to 2029 [5] Anthropic Introducing Claude Opus 4.7 [6] Thenextweb Anthropic releases Claude Opus 4.7 with benchmark-leading coding and agentic performance [7] Deepmind Gemma 4: Byte for byte, the most capable open models [8] Agenticbrew Google Gemma 4: Most Capable Open-Weight AI Models Launch Under Apache 2.0 [9] Venturebeat Microsoft launches 3 new AI models in direct shot at OpenAI and Google [10] Venturebeat Microsoft launches MAI-Image-2-Efficient, a cheaper and faster AI image model [11] Adobe Introducing Firefly AI Assistant — a new way to create with our creative agent [12] Thenextweb Adobe launches Firefly AI Assistant to orchestrate tasks across Creative Cloud [13] Blog A new way to explore the web with AI Mode in Chrome [14] Blog Turn your best AI prompts into one-click tools in Chrome [15] Techcrunch Google’s AI Mode can now help you find products in stock nearby [16] Reuters OpenAI unveils GPT-5.4-Cyber a week after rival's announcement of AI model [17] Axios OpenAI opens powerful cyber tools to verified users [18] Cnet OpenAI Has a New GPT-5.4-Cyber Model. Here's Why You Can't Use It [19] Techcrunch Accel raises $5B to back late-stage bets [20] Crn Intel Inks ‘Multiyear’ AI Inference Deal With SambaNova [21] Csoonline EU regulators largely denied access to Anthropic Mythos [22] Ppc Google's AI Mode in Chrome opens publisher links side by side - what changes
도움이 되었나요?

댓글 (0)

이번 주 용어

클로드 클로드는 Anthropic이 제공하는 대형 언어 모델 제품군과 이를 호출하는 API 플랫폼으로, Messages API·Batch API·토큰 카운팅·모델 조회 등 엔드포인트를 통해 프로그래매틱하게 접근할 수 있다. 모델 라인업은 Opus/Sonnet/Haiku 계열로, 최신 세대(예: 4.6)에서는 1M 토큰 컨텍스트(베타), 프롬프트 캐싱, 도구 호출, 웹 검색/웹 가져오기와 결합된 코드 실행(해당 조합 시 무료) 같은 기능을 지원한다. 과금과 한도는 토큰 기반이며 캐싱 히트는 입력 단가의 0.1배, Batch API는 입력·출력 모두 50% 할인, US 전용 추론은 1.1배와 같은 명시적 배율이 적용되고, 조직 단위 사용 티어와 토큰 버킷 방식의 레이트 리밋이 운영된다. 직접 API와 더불어 AWS Bedrock·Google Vertex AI·Azure AI에서도 사용할 수 있으나 기능 도입 시차가 있을 수 있고, Managed Agents는 1P API에서만 제공된다. vLLM vLLM은 LLM 추론을 위한 오픈소스 서빙 엔진으로, OpenAI 호환 API와 고효율 실행 코어를 제공한다. 핵심은 KV 캐시를 비연속 메모리 페이지로 관리하는 PagedAttention과 토큰 단위의 연속 배칭 스케줄러로, 메모리 단편화를 줄이고 GPU 활용도를 높인다. 분산 실행에서 데이터·파이프라인·텐서/엑스퍼트 병렬을 지원하는 프로세스 구성과 GPU 워커 구조를 통해 대규모 동시성을 처리하며, AWS Trainium과 결합한 speculative decoding 최적화 같은 플랫폼 통합으로 디코드 중심 워크로드의 비용·지연을 개선하는 맥락에서 주로 쓰인다.