제01권 · 제10호 데일리 디스패치 2026년 4월 19일

최신 AI 뉴스 모음집

AI · 논문데일리 큐레이션공개 아카이브
AI 뉴스Business
약 17분

AI, ‘대화’에서 ‘실제 실행’로: 에이전트화 가속

이번 주 에이전트가 현실화됐다: Claude 4.7은 장시간 코딩을 조여 붙였고, 구글 AI 모드는 답을 페이지 옆에 붙였으며, 메타는 멀티 기가와트 칩을 고정하고 OpenAI는 AWS와 더 깊어졌다 — 계획하고 실행하며 시간을 절약하는 AI로 수렴 중이다.

읽기 모드

이번 주 한 줄

AnthropicClaude Opus 4.7, 구글의 AI 모드 분할 화면, 메타의 멀티 기가와트급 맞춤 칩, OpenAI–AWS 심화 동맹으로 AI가 채팅을 넘어 실제 일을 수행하는 ‘에이전트’로 수렴 중.

이번 주 숫자

  • 월 100달러 — OpenAI의 새로운 ChatGPT Pro 요금제. 코덱스 헤비 유저를 겨냥해 20달러 Plus와 200달러 Pro 사이의 수요를 메운다. 1
  • 1GW+ — 메타가 브로드컴과 체결한 맞춤형 AI 칩 초기 용량 약정. 2029년까지 멀티 기가와트로 스케일. 2
  • 500억 달러 — 아마존이 OpenAI에 수년간 투자 계획과 함께 Frontier의 서드파티 클라우드 독점 유통 파트너로 합류. 3
  • 50억 달러 — 액셀의 레이트 스테이지 신규 펀드. AI 소프트웨어·하드웨어·로보틱스·데이터센터 전반에 평균 2억 달러 내외로 약 20건 투자 예정. 4
  • 22% 더 빠르게, 출력 토큰 M당 19.50달러 — 마이크로소프트 MAI‑Image‑2‑Efficient, 기존 대비 이미지 생성 비용 약 41% 절감, GPU당 처리량 4배. 5
  • 1,300만 명 / 시드 이후 2,200만 달러 A라운드 — 학습 앱 기즈모의 사용자 규모와 신규 투자로 AI 학습 도구 확장. 6
  • 1.5B 밸류에 1.5억 달러 — 자율 코딩 에이전트 스타트업 ‘Factory’의 조달 추진 보도. 7

TOP 뉴스

Anthropic, 고난도 코딩·장시간 작업용 Claude Opus 4.7 출시

Anthropic이 지시 이해, 자기 점검, 고해상도 비전을 강화한 Claude Opus 4.7을 공개했다. 다단계 소프트웨어 작업과 수시간 에이전트 실행을 겨냥하며 4.6과 동일한 가격(입력 M당 5달러, 출력 M당 25달러)이다. 개발자 벤치마크에서 SWE‑bench Pro 64.3%, SWE‑bench Verified 87.6%로 상용 모델 중 선도 성능을 보였고, 파트너들은 툴 오류 감소와 실패 복구력 개선을 보고했다. 사이버 보안 안전장치가 강화됐고 토크나이저 변경으로 동일 입력 대비 토큰 수가 늘 수 있어 예산 반영이 필요하다. 일반 사용자에겐 “대화”를 넘어 “실제 수행”의 신뢰성이 높아졌다는 의미다. 8 9

구글 AI 모드, 분할 화면 브라우징과 매장 통화 보조 추가

구글은 AI 모드에서 웹페이지를 AI 패널과 나란히 열 수 있게 해 탭 이동을 줄이고, 현재 보고 있는 페이지에 근거한 응답을 유지하도록 했다. 여행 계획과 일상 심부름을 위해 근처 매장에 재고 확인 전화를 걸어주며, 검색은 호텔 개별 가격 추적과 이메일 알림도 제공한다. 결과적으로 크롬과 검색이 지속적인 조사·쇼핑 워크스페이스로 바뀌며, 정보·상품·가격 비교 방식이 달라진다. 10 11

메타·브로드컴, 2029년까지 맞춤형 AI 칩 협력 확대

메타는 브로드컴과의 파트너십을 확장해 여러 세대의 맞춤형 AI 가속기를 공동 개발한다. 초기 1기가와트 이상의 컴퓨트에서 시작해 멀티 기가와트로 스케일하며, 브로드컴은 칩 설계·첨단 패키징·고속 네트워킹을 제공하고 MTIA 실리콘은 2나노 공정으로 이행한다. 사용자 관점에선 메타 앱의 AI 기능이 더 안정적이고 빠르며 잠재적으로 더 저렴해질 수 있다는 신호다. 2 12

OpenAI·아마존, 클라우드와 실리콘 전반 전략적 파트너십 공식화

OpenAI와 AWS는 Amazon Bedrock에서 에이전트 애플리케이션을 위한 상태 유지 런타임을 발표하고, AWS를 OpenAI Frontier 플랫폼의 서드파티 클라우드 독점 유통사로 지정했다. 아마존은 OpenAI에 최대 500억 달러 투자와 대규모 Trainium 용량(Trainium3/4 합산 약 2GW)을 약속해, AWS 스택에 표준화한 엔터프라이즈의 주요 채널로 자리매김한다. 팀 입장에선 AWS 위에서 조달·거버넌스가 단순화되고, 프로덕션 에이전트 운용을 위한 용량 여유가 커진다. 3

마이크로소프트, 자체 모델 3종과 더 저렴·고속 이미지 티어 출시

마이크로소프트는 Foundry와 MAI Playground를 통해 MAI‑Transcribe‑1, MAI‑Voice‑1, MAI‑Image‑2를 공개하며 25개 언어에서 선도적 전사 정확도와 강력한 크리에이티브 성능을 주장했다. 이어 MAI‑Image‑2‑Efficient를 출시해 입력 토큰 M당 5달러, 이미지 출력 토큰 M당 19.50달러로 가격을 낮추고, 생성 속도 22% 향상과 GPU당 처리량 4배를 달성했다. 핵심 방향은 공통 AI 작업을 마이크로소프트 제품 내부로 끌어들여 비용을 낮추고 Teams·Copilot·마케팅 워크플로의 채택을 쉽게 하는 것이다. 13 5

어도비, 크로스앱 크리에이티브 에이전트 ‘Firefly AI Assistant’ 공개

어도비는 Photoshop, Premiere, Lightroom, Illustrator, Express, Frame.io 전반에서 다단계 작업을 실행하는 대화형 에이전트 Firefly AI Assistant를 발표했다. 사용자가 원하는 결과를 설명하면 에이전트가 단계를 오케스트레이션하며, 세션 메모리와 Anthropic Claude 등 서드파티 모델도 통합한다. 디자이너와 마케터에겐 반복 자산 세트와 리뷰 사이클을 한 스레드로 압축해주는 도구다. 14

OpenAI, ‘Trusted Access for Cyber’ 아래 GPT‑5.4‑Cyber 공개

OpenAI는 취약점 연구 등 방어적 보안 작업에 맞춘 GPT‑5.4‑Cyber를 발표하고, 검증된 벤더·조직·연구자에게만 접근을 제한한다. 프로그램은 수천 명의 개별 디펜더와 수백 개 팀으로 확대되며, 신원 검증 단계에 따라 더 강력한 기능이 순차적으로 열린다. Anthropic의 제한적 Mythos 프리뷰에 이은 조치로, 민감 역량은 오픈 릴리스가 아니라 신원과 프로그램 기반 접근으로 거버넌스되는 흐름이 뚜렷해졌다. 15 16

이번 주 트렌드 분석

메이저 벤더들이 ‘일에 대해 대화’에서 ‘일을 실제로 수행’하는 방향으로 소비자·엔터프라이즈 접점을 재편했다. Claude Opus 4.7은 에이전트형 코딩의 신뢰성과 장시간 작업을 강화했고, 구글 AI 모드는 브라우저에 분할 화면 조사와 매장 통화 에이전트를 더했다. 어도비 Firefly AI Assistant는 크리에이티브 핸드오프를 하나의 대화로 압축했다. 결과적으로 계획–단계 실행–도구 실패 복구까지 아우르는 어시스턴트가 보편화되며, 문서·코드 수정·캠페인 자산의 턴어라운드가 체감상 빨라진다. 14

보이지 않는 층에선 누가 어떤 비용으로 워크로드를 돌릴지가 계속 이동 중이다. 메타의 멀티 기가와트 브로드컴 딜과 OpenAI–AWS 동맹(500억 달러 투자와 Trainium 용량)은 더 많은 AI를 맞춤형 실리콘과 익숙한 엔터프라이즈 레일로 옮긴다. 마이크로소프트의 자체 MAI 모델(더 저렴·고속 이미지 티어 포함)은 비용·통제 플레이북을 재확인한다: 공통 작업을 1자사 모델로 이관, 플래그십 앱에 임베드, 에이전트 기능의 COGS를 절감. 바이어에겐 기존 도구 내 단가 하락과 조달 예측 가능성이 커진다. 2 3 5

접근권 자체가 역량만큼 전략적 요소가 되고 있다. OpenAI의 GPT‑5.4‑Cyber와 Anthropic의 Mythos 프리뷰는 검증 프로그램을 통해 배포되며, 듀얼 유스 영역이 ‘모두를 위한 모델’이 아니라 ‘검증된 사용자용 모델’로 이동 중임을 시사한다. 이는 조달(신원 검증·로깅), 규제(지역별 비대칭 접근), 점점 강력해지는 도구와 함께·맞서 설계해야 하는 보안팀에 파급효과를 준다. 15 16

끝으로, 자본은 에이전트형 소프트웨어와 인프라의 후기 단계에 모이고 있다. 액셀의 50억 달러 펀드와 Factory의 15억 달러 밸류에이션 보도는 ‘에이전트+인프라’ 카테고리에 베팅이 쏠린다는 신호다. 다만 채택은 데모가 아니라 사이클타임·오류율 개선의 가시적 수치로 판가름난다. 에이전트 파일럿을 프로세스 변화로 대하고, 계측 후 증거 기반으로만 확장하자. 4 7

주목할 포인트

  • “Stateful runtime on Bedrock” — AWS Bedrock에서 메모리를 가진 프로덕션 에이전트 팀을 운영하기 위한 OpenAI–AWS의 매니지드 기반을 가리킨다. 3
  • “Tokenizer change” — Anthropic Opus 4.7은 일부 입력을 더 많은 토큰으로 매핑한다. 전환 시 태스크별 토큰 예산을 점검하자.
  • “Split‑screen AI Mode” — 크롬이 AI와 웹페이지를 나란히 보여주면서 퍼블리셔·마케터는 참여 지표 변화를 주시할 필요가 있다. 11

이번 주 오픈소스

  • browser-harness — 에이전트가 타이핑·클릭·파일 업로드를 수행하고, 태스크 도중 누락된 헬퍼 함수를 작성해 ‘자가 치유’할 수 있게 해주는 최소 Chrome DevTools Protocol 하니스. 네이티브 컴퓨터 사용을 실험하는 빌더에게 적합. browser-use/browser-harness
  • fireworks-tech-graph — 자연어 설명을 또렷한 SVG/PNG 기술 다이어그램(예: UML, RAG, 멀티 에이전트 플로우)으로 변환. 시스템 문서화가 필요한 PM·엔지니어에게 유용. yizhiyanhua-ai/fireworks-tech-graph
  • Hermes Agent + HUD — 자가 호스팅·지속형 개인/팀 에이전트. 하든드 코어, 모바일 지원, Fast Mode 라우팅, 실시간 웹 HUD로 가시성 제공. 제어와 로그를 원하는 운영자에게 적합. NousResearch/hermes-agent joeynyc/hermes-hudui
  • Web3Hermes — 중국어권 사용자를 위한 Hermes Agent 지역화 커뮤니티 WebUI 포크로, 간소화된 설정 제공. 지역 친화적 배포에 유리. Web3CZ/Web3Hermes
  • LLM Internals — 토크나이제이션, 어텐션, 양자화, 배포까지 단계별 학습 레포. API 의존을 넘어서는 엔지니어를 위한 발판. amitshekhariitbhu/llm-internals

이번 주 해볼 것

  1. 크롬 AI 모드에서 분할 화면 리서치 파일럿: 긴 아티클을 열고 결과를 클릭해 소스를 나란히 비교한 뒤, 플러스 메뉴로 최근 탭이나 PDF를 추가해보자. 탭 전환 시간이 줄었는지 기록.
  2. Firefly AI Assistant로 크로스앱 크리에이티브 세트 생성: 퍼블릭 베타 대기열에 등록하고 소셜 에셋 팩을 브리핑해 현재 플로 대비 핸드오프 시간을 측정. 14
  3. 이미지 생성 비용 비교: MAI‑Image‑2‑Efficient와 현재 툴에서 소규모 배치를 돌려 $/에셋과 레이턴시를 비교. 5
  4. 텍스트에서 기술 다이어그램 만들기: fireworks‑tech‑graph로 현재 AI 파이프라인을 SVG/PNG로 렌더링해 다음 기획서에 삽입. 17
  5. 보안 자격이 있다면 Trusted Access for Cyber 신청: GPT‑5.4‑Cyber를 비프로덕션 코드 트리아지에 시험하고, 차단 해제되는 거부 사례를 문서화. 16

출처 25

[1] Aboutamazon OpenAI and Amazon announce strategic partnership [2] Cnbc Meta commits to one gigawatt of custom chips with Broadcom as Hock Tan agrees to leave board [3] Venturebeat Microsoft launches MAI-Image-2-Efficient, a cheaper and faster AI image model [4] Techcrunch Accel raises $5B to back late-stage bets [5] Thenextweb Anthropic releases Claude Opus 4.7 with benchmark-leading coding and agentic performance [6] 9to5mac OpenAI’s Codex Mac app adds three key features that go beyond agentic coding [7] Amazon Accelerating decode-heavy LLM inference with speculative decoding on AWS Trainium and vLLM [8] Thenextweb Meta and Broadcom extend their AI chip deal to 2029 [9] 9to5mac Anthropic reveals new Opus 4.7 model with focus on advanced software engineering [10] Gizmodo Anthropic Releases Claude Opus 4.7 to Remind Everyone How Great Mythos Is [11] Venturebeat Microsoft launches 3 new AI models in direct shot at OpenAI and Google [12] Thenextweb OpenAI’s new $100 ChatGPT Pro plan targets Claude Max with five times the Codex access [13] Openai Intermittent 401 scope errors on key with "All" permissions — spikes randomly, no config changes [14] Openai Memory / In-session consistency regression affecting collaborative storytelling [15] Blog 7 ways to travel smarter this summer, with help from Google [16] Ppc Google's AI Mode in Chrome opens publisher links side by side - what changes [17] Adobe Introducing Firefly AI Assistant — a new way to create with our creative agent [18] Wsj An Investor Dared Him to Quit School. Now He’s Building a $1.5 Billion AI Startup. [19] Csoonline EU regulators largely denied access to Anthropic Mythos [20] Arxiv The Blind Spot of Agent Safety: How Benign User Instructions Expose Critical Vulnerabilities in Computer-Use Agents [21] Lilting How 8 AI Agent Benchmarks Were Gamed to Near-Perfect Scores Without Solving a Single Task [22] Techcrunch AI learning app Gizmo levels up with 13M users and a $22M investment [23] Reuters OpenAI unveils GPT-5.4-Cyber a week after rival's announcement of AI model [24] Axios OpenAI opens powerful cyber tools to verified users [25] Github fireworks-tech-graph: Claude Code skill for generating technical diagrams
도움이 되었나요?

댓글 (0)

이번 주 용어

클로드 클로드는 Anthropic이 제공하는 대형 언어 모델 제품군과 이를 호출하는 API 플랫폼으로, Messages API·Batch API·토큰 카운팅·모델 조회 등 엔드포인트를 통해 프로그래매틱하게 접근할 수 있다. 모델 라인업은 Opus/Sonnet/Haiku 계열로, 최신 세대(예: 4.6)에서는 1M 토큰 컨텍스트(베타), 프롬프트 캐싱, 도구 호출, 웹 검색/웹 가져오기와 결합된 코드 실행(해당 조합 시 무료) 같은 기능을 지원한다. 과금과 한도는 토큰 기반이며 캐싱 히트는 입력 단가의 0.1배, Batch API는 입력·출력 모두 50% 할인, US 전용 추론은 1.1배와 같은 명시적 배율이 적용되고, 조직 단위 사용 티어와 토큰 버킷 방식의 레이트 리밋이 운영된다. 직접 API와 더불어 AWS Bedrock·Google Vertex AI·Azure AI에서도 사용할 수 있으나 기능 도입 시차가 있을 수 있고, Managed Agents는 1P API에서만 제공된다. vLLM vLLM은 LLM 추론을 위한 오픈소스 서빙 엔진으로, OpenAI 호환 API와 고효율 실행 코어를 제공한다. 핵심은 KV 캐시를 비연속 메모리 페이지로 관리하는 PagedAttention과 토큰 단위의 연속 배칭 스케줄러로, 메모리 단편화를 줄이고 GPU 활용도를 높인다. 분산 실행에서 데이터·파이프라인·텐서/엑스퍼트 병렬을 지원하는 프로세스 구성과 GPU 워커 구조를 통해 대규모 동시성을 처리하며, AWS Trainium과 결합한 speculative decoding 최적화 같은 플랫폼 통합으로 디코드 중심 워크로드의 비용·지연을 개선하는 맥락에서 주로 쓰인다.