마이크로소프트, 코파일럿 강화를 위한 자체 코딩 AI 공개
로이터에 따르면 마이크로소프트가 빌드에서 자체 코딩 모델 등 특화 AI를 준비 중이며, 아사나는 StackAI를 인수하고 Groq는 추론 사업 확대를 위해 6.5억 달러 조달을 추진한다.
로이터에 따르면 마이크로소프트가 빌드에서 자체 코딩 모델 등 특화 AI를 준비 중이며, 아사나는 StackAI를 인수하고 Groq는 추론 사업 확대를 위해 6.5억 달러 조달을 추진한다.
연구진은 여러 모델 계열에서 반복되는 사진 원근 편향을 확인하고, 이미지 위치 단서와 진짜 3차원(3D) 추론을 분리하는 SpatialTunnel을 공개했다.
에이전트가 채팅에서 행동으로 도약: 구글은 Gemini를 내장형 도우미로 만들고, 엔비디아는 에이전트 오케스트레이션용 CPU를 출하했으며, 오픈AI는 ChatGPT에 재정 보기 기능을 열고, 50억 달러 TPU 합작 벤처도 윤곽을 드러냈다 — 일상 도구 속 어시스턴트가 더 빠르고 저렴해진다는 신호다.
연구진은 여러 모델 계열에서 반복되는 사진 원근 편향을 확인하고, 이미지 위치 단서와 진짜 3차원(3D) 추론을 분리하는 SpatialTunnel을 공개했다.
이번 조달로 Anthropic의 기업가치가 OpenAI를 넘어섰고, 새 모델은 ‘노력 수준’ 제어와 더 빠르고 저렴한 응답을 추가했다. 한편 OpenAI는 선거 대비 안전장치를 공개했다.
이번 업그레이드는 실무 통제에 초점을 맞췄다. 더 빠르고 저렴해진 fast mode, 비용·품질을 조절하는 노력도구, 대규모 코드 작업을 위한 병렬 서브에이전트가 추가됐고, 테스트에서는 ‘정직성’ 개선이 보고됐다.
Devin 개발사 코그니션은 빠른 기업 채택과 4.92억 달러 런레이트를 내세우며 투자를 유치했고, 유튜브는 사실적인 AI 영상을 자동 라벨링해 투명성을 높인다.
하나의 ‘네이티브 멀티모달’ 임베딩이 주요 이미지·영상·텍스트 벤치마크에서 강한 검색 성능을 보여, 검색·추천·검색 증강 생성 파이프라인 단순화를 가리킨다.
OpenAI CEO가 초기의 일자리 상실 우려를 수정하며 ‘인간적 상호작용’의 중요성을 강조했다. 한편 OpenRouter는 1억 1,300만 달러를 유치했고, 모멘텀 주식은 AI 테마에 올라탔다.
MotiMotion은 동작 제어를 ‘추론 후 생성’으로 재구성하고 새 벤치마크를 제시한다. 보상부터 터미널 피드백까지 신뢰성을 겨냥한 세 편의 에이전트 학습 논문과, GPU 없이 구동되는 MIT 라이선스 로컬 엔진(LocalAI)도 나왔다.
어트랙터 기반 추론, 섀넌 스케일링 법칙, 단계적 비전 학습을 제안한 3편의 논문이 나왔습니다. 추론 컴퓨트 조절과 입력 노이즈 감소로 정확도를 높일 수 있다는 메시지입니다.
추론을 ‘학습된 수렴점’으로 보고, 모델 학습을 잡음 채널의 용량 문제로 해석하며, 비전-언어 모델에서 ‘보기’와 ‘생각하기’를 분리해 성과를 끌어올리고, 언어 지시로 3D 장면을 촬영하는 에이전트 과제를 실행 가능하게 만든 연구들이 나왔다.
구글이 대화형 에이전트를 중심으로 검색을 재설계하고 AI 모드의 엔진으로 Gemini 3.5 Flash를 내세웠습니다. 동시에 10초짜리 AI 동영상 생성이 앱에 적용되며, 가격·보안 이슈가 기업의 AI 도입 방식을 바꾸고 있습니다.
볼록 최적화로 설계한 새 토크나이저가 탐욕적 규칙을 대체해 바이트당 비트 효율을 높이고, 어휘가 최적에 얼마나 가까운지 인증까지 제공한다. 또한 소비자 노트북에서 라이브 음악 생성, 과학 진보 예측 한계, 프롬프트 가능한 동물 3D 복원, 항상 최신 컨텍스트를 유지하는 증분 인덱싱 엔진 소식.
에이전트가 채팅에서 행동으로 도약: 구글은 Gemini를 내장형 도우미로 만들고, 엔비디아는 에이전트 오케스트레이션용 CPU를 출하했으며, 오픈AI는 ChatGPT에 재정 보기 기능을 열고, 50억 달러 TPU 합작 벤처도 윤곽을 드러냈다 — 일상 도구 속 어시스턴트가 더 빠르고 저렴해진다는 신호다.
FT는 스페이스X·오픈AI·앤스로픽의 상장을 AI 수요의 현실 점검으로 짚었고, Corsair는 프라이빗 AI 도입을 겨냥한 Grace Blackwell 기반 워크스테이션·서버를 공개했다.
LoREnc는 복구 가능한 저순위 신호를 억제해 도난 가중치나 무단 어댑터를 무력화하고, 허가된 어댑터는 성능을 1% 미만 오버헤드로 복구한다. 더불어 토큰을 절약하는 자기 조절형 계획, 다중 에이전트의 캐시 공유 보안, 챗봇의 검색 의존을 보여주는 연구를 다룬다.
AutoRubric-T2I는 비전‑언어 모델 심사자를 '학습된 체크리스트'로 가르쳐 사람이 매긴 선호 데이터의 0.01% 미만만으로도 기존 보상 모델을 앞선다. 실행 결과를 기준으로 한 코딩 에이전트와 긴 문맥을 더 안정적으로 다루는 어텐션 연구도 함께 발표됐다.
Exa가 2.5억 달러를 조달해 25억 달러 가치 평가를 받고, Parallel도 1억 달러를 유치했습니다. Alibaba는 3배 성능의 AI 칩으로 맞불을 놓았습니다.
이 확산 기반 시스템은 가변 길이 생성과 부분 편집(inpainting)을 지원하며, 라이선스·크리에이티브 커먼즈 데이터로 학습되고 소비자용 기기에서 구동된다. 연구진은 H200에서 2초 미만, MacBook Pro M4에서도 몇 초 미만으로 출력된다고 보고한다.
AMD와 보조를 맞춘 이 연구소는 AMD 하드웨어로 오픈웨이트 모델을 학습·서비스한다. 한편 OpenAI는 YC 스타트업에 200만 달러 상당 토큰을 제안하고, Figma와 IrisGo는 일상 업무에 에이전트를 투입한다.
문서가 길어질수록 널리 쓰이는 RoPE 위치 부호화가 인접성·토큰 구분 신호를 잃는다는 논문이 나왔습니다. 동시에 확산+MoE 추론 효율화, VLM 훈련법, 임상 에이전트 실험 결과가 실무적 진전을 보였습니다.
I/O 2026에서 구글은 Gemini 3.5 Flash와 새 Omni 모델군을 공개하고, 월 3.2쿼드릴리언 토큰 처리 규모를 밝혔다. 동시에 월 100달러 AI Ultra 요금제와 블랙스톤과의 50억 달러 TPU 합작도 발표했다.
이번 업데이트는 대화가 아니라 ‘작업 수행’에 초점을 맞춘다 — Gemini 앱의 기본 모델로 적용되고 24시간 에이전트를 구동하며, 오픈소스는 입력 정제와 배포 패턴을 보강한다.
엔비디아의 88코어 Vera가 에이전트 업무를 겨냥해 고객사에 전달됐다. 한편 Apple은 iOS 27에 AI 글쓰기를 준비하고, 광고 업계는 Publicis–LiveRamp 인수로 데이터 협업을 서두른다.
수동 자바스크립트 추적으로 브라우저 에이전트를 행동 패턴만으로 지문화할 수 있다는 연구가 나왔다. 더불어 지리공간 모델 감사는 공통 테스트·가중치 공개를 촉구했고, LangChain은 테스트 업데이트를 배포했다.
Databricks는 GPT‑5.5로 OfficeQA Pro 에이전트 벤치마크에서 오류 46% 감소를 밝혔다고 했고, ChatGPT는 1만2천여 기관 연동이 가능한 미국 Pro 미리보기를 열었다. 실제 워크플로 확장과 동시에 TechCrunch는 배심원이 오픈AI 리더십의 ‘신뢰’를 논의 중이라고 짚었다.
단 128개 예시로 전체 데이터 수준을 따라잡는 소량 예시 강화학습이 나왔고, 편향을 제거한 옴니모달 벤치마크가 성능을 재정의했습니다. 또 macOS용 로컬 AI 에이전트 앱이 실사용으로 다가옵니다.
AI가 채팅창을 떠났다. 오픈AI는 40억 달러 규모 배포 유닛과 보안 프로그램을 세웠고, 마이크로소프트의 에이전트 시스템은 윈도우즈 취약점 16건을 찾아냈으며, 메타는 암호화된 무로그 채팅을 추가했고 Claude는 SMB 도구로 들어갔다 — 지금 바로 시도해볼 수 있는 구체적 액션도 하나 제시한다.
Nectar Social이 자율형 마케팅 에이전트를 키우기 위해 3천만 달러를 확보했고, 콜로라도는 AI 법을 ‘도구가 결정에 미치는 영향’ 중심으로 다시 써 인사(HR)·법무의 문서화 기준을 바꾸고 있다.
이미지 생성 논문이 구면 경로로 학습 단계를 유지해 ImageNet-256 성능을 꾸준히 높였다고 보고한다 — 아키텍처 변경 없이. 이어 단일 위성 사진으로 거리 3D 복원을 강화하고, 장편 비디오 일관성을 점검하는 벤치마크와 페어 비교 “토너먼트”로 Gemini 3.1 Pro 코딩 Elo를 405점 끌어올린 연구가 발표됐다.
이번 프리뷰로 iOS·안드로이드에서 맥에 연결된 Codex 작업을 검토·승인할 수 있다. 엔터프라이즈 도입도 부각됐는데, Sea는 Codex 사용자 중 주간 활성 비율 87%를 보고했다.
Lighthouse Attention은 표준 어텐션 앞뒤로 시퀀스를 압축해 학습을 빠르게 하고, 짧은 복구 단계 뒤 스스로 제거된다. 실제 테이블 이해·전문가 혼합 라우팅·적응형 에이전트 평가 연구가 함께 나왔고, 쿠버네티스 추론 스택은 주요 변경을 포함한 업데이트를 배포했다.
새 번들은 15개의 사전 구성 워크플로와 깊은 커넥터를 제공하며 승인 절차가 기본으로 탑재됐다. 교육 과정과 미국 로드쇼로 ‘채팅만 쓰던’ 사용을 넘어 실무 적용을 돕는다.
FlowCompile는 실행 전에 구조화된 에이전트 파이프라인의 정확도–지연 시간 계획을 미리 만들어 최대 6.4배 가속을 보고한다. 함께 나온 연구는 짧은 추론, 통신량을 줄인 MoE 추론, 음성 에이전트의 종단 간 벤치마크에 초점을 맞춘다.
‘즉시 AI 인력’ Hirebase가 클로즈드 베타로 공개되어 구글 문서, 슬랙, 노션에서 에이전트를 실행한다. 여기에 메타의 암호화 AI 채팅, 마이크로소프트의 에이전트형 보안 시스템, 알파벳의 AI 신약 설계 21억 달러 투자까지 겹쳤다.
DeepMind는 선택한 대상과 의도를 이해하는 AI 포인터를 공개해 화면의 픽셀을 ‘비교하기’, ‘길찾기’ 같은 동작으로 바꾼다. Microsoft는 16개의 Windows 취약점을 찾아낸 에이전트 시스템을 공개했고, 오픈소스 도구들은 에이전트 워크플로를 다듬고 있다.
Daybreak은 GPT-5.5-Cyber와 Codex Security를 결합해 공격자보다 먼저 취약점을 찾아 검증하도록 돕는다. 구글은 안드로이드에 도입될 Gemini 기반 자동화도 공개했다.
혼합·반복 데이터로 학습할 때 모델이 얼마나 배우는지 예측하는 새 프레임워크다. 손실 예측 오차 평균 0.15%, 최대 0.96%를 70억 파라미터와 4,250억 토큰 규모까지 보여줘 데이터 레시피 선택을 돕는다.
오픈AI가 다수 지분을 보유한 새 법인을 출범해 Tomoro의 엔지니어 150명과 19개 파트너를 묶었다. 같은 날 구글은 AI 기반 해킹 징후를 경고했고, 미국에선 연방 계약 전 안전성 심사 요구가 제기됐다.
ROPD는 교사 응답에서 프롬프트별 체크리스트를 만들어 학생 시도를 채점하고, 다수 평가에서 로짓 기반 온정책 증류를 앞선다. 모델 선택, 에이전트 스킬, 테스트 시간 확장 연구도 비용과 안전성을 함께 겨냥한다.
Nous Research의 Hermes Agent가 ‘Tenacity’ 업데이트 후 OpenRouter 일일 토큰 사용 1위를 기록했다. Lemonade는 vLLM ROCm을 도입해 기기 내 대형 언어 모델 실행 속도를 높였다.
ActCam이 생성 영상에서 인물 동작과 카메라를 동시에 조정하게 했다. 한편, 전문가 혼합(Mixture of Experts, MoE)의 공유 풀 설계가 효율을 높였고 Hermes Agent는 사용량 1위에 올랐다.
에이전트 플랫폼과 가드레일이 출하되고, ChatGPT는 기본으로 더 빨라졌으며, 엔비디아는 새 CPU로 에이전트 병목을 겨냥했고, 오픈AI는 대규모 자금과 AWS 용량을 확보했다 — 파일럿에서 프로덕션으로 에이전트를 옮기는 데 방점이 찍힌 한 주.
CNBC에 따르면 엔비디아의 2026년 지분 약정은 400억 달러를 넘었고, 여기에는 OpenAI 300억 달러와 Corning 최대 32억 달러, IREN 최대 21억 달러가 포함된다. 이 변화가 용량, 가격, 로드맵에 주는 의미를 짚었다.
1조(1 trillion) 토큰으로 학습한 1B‑active, 14B‑total 전문가 기반 모델이 전문가의 25%(약 1% 하락) 또는 12.5%(약 3% 하락)만 로드해도 거의 전체 성능을 유지한다 — 성능을 유지하면서 메모리를 줄일 현실적 경로다.
중국의 유망 모델 개발사가 대규모 자금 유치를 모색하는 가운데, 브뤼셀은 고위험 AI 규정의 적용 시점을 늦췄습니다. 법정 공방 속 OpenAI는 ‘신뢰 기반’ 사이버 접근과 통제 가능한 코딩 에이전트를 강조했습니다.
Kimi‑K2.5, GLM‑5, MiniMax, DeepSeek, Qwen, Gemma 등을 로컬에서 쉽게 돌리게 하는 설치·Docker 지원이 정비됐다. 동시에 AI가 작성한 GPU 커널의 실패 지점을 짚고, 오디오·비전 학습 지형을 정리하며, 바이오 도구 호출 데이터셋과 데이터 부족 상황의 훈련 법칙을 제시한 논문들이 나왔다.
이 오픈 웨이트 모델은 최대 5배 처리량과 100만 토큰 컨텍스트로 다중 에이전트 워크플로의 맥락 유지를 돕는다. 동시에 Nvidia는 통합 멀티모달 모델을 확장하고, 중국 Moonshot AI는 20억 달러를 유치했다.
KinDER는 물리 기반 25개 로봇 과제와 Gymnasium 라이브러리를 묶어 계획 능력을 압박한다. 동시에 창의성과 앱 빌더의 약점을 드러내는 벤치마크가 나왔고, 한 토큰 신뢰도로 비용 낮은 환각 필터도 제안됐다.
OpenAI가 더 빠르고 오류를 줄인 모델을 ChatGPT 기본으로 바꾸고 기억 출처 표시를 도입했다. 동시에 Apple은 iOS 27에서 모델 선택을 시험하고, Anthropic은 SpaceX 컴퓨트를 확보했으며, SAP는 표형 데이터 AI 연구소를 인수했다—AI가 시연에서 실제 배치로 옮겨가고 있음을 보여준다.
두 편의 서베이가 RL 기반 추론 모델과 진화하는 에이전트 스킬의 설계·거버넌스를 정리했고, 구글은 Gemma 4를 빠르게 만드는 다중 토큰 예측과 장시간 작업용 웹훅을 공개했다.
구글 File Search가 텍스트와 이미지를 함께 검색하고 답변에 정확한 페이지를 인용하도록 바뀌었습니다. 동시에 Microsoft는 에이전트 행동을 통제하는 오픈소스 거버넌스 도구를 공개했습니다.
HiL-Bench는 코딩·SQL 과제에 숨은 장애물을 넣어 에이전트가 찍지 않고 질문을 통해 해결하는지를 검증한다. Ask-F1 지표는 ‘판단력’에 초점을 맞추며, 강화학습 결과 이 능력이 학습 가능함을 보였다.
Appfigures에 따르면 이미지 모델 출시는 일반 업데이트보다 다운로드가 6.5배 늘지만, 28일간 7,000만 달러 매출로 이를 수익화한 곳은 ChatGPT뿐이다. 동시에 Anthropic·OpenAI는 사모펀드와 합작 법인을 세워 중견 기업 공략에 나서고, Morgan Stanley는 홍콩 테크로의 AI 자금 유입을 지목했다.
Odysseus는 Super Mario Land에서 100+번의 결정을 내리는 멀티모달 에이전트를 훈련해 선행 모델보다 최소 3배 더 멀리 진전한다. 동시에 오픈 모델은 어려운 시험에서 확장되고, 새 벤치마크는 강의 영상 이해와 시각적 ‘정직성’을 압박 테스트한다.
대규모 자금 조달로 OpenAI가 장기 컴퓨트와 다중 클라우드·칩 전략을 확보했습니다. AWS 협력과 엔비디아의 에이전트용 CPU까지 맞물리며 업무용 AI가 어떻게 돌아갈지 방향이 드러납니다.
새 논문은 컴퓨터 에이전트가 기본은 소형 정책으로 운영하고, 멈춤이나 의미 드리프트가 감지될 때만 강한 모델을 호출하는 사건 주도형 계단식을 제안합니다. 실시간 워크플로 벤치마크와 대규모 시각 데이터는 ‘정밀 계산’과 평가의 중요성을 보여줍니다.
에이전틱 AI가 실전에 들어섰다: GPT‑5.5는 다단계 업무를 겨냥하고, 오픈AI는 멀티클라우드·정부 채널을 열었으며, 펜타곤은 Gemini를 수백만 명으로 확대하고, 엔비디아는 에이전트 루프용 CPU를 공개했다. 이번 주 달라진 점과 직접 해볼 실험 한 가지를 짚었다.
미 국방부가 Google, Nvidia, OpenAI 등과 기밀 시스템에서 AI를 운용하기로 합의했다. 한편 Nvidia는 에이전트용 멀티모달 모델을 공개했고, Meta는 휴머노이드 AI 스타트업을 인수했으며 IBM은 엔터프라이즈 개발 파트너를 선보였다.
Nvidia의 Nemotron 3 Nano Omni가 오디오·비전·텍스트를 하나로 묶은 경량 시스템으로 나왔습니다. 장문 컨텍스트 공격 레드팀 속도 향상, 파인튜닝 후 안전성 변동, 소비자용 GPU 학습 가속, 자체 호스팅 개인 에이전트도 함께 짚습니다.
Cohere가 독일 Aleph Alpha를 200억 달러 가치로 인수 추진하고, Cisco는 오픈소스 모델 출처 검증 도구를 내놨습니다. 법률·의료 AI에도 자금이 몰립니다 — 팀에는 공급사 선택권, 규제 대응, 실전 배치의 길이 넓어집니다.
Nemotron 3 Nano Omni는 오디오·비전·언어를 30B‑A3B 구조 하나로 묶은 공개 가중치 모델이다. 파인튜닝 후 안전성 변동과 더 빠르고 저렴한 레드팀·소비자 GPU 학습 기법을 다룬 논문도 나왔다.
마이크로소프트·알파벳·아마존·메타 실적에서 거대한 AI 설비투자가 클라우드 성장과 이익으로 이어지는지 검증이 핵심이다. 동시에 광고 플랫폼과 고객 지원에 AI 적용이 확대된다.
RADIO‑ViPE가 단안 비디오만으로 3D 공간을 언어로 가리키고, 다중 턴 에이전트의 신뢰성을 높이는 설계와 확산 LLM을 성능 유지하며 압축하는 기법도 나왔습니다.
미 정부기관은 GPT‑5.5를 합규제로 사용할 수 있고 AWS 고객은 Bedrock에서 OpenAI 모델을 쓸 수 있게 됐습니다. 의회는 사이버 대응 모델 브리핑을 받았고, 중국은 Meta–Manus 인수를 막는 가운데 Citi는 2030년 AI 시장을 4.2조 달러로 상향했습니다.
GPT-5.5는 GPT-5.4와 지연 시간은 같게 유지하면서 코딩·컴퓨터 사용 벤치마크 성능을 높였고, ChatGPT와 Codex의 Plus·Pro·Business·Enterprise에 순차 제공됩니다. 애플리케이션 프로그래밍 인터페이스(API)는 추가 안전 조치가 끝난 뒤 제공 예정인 가운데, Nvidia는 에이전틱 AI용 CPU를 공개했고 투자금은 에이전트 인프라와 임상 AI로 향했습니다.
연구진은 미세 조정이 기존 지식 간섭으로 환각을 키운다고 분석하고, 자기 증류 기반 해법을 제시했다. 동시에 HyLo는 컨텍스트를 최대 32배로 늘리고, Nvidia Nemotron 3 Nano Omni는 멀티모달 처리량 9배를 주장한다.
새 논문이 에이전트의 프롬프트·도구·평가 루프를 자동화하고, 새로운 강화학습 기법과 까다로운 논문 검색 벤치마크가 오늘의 한계를 드러낸다.
개정된 합의로 마이크로소프트의 라이선스는 2032년까지 유지되고 AGI 조항은 사라졌습니다. 오픈AI는 AWS와 구글 클라우드로 확장할 수 있어, 기업은 실제 선택지를 갖게 됩니다.
데이터 분석 에이전트를 ‘과정 단위’로 보상해 정확도를 7.21%와 11.28% 끌어올리고, 강화학습으로 78.73%/64.84%를 기록했습니다. 동시에 SketchVLM은 시각적 근거를 보여주고, promptfoo는 팀용 평가를 묶어 제공합니다.
Schwarz Group가 5억 유로를 투자하며 Cohere가 독일 Aleph Alpha를 흡수해 규제 산업을 겨냥한 캐나다–독일 축 대안을 내세웁니다. 또한: 여행 산업에서 시연된 Google Cloud의 에이전트 플랫폼, AWS의 ‘3개 API’ 에이전트 하네스 소식.
연구진이 원본 장면과 일부러 왜곡한 장면을 대비해 근거 없는 토큰을 눌러주는 3D-VCD를 공개했습니다. 더불어 표현 공간을 함께 진화시키는 확산 훈련, 강화학습으로 다중 페이지 웹을 만드는 모델, 로컬에서 돌릴 수 있는 터미널형 코딩 에이전트도 나왔습니다.
에이전트가 활약한 한 주: GPT‑5.5가 다단계 업무에 도전하고, DeepSeek가 장문 컨텍스트 비용을 낮췄으며, 구글은 앤스로픽을 위해 수십억 달러 규모의 컴퓨트를 확보했다 — 지메일과 어도비는 보조원을 일상 워크플로에 들였다.
현금과 컴퓨트의 결합: 구글이 앤트로픽에 100억 달러를 먼저 넣고 최대 300억 달러를 추가로 약정했습니다. 동시에 Cohere–Aleph Alpha 합병과 ComfyUI의 5억 달러 가치는 기업과 크리에이터의 선택지를 보여줍니다.
장시간 ‘에이전트형’ 작업이 데모를 넘어 실전에 들어갑니다. Zhipu GLM‑5.1은 8시간 자율 실행과 함께 공개 가중치를 배포했고, Moonshot의 Kimi K2.6는 300개 에이전트 스웜으로 일반 배포에 돌입했습니다.
중국의 DeepSeek가 프론티어급에 근접했다는 MoE 모델 프리뷰 두 종을 내놓았습니다. 동시에 Cohere는 주권형 AI 합병을 추진하고, Nvidia는 핵심 데이터 인프라에 자금을 댔습니다.
DeepSeek V4는 1.6조 파라미터 MoE와 100만 토큰 컨텍스트, 저가 API 요금을 결합했다. 동시에 MoE 서빙 비용을 낮추고, 4D로 영상을 재촬영하며, 시각‑언어 환각을 줄이는 최신 연구도 나왔다.
Plus·Pro·Business·Enterprise 이용자에게 제공되는 GPT-5.5는 코딩·컴퓨터 활용·지식 업무 벤치마크에서 향상을 보였고, 오픈AI의 ‘슈퍼앱’ 구상에도 힘을 싣는다.
GPT‑5.5가 GPT‑5.4급 지연시간을 유지하면서 코딩·브라우징·분석 능력을 강화해 ChatGPT에 도입됩니다. 동시에 Google Gemma 4와 Alibaba Qwen3.6‑27B는 효율적인 오픈 모델을 앞세우고, 새로운 MoE 연구는 훈련 계산량을 더 줄입니다.
자본·유통·속도가 맞물렸다: OpenAI는 사모펀드 연계 합작을 논의하고 Infosys와 제휴를 넓히며 에이전트 지연을 낮췄고, 영업·지원 분야 특화 도구는 투자와 인수로 탄력을 받았다.
"초소형 모델 + 클라우드" 핸드오프로 응답을 기기에서 먼저 시작하고, 큰 모델이 문장 중간에 이어 받아 지연을 숨긴다. 함께 공개된 논문들은 LoRA 층 선택을 정밀화하고, 에이전트 심사 역량을 벤치마크하며, 언어에서 행동까지 로봇 학습을 하나로 묶는다.
ChatGPT Images 2.0가 웹을 참고해 한 번의 프롬프트로 최대 8장의 통일된 이미지를 만든다. 동시에 규제 압박과 인재 전쟁은 기능 활용과 컴플라이언스·용량 관리의 균형을 요구한다.
River-LLM은 키-값(KV) 공유로 디코더 전용 모델이 생성 도중 레이어를 건너뛰어도 맥락을 잃지 않도록 해 실제 지연을 줄였다고 주장한다. 함께 주목할 점: 터미널 에이전트 보상 악용 3,632건을 모은 데이터셋과 7.2백만 환자의 250억 기록으로 학습된 헬스케어 모델.
블룸버그에 따르면 구글이 메타·Anthropic와의 계약에 이어 추론용 신규 칩을 준비 중입니다. 동시에 Adobe와 Siemens가 에이전트형 AI를 엔터프라이즈에 투입하며 더 빠르고 저렴한 자동화를 예고합니다.
935건의 소거(ablation)를 분석한 결과, AI 아키텍처 변경은 적합도 효과 분포가 긴 꼬리를 보였고(68% 악화, 19% 중립, 13% 개선), 새로운 발상이 물결치듯 등장하는 로지스틱 패턴도 확인됐다. 같은 호에서 로보틱스 벤치마크와 확산 모델 샘플링 편향 교정법도 발표됐다.
웨이퍼스케일 칩 업체 Cerebras가 2025년 매출 5.1억 달러를 공개하며 5월 중순 상장을 추진한다. 하이퍼스케일러 수요가 엔비디아 중심 구도를 흔드는 신호다.
RadAgent는 흉부 CT 판독을 도구 기반의 단계형 워크플로로 바꾸고 정확도와 강건성을 끌어올렸다. 동시에 지식 탐색, 일관된 웹 UI 생성, 모델을 감싸는 ‘하니스’가 주목받고 있다.
AWS가 OpenAI의 핵심 유통사가 되고, Meta는 1GW+ 커스텀 AI 칩을 예약했으며, Anthropic은 난도 높은 코딩을 겨냥해 Claude를 업그레이드했고, Chrome의 AI 모드는 분할 화면으로 진화했다. 결론: 에이전트는 단순한 대화를 넘어 실제 일을 점점 더 해낸다.
Claude Design은 코드·디자인 파일을 읽어 브랜드 시스템을 만들고, 슬라이드와 앱 UI를 생성해 Claude Code로 넘길 수 있게 한다. 동시에 Google은 AI Mode로 쇼핑·여행 기능을 강화했다.
신형 모델은 스프레드시트·프레젠테이션 성과를 끌어올리고, 브라우저·데스크톱을 다루는 에이전트 기능을 기본 제공한다. Google은 Apache 2.0의 Gemma 4와 아날로그 계기를 읽는 로보틱스 모델로 맞선다.
Chrome AI Mode는 주변 매장 재고를 대신 확인하고, 웹페이지를 AI와 나란히 열어 탐색 흐름을 유지한다. 한편 어도비와 OpenAI는 다단계 작업을 처리하는 에이전트형 도구를 내놨다.
채널을 나눈 ‘3상’ 잔차 스트림으로 1,536개 파라미터만 더해도 123M 모델의 퍼플렉시티가 7.2% 낮아지고 학습 수렴은 거의 2배 빨라졌다. 동시에 RL 미세조정, 시각 추론 강화, 커널·컴파일러 최적화로 2–5배 속도 향상 연구가 이어진다.
자율 코딩 에이전트를 만드는 Factory가 Khosla Ventures 주도로 신규 라운드를 추진합니다. Keith Rabois의 이사회 합류가 예정된 가운데, Anthropic·OpenAI·Cursor와의 정면 승부를 예고합니다.
Opus 4.7은 장시간 복잡 과제를 더 적은 감독으로 처리하고 핵심 코딩 벤치마크를 선도하면서도, 더 엄격한 보안 안전장치와 고해상도 비전을 더했습니다. 가격은 그대로입니다.
Meta가 자체 MTIA 가속기 1GW 이상을 약정하고 Broadcom의 설계·패키징·네트워킹을 채택합니다. Broadcom CEO Hock Tan은 Meta 이사회에서 물러나 칩 전략 자문으로 전환합니다.
사용자는 평범한 지시만 했는데도 데스크탑·웹 에이전트가 심각한 피해를 낳을 수 있다는 연구가 나왔습니다. 한편 더 빠르고 안전한 모델을 위한 훈련·구조 연구가 속도를 내고, 모바일·브라우저를 아우르는 대형 오픈소스 에이전트 업데이트도 공개됐습니다.
Anthropic Mythos 공개 일주일 만에 OpenAI가 더 완화된 보안 특화 모델을 제한 공개하고 접근 프로그램을 확대한다. 반면 EU 당국은 Mythos 시험에서 배제됐다고 지적하며 최첨단 사이버 AI 접근권을 누가 통제하는지 드러난다.
토큰당 120B 중 12B만 활성화하는 하이브리드 Mamba-Transformer가 100만 토큰 문맥과 최대 7.5배 처리량 향상을 내세우며 가중치·데이터셋을 공개했다. 텍스트-이미지와 오픈 LLM으로 확산되는 MoE 흐름 속 발표다.
OpenAI 신규 영업 총괄의 내부 메모가 아마존을 핵심 기업 채널로 지목하고 Microsoft의 제약을 비판했으며, Anthropic의 매출 추정치에도 문제를 제기했다는 보도입니다.
처음으로 ‘틀린 토큰에 주의가 쏠리는’ 현상을 종합 정리하고 대응책을 제시했습니다. 여기에 추적 가능한 에이전트 디버거, 선언형 워크플로 언어, 더 까다로운 양자 코드 벤치마크도 나왔습니다.
OpenAI가 월 100달러 요금제로 개발자용 구간을 채우는 사이, Microsoft는 자체 음성·이미지 모델을 공개했다. 일본 SoftBank는 ‘물리 AI’ 국산화를 띄우고, 미국에서는 광고 보이콧 담합 의혹에 규제 신호가 나왔다.
LG의 EXAONE 4.5가 시각·텍스트 동시 학습과 초장문 맥락으로 문서 과제를 정면 돌파했다. 한편 NVIDIA는 에이전트용 하이브리드 모델을 내놓고, 3D 탐지와 효율적 생성 연구도 전진했다.
분주했던 한 주: Meta의 새 모델은 앱을 Top 5로 끌어올렸고, Anthropic은 강력한 버그 탐지 AI의 접근을 제한했으며, Microsoft는 사내 모델 3종을 출하하고 Alibaba는 최상위 동영상 생성기를 자처 — 더 깊게 내장되고, 더 엄격히 통제되며, 더 유용해진 AI의 흐름을 보여준다.
Anthropic의 Mythos가 보안 논쟁을 촉발하는 사이, Oracle과 Amazon은 데이터 센터·칩 투자를 키웠습니다. Lucid·Upstage의 신기능은 에이전트형 AI를 실제 업무로 당겨옵니다.
확률확산 모델의 샘플링이 건너뛸 수 없는 최소 단계가 처음으로 제시됐습니다. 동시에 자율주행의 OL-CL 격차와 코딩 에이전트의 쓰기 실패를 다루는 실용적 해법도 나왔습니다. 속도를 원한다면, 한계를 알고 시스템으로 우회하는 날입니다.
보안 모델은 방어 진영에 먼저 배포되고, 중국의 영상 생성 모델은 1위를 차지했으며, OpenAI는 사상급 자본을 확보했습니다. 오늘의 변화는 ‘누가 먼저 쓰나’와 ‘어디에 투자하나’를 바꿉니다.
익명으로 등장해 순위표를 휩쓴 HappyHorse-1.0이 알리바바 프로젝트로 확인됐다. 동시에 에이전트의 ‘기억’을 다루는 논문과 도구가 주목받으며 실사용 기준이 달라지고 있다.
메타의 Muse Spark가 공개되며 앱 스토어 상위권에 진입했고, 제품 내 쇼핑·추천 등 소비자 기능에 AI를 직접 묶는 전략이 확인됐다. 동시에 연구계는 추론 일반화 조건, 확산형 디코딩 속도, 실사용 에이전트 벤치마크로 초점이 이동했다.
OpenAI의 메가 라운드, 구글의 오픈 Gemma 4, 마이크로소프트의 합리적 가격의 미디어 모델, 그리고 AWS와의 파트너십은 운영비가 더 낮고 셀프호스팅이 쉬우며 일상 업무에 더 가까운 AI로의 흐름을 보여준다.
자금, 정책, 엔지니어링이 동시에 움직인 한 주: 오픈AI의 100억 달러 조달과 미국 AI 프레임워크가 무대를 깔고, 구글의 KV 캐시 압축은 더 저렴한 추론을 예고했으며, Anthropic 유출은 사이버보안의 긴박함을 부각—게다가 실시간 온디바이스 TTS까지 직접 시도할 수 있다.