제01권 · 제10호 로그 데일리 2026년 5월 30일

최신 AI 뉴스 모음집

AI · 논문데일리 큐레이션공개 열람
◆ 헤드라인 AI 뉴스Business

마이크로소프트, 코파일럿 강화를 위한 자체 코딩 AI 공개

로이터에 따르면 마이크로소프트가 빌드에서 자체 코딩 모델 등 특화 AI를 준비 중이며, 아사나는 StackAI를 인수하고 Groq는 추론 사업 확대를 위해 6.5억 달러 조달을 추진한다.

MicrosoftGitHub CopilotOpenAIGroqAsana 약 7분
◆ 헤드라인 AI 뉴스Business

에이전트의 실전 배치: 구글 Gemini 내장, 엔비디아 Vera 출하, ChatGPT 재정 미리보기, 블랙스톤-구글 50억 달러 TPU 동맹

에이전트가 채팅에서 행동으로 도약: 구글은 Gemini를 내장형 도우미로 만들고, 엔비디아는 에이전트 오케스트레이션용 CPU를 출하했으며, 오픈AI는 ChatGPT에 재정 보기 기능을 열고, 50억 달러 TPU 합작 벤처도 윤곽을 드러냈다 — 일상 도구 속 어시스턴트가 더 빠르고 저렴해진다는 신호다.

약 17분
AI 뉴스Business

이번 조달로 Anthropic의 기업가치가 OpenAI를 넘어섰고, 새 모델은 ‘노력 수준’ 제어와 더 빠르고 저렴한 응답을 추가했다. 한편 OpenAI는 선거 대비 안전장치를 공개했다.

AnthropicOpenAIClaude Opus 4.8AI valuation 약 8분
AI 뉴스Research

하나의 ‘네이티브 멀티모달’ 임베딩이 주요 이미지·영상·텍스트 벤치마크에서 강한 검색 성능을 보여, 검색·추천·검색 증강 생성 파이프라인 단순화를 가리킨다.

multimodal embeddingsretrievalGPU kernelsRLHF 약 6분
AI 뉴스Research

MotiMotion은 동작 제어를 ‘추론 후 생성’으로 재구성하고 새 벤치마크를 제시한다. 보상부터 터미널 피드백까지 신뢰성을 겨냥한 세 편의 에이전트 학습 논문과, GPU 없이 구동되는 MIT 라이선스 로컬 엔진(LocalAI)도 나왔다.

video generationreinforcement learningagentsreward hacking 약 7분
AI 뉴스Business

어트랙터 기반 추론, 섀넌 스케일링 법칙, 단계적 비전 학습을 제안한 3편의 논문이 나왔습니다. 추론 컴퓨트 조절과 입력 노이즈 감소로 정확도를 높일 수 있다는 메시지입니다.

Scaling lawsTest-time computeVision-language modelsInference efficiency 약 6분
AI 뉴스Research

추론을 ‘학습된 수렴점’으로 보고, 모델 학습을 잡음 채널의 용량 문제로 해석하며, 비전-언어 모델에서 ‘보기’와 ‘생각하기’를 분리해 성과를 끌어올리고, 언어 지시로 3D 장면을 촬영하는 에이전트 과제를 실행 가능하게 만든 연구들이 나왔다.

scaling lawsreasoningvision-language models3D agents 약 7분
AI 뉴스Business

구글이 대화형 에이전트를 중심으로 검색을 재설계하고 AI 모드의 엔진으로 Gemini 3.5 Flash를 내세웠습니다. 동시에 10초짜리 AI 동영상 생성이 앱에 적용되며, 가격·보안 이슈가 기업의 AI 도입 방식을 바꾸고 있습니다.

GoogleGeminiAI agentsSearch 약 8분
AI 뉴스Research

볼록 최적화로 설계한 새 토크나이저가 탐욕적 규칙을 대체해 바이트당 비트 효율을 높이고, 어휘가 최적에 얼마나 가까운지 인증까지 제공한다. 또한 소비자 노트북에서 라이브 음악 생성, 과학 진보 예측 한계, 프롬프트 가능한 동물 3D 복원, 항상 최신 컨텍스트를 유지하는 증분 인덱싱 엔진 소식.

TokenizationConvex optimizationDiffusion modelsMusic generation 약 6분
AI 뉴스Weekly

에이전트가 채팅에서 행동으로 도약: 구글은 Gemini를 내장형 도우미로 만들고, 엔비디아는 에이전트 오케스트레이션용 CPU를 출하했으며, 오픈AI는 ChatGPT에 재정 보기 기능을 열고, 50억 달러 TPU 합작 벤처도 윤곽을 드러냈다 — 일상 도구 속 어시스턴트가 더 빠르고 저렴해진다는 신호다.

약 17분
AI 뉴스Business

FT는 스페이스X·오픈AI·앤스로픽의 상장을 AI 수요의 현실 점검으로 짚었고, Corsair는 프라이빗 AI 도입을 겨냥한 Grace Blackwell 기반 워크스테이션·서버를 공개했다.

IPOsSpaceXOpenAIAnthropic 약 6분
AI 뉴스Research

LoREnc는 복구 가능한 저순위 신호를 억제해 도난 가중치나 무단 어댑터를 무력화하고, 허가된 어댑터는 성능을 1% 미만 오버헤드로 복구한다. 더불어 토큰을 절약하는 자기 조절형 계획, 다중 에이전트의 캐시 공유 보안, 챗봇의 검색 의존을 보여주는 연구를 다룬다.

model securityLoRAmulti-agent LLMsKV cache 약 7분
AI 뉴스Research

AutoRubric-T2I는 비전‑언어 모델 심사자를 '학습된 체크리스트'로 가르쳐 사람이 매긴 선호 데이터의 0.01% 미만만으로도 기존 보상 모델을 앞선다. 실행 결과를 기준으로 한 코딩 에이전트와 긴 문맥을 더 안정적으로 다루는 어텐션 연구도 함께 발표됐다.

text-to-imagereward modelingvision-language modelslinear attention 약 7분
AI 뉴스Research

이 확산 기반 시스템은 가변 길이 생성과 부분 편집(inpainting)을 지원하며, 라이선스·크리에이티브 커먼즈 데이터로 학습되고 소비자용 기기에서 구동된다. 연구진은 H200에서 2초 미만, MacBook Pro M4에서도 몇 초 미만으로 출력된다고 보고한다.

audio generationdiffusion LLMMixture-of-Expertstime-series forecasting 약 6분
AI 뉴스Research

문서가 길어질수록 널리 쓰이는 RoPE 위치 부호화가 인접성·토큰 구분 신호를 잃는다는 논문이 나왔습니다. 동시에 확산+MoE 추론 효율화, VLM 훈련법, 임상 에이전트 실험 결과가 실무적 진전을 보였습니다.

RoPElong-context LLMsMoE inferenceVision-language models 약 7분
AI 뉴스Research

이번 업데이트는 대화가 아니라 ‘작업 수행’에 초점을 맞춘다 — Gemini 앱의 기본 모델로 적용되고 24시간 에이전트를 구동하며, 오픈소스는 입력 정제와 배포 패턴을 보강한다.

GoogleGemini 3.5 FlashAgentic AIBenchmarks 약 8분
AI 뉴스Business

엔비디아의 88코어 Vera가 에이전트 업무를 겨냥해 고객사에 전달됐다. 한편 Apple은 iOS 27에 AI 글쓰기를 준비하고, 광고 업계는 Publicis–LiveRamp 인수로 데이터 협업을 서두른다.

Nvidia VeraAgentic AIApple iOS 27Publicis LiveRamp 약 10분
AI 뉴스Business

Databricks는 GPT‑5.5로 OfficeQA Pro 에이전트 벤치마크에서 오류 46% 감소를 밝혔다고 했고, ChatGPT는 1만2천여 기관 연동이 가능한 미국 Pro 미리보기를 열었다. 실제 워크플로 확장과 동시에 TechCrunch는 배심원이 오픈AI 리더십의 ‘신뢰’를 논의 중이라고 짚었다.

OpenAIDatabricksGPT-5.5Personal Finance 약 7분
AI 뉴스Research

단 128개 예시로 전체 데이터 수준을 따라잡는 소량 예시 강화학습이 나왔고, 편향을 제거한 옴니모달 벤치마크가 성능을 재정의했습니다. 또 macOS용 로컬 AI 에이전트 앱이 실사용으로 다가옵니다.

RLVRReinforcement LearningOmni-modalVisual reasoning 약 8분
AI 뉴스Weekly

AI가 채팅창을 떠났다. 오픈AI는 40억 달러 규모 배포 유닛과 보안 프로그램을 세웠고, 마이크로소프트의 에이전트 시스템은 윈도우즈 취약점 16건을 찾아냈으며, 메타는 암호화된 무로그 채팅을 추가했고 Claude는 SMB 도구로 들어갔다 — 지금 바로 시도해볼 수 있는 구체적 액션도 하나 제시한다.

약 20분
AI 뉴스Research

이미지 생성 논문이 구면 경로로 학습 단계를 유지해 ImageNet-256 성능을 꾸준히 높였다고 보고한다 — 아키텍처 변경 없이. 이어 단일 위성 사진으로 거리 3D 복원을 강화하고, 장편 비디오 일관성을 점검하는 벤치마크와 페어 비교 “토너먼트”로 Gemini 3.1 Pro 코딩 Elo를 405점 끌어올린 연구가 발표됐다.

diffusion modelsflow matchingVAE latents3D scene generation 약 7분
AI 뉴스Research

Lighthouse Attention은 표준 어텐션 앞뒤로 시퀀스를 압축해 학습을 빠르게 하고, 짧은 복구 단계 뒤 스스로 제거된다. 실제 테이블 이해·전문가 혼합 라우팅·적응형 에이전트 평가 연구가 함께 나왔고, 쿠버네티스 추론 스택은 주요 변경을 포함한 업데이트를 배포했다.

TransformersLong-contextMixture-of-ExpertsBenchmarking 약 6분
AI 뉴스Research

FlowCompile는 실행 전에 구조화된 에이전트 파이프라인의 정확도–지연 시간 계획을 미리 만들어 최대 6.4배 가속을 보고한다. 함께 나온 연구는 짧은 추론, 통신량을 줄인 MoE 추론, 음성 에이전트의 종단 간 벤치마크에 초점을 맞춘다.

FlowCompileMixture-of-ExpertsLLM workflowsvoice agents 약 6분
AI 뉴스Business

‘즉시 AI 인력’ Hirebase가 클로즈드 베타로 공개되어 구글 문서, 슬랙, 노션에서 에이전트를 실행한다. 여기에 메타의 암호화 AI 채팅, 마이크로소프트의 에이전트형 보안 시스템, 알파벳의 AI 신약 설계 21억 달러 투자까지 겹쳤다.

AI agentsBasedAIMeta AIMicrosoft Security 약 9분
AI 뉴스Research

DeepMind는 선택한 대상과 의도를 이해하는 AI 포인터를 공개해 화면의 픽셀을 ‘비교하기’, ‘길찾기’ 같은 동작으로 바꾼다. Microsoft는 16개의 Windows 취약점을 찾아낸 에이전트 시스템을 공개했고, 오픈소스 도구들은 에이전트 워크플로를 다듬고 있다.

DeepMindGeminiAgentic SecurityMicrosoft 약 8분
AI 뉴스Business

Daybreak은 GPT-5.5-Cyber와 Codex Security를 결합해 공격자보다 먼저 취약점을 찾아 검증하도록 돕는다. 구글은 안드로이드에 도입될 Gemini 기반 자동화도 공개했다.

OpenAIDaybreakCybersecurityAndroid 약 6분
AI 뉴스Business

오픈AI가 다수 지분을 보유한 새 법인을 출범해 Tomoro의 엔지니어 150명과 19개 파트너를 묶었다. 같은 날 구글은 AI 기반 해킹 징후를 경고했고, 미국에선 연방 계약 전 안전성 심사 요구가 제기됐다.

OpenAIEnterprise AIConsultingAnthropic 약 7분
AI 뉴스Research

ROPD는 교사 응답에서 프롬프트별 체크리스트를 만들어 학생 시도를 채점하고, 다수 평가에서 로짓 기반 온정책 증류를 앞선다. 모델 선택, 에이전트 스킬, 테스트 시간 확장 연구도 비용과 안전성을 함께 겨냥한다.

LLM alignmentOn-policy distillationModel recommendationAgent frameworks 약 7분
AI 뉴스Business

Nous Research의 Hermes Agent가 ‘Tenacity’ 업데이트 후 OpenRouter 일일 토큰 사용 1위를 기록했다. Lemonade는 vLLM ROCm을 도입해 기기 내 대형 언어 모델 실행 속도를 높였다.

Nous ResearchHermes AgentOpenRouterOpenClaw 약 6분
AI 뉴스Research

ActCam이 생성 영상에서 인물 동작과 카메라를 동시에 조정하게 했다. 한편, 전문가 혼합(Mixture of Experts, MoE)의 공유 풀 설계가 효율을 높였고 Hermes Agent는 사용량 1위에 올랐다.

video generationMixture-of-Expertsreasoningagent systems 약 8분
AI 뉴스Weekly

에이전트 플랫폼과 가드레일이 출하되고, ChatGPT는 기본으로 더 빨라졌으며, 엔비디아는 새 CPU로 에이전트 병목을 겨냥했고, 오픈AI는 대규모 자금과 AWS 용량을 확보했다 — 파일럿에서 프로덕션으로 에이전트를 옮기는 데 방점이 찍힌 한 주.

약 18분
AI 뉴스Research

1조(1 trillion) 토큰으로 학습한 1B‑active, 14B‑total 전문가 기반 모델이 전문가의 25%(약 1% 하락) 또는 12.5%(약 3% 하락)만 로드해도 거의 전체 성능을 유지한다 — 성능을 유지하면서 메모리를 줄일 현실적 경로다.

Mixture-of-ExpertsModular LLMsReinforcement LearningRetrieval 약 6분
AI 뉴스Business

중국의 유망 모델 개발사가 대규모 자금 유치를 모색하는 가운데, 브뤼셀은 고위험 AI 규정의 적용 시점을 늦췄습니다. 법정 공방 속 OpenAI는 ‘신뢰 기반’ 사이버 접근과 통제 가능한 코딩 에이전트를 강조했습니다.

KimiEU AI ActOpenAIGovernance 약 7분
AI 뉴스Research

Kimi‑K2.5, GLM‑5, MiniMax, DeepSeek, Qwen, Gemma 등을 로컬에서 쉽게 돌리게 하는 설치·Docker 지원이 정비됐다. 동시에 AI가 작성한 GPU 커널의 실패 지점을 짚고, 오디오·비전 학습 지형을 정리하며, 바이오 도구 호출 데이터셋과 데이터 부족 상황의 훈련 법칙을 제시한 논문들이 나왔다.

OllamaLocal LLMGPU kernelsAudio-Visual 약 8분
AI 뉴스Business

이 오픈 웨이트 모델은 최대 5배 처리량과 100만 토큰 컨텍스트로 다중 에이전트 워크플로의 맥락 유지를 돕는다. 동시에 Nvidia는 통합 멀티모달 모델을 확장하고, 중국 Moonshot AI는 20억 달러를 유치했다.

NVIDIAAgentic AINemotron 3Open models 약 9분
AI 뉴스Business

OpenAI가 더 빠르고 오류를 줄인 모델을 ChatGPT 기본으로 바꾸고 기억 출처 표시를 도입했다. 동시에 Apple은 iOS 27에서 모델 선택을 시험하고, Anthropic은 SpaceX 컴퓨트를 확보했으며, SAP는 표형 데이터 AI 연구소를 인수했다—AI가 시연에서 실제 배치로 옮겨가고 있음을 보여준다.

OpenAIAnthropicAppleSAP 약 10분
AI 뉴스Research

두 편의 서베이가 RL 기반 추론 모델과 진화하는 에이전트 스킬의 설계·거버넌스를 정리했고, 구글은 Gemma 4를 빠르게 만드는 다중 토큰 예측과 장시간 작업용 웹훅을 공개했다.

LLM reinforcement learningSpeculative decodingRetrievalRed teaming 약 9분
AI 뉴스Business

구글 File Search가 텍스트와 이미지를 함께 검색하고 답변에 정확한 페이지를 인용하도록 바뀌었습니다. 동시에 Microsoft는 에이전트 행동을 통제하는 오픈소스 거버넌스 도구를 공개했습니다.

GoogleGeminiRAGEmbeddings 약 5분
AI 뉴스Business

Appfigures에 따르면 이미지 모델 출시는 일반 업데이트보다 다운로드가 6.5배 늘지만, 28일간 7,000만 달러 매출로 이를 수익화한 곳은 ChatGPT뿐이다. 동시에 Anthropic·OpenAI는 사모펀드와 합작 법인을 세워 중견 기업 공략에 나서고, Morgan Stanley는 홍콩 테크로의 AI 자금 유입을 지목했다.

OpenAIAnthropicAI image generationGoogle Gemini 약 8분
AI 뉴스Research

Odysseus는 Super Mario Land에서 100+번의 결정을 내리는 멀티모달 에이전트를 훈련해 선행 모델보다 최소 3배 더 멀리 진전한다. 동시에 오픈 모델은 어려운 시험에서 확장되고, 새 벤치마크는 강의 영상 이해와 시각적 ‘정직성’을 압박 테스트한다.

Reinforcement LearningVision-Language ModelsMoE routingMultimodal benchmarks 약 8분
AI 뉴스Business

대규모 자금 조달로 OpenAI가 장기 컴퓨트와 다중 클라우드·칩 전략을 확보했습니다. AWS 협력과 엔비디아의 에이전트용 CPU까지 맞물리며 업무용 AI가 어떻게 돌아갈지 방향이 드러납니다.

OpenAIAWSNvidiaGoogle Cloud 약 10분
AI 뉴스Research

새 논문은 컴퓨터 에이전트가 기본은 소형 정책으로 운영하고, 멈춤이나 의미 드리프트가 감지될 때만 강한 모델을 호출하는 사건 주도형 계단식을 제안합니다. 실시간 워크플로 벤치마크와 대규모 시각 데이터는 ‘정밀 계산’과 평가의 중요성을 보여줍니다.

computer-use agentscascaded inferencepreference optimizationworkflow benchmarks 약 8분
AI 뉴스Weekly

에이전틱 AI가 실전에 들어섰다: GPT‑5.5는 다단계 업무를 겨냥하고, 오픈AI는 멀티클라우드·정부 채널을 열었으며, 펜타곤은 Gemini를 수백만 명으로 확대하고, 엔비디아는 에이전트 루프용 CPU를 공개했다. 이번 주 달라진 점과 직접 해볼 실험 한 가지를 짚었다.

약 19분
AI 뉴스Business

미 국방부가 Google, Nvidia, OpenAI 등과 기밀 시스템에서 AI를 운용하기로 합의했다. 한편 Nvidia는 에이전트용 멀티모달 모델을 공개했고, Meta는 휴머노이드 AI 스타트업을 인수했으며 IBM은 엔터프라이즈 개발 파트너를 선보였다.

PentagonOpenAINvidia NemotronGoogle 약 8분
AI 뉴스Research

Nvidia의 Nemotron 3 Nano Omni가 오디오·비전·텍스트를 하나로 묶은 경량 시스템으로 나왔습니다. 장문 컨텍스트 공격 레드팀 속도 향상, 파인튜닝 후 안전성 변동, 소비자용 GPU 학습 가속, 자체 호스팅 개인 에이전트도 함께 짚습니다.

NVIDIAmultimodal LLMred teamingfine-tuning safety 약 8분
AI 뉴스Business

Cohere가 독일 Aleph Alpha를 200억 달러 가치로 인수 추진하고, Cisco는 오픈소스 모델 출처 검증 도구를 내놨습니다. 법률·의료 AI에도 자금이 몰립니다 — 팀에는 공급사 선택권, 규제 대응, 실전 배치의 길이 넓어집니다.

CohereAleph AlphaSovereign AICisco Model Provenance Kit 약 9분
AI 뉴스Research

Nemotron 3 Nano Omni는 오디오·비전·언어를 30B‑A3B 구조 하나로 묶은 공개 가중치 모델이다. 파인튜닝 후 안전성 변동과 더 빠르고 저렴한 레드팀·소비자 GPU 학습 기법을 다룬 논문도 나왔다.

NVIDIANemotron 3 Nano OmnimultimodalMixture-of-Experts 약 7분
AI 뉴스Business

마이크로소프트·알파벳·아마존·메타 실적에서 거대한 AI 설비투자가 클라우드 성장과 이익으로 이어지는지 검증이 핵심이다. 동시에 광고 플랫폼과 고객 지원에 AI 적용이 확대된다.

AlphabetMicrosoftMetaAWS 약 10분
AI 뉴스Business

미 정부기관은 GPT‑5.5를 합규제로 사용할 수 있고 AWS 고객은 Bedrock에서 OpenAI 모델을 쓸 수 있게 됐습니다. 의회는 사이버 대응 모델 브리핑을 받았고, 중국은 Meta–Manus 인수를 막는 가운데 Citi는 2030년 AI 시장을 4.2조 달러로 상향했습니다.

OpenAIAnthropicFedRAMPAWS Bedrock 약 11분
AI 뉴스Business

GPT-5.5는 GPT-5.4와 지연 시간은 같게 유지하면서 코딩·컴퓨터 사용 벤치마크 성능을 높였고, ChatGPT와 Codex의 Plus·Pro·Business·Enterprise에 순차 제공됩니다. 애플리케이션 프로그래밍 인터페이스(API)는 추가 안전 조치가 끝난 뒤 제공 예정인 가운데, Nvidia는 에이전틱 AI용 CPU를 공개했고 투자금은 에이전트 인프라와 임상 AI로 향했습니다.

OpenAIGPT-5.5agentic AINVIDIA Vera 약 10분
AI 뉴스Research

연구진은 미세 조정이 기존 지식 간섭으로 환각을 키운다고 분석하고, 자기 증류 기반 해법을 제시했다. 동시에 HyLo는 컨텍스트를 최대 32배로 늘리고, Nvidia Nemotron 3 Nano Omni는 멀티모달 처리량 9배를 주장한다.

fine-tuninghallucinationslong-contextMixture-of-Experts 약 11분
AI 뉴스Research

데이터 분석 에이전트를 ‘과정 단위’로 보상해 정확도를 7.21%와 11.28% 끌어올리고, 강화학습으로 78.73%/64.84%를 기록했습니다. 동시에 SketchVLM은 시각적 근거를 보여주고, promptfoo는 팀용 평가를 묶어 제공합니다.

Process reward modelsAgentic AIVision-languagePrompt evaluation 약 7분
AI 뉴스Research

연구진이 원본 장면과 일부러 왜곡한 장면을 대비해 근거 없는 토큰을 눌러주는 3D-VCD를 공개했습니다. 더불어 표현 공간을 함께 진화시키는 확산 훈련, 강화학습으로 다중 페이지 웹을 만드는 모델, 로컬에서 돌릴 수 있는 터미널형 코딩 에이전트도 나왔습니다.

Embodied AIContrastive decodingReinforcement learningDiffusion models 약 8분
AI 뉴스Business

현금과 컴퓨트의 결합: 구글이 앤트로픽에 100억 달러를 먼저 넣고 최대 300억 달러를 추가로 약정했습니다. 동시에 Cohere–Aleph Alpha 합병과 ComfyUI의 5억 달러 가치는 기업과 크리에이터의 선택지를 보여줍니다.

GoogleAnthropicCohereAleph Alpha 약 9분
AI 뉴스Research

DeepSeek V4는 1.6조 파라미터 MoE와 100만 토큰 컨텍스트, 저가 API 요금을 결합했다. 동시에 MoE 서빙 비용을 낮추고, 4D로 영상을 재촬영하며, 시각‑언어 환각을 줄이는 최신 연구도 나왔다.

DeepSeekMixture of ExpertsLong contextLLM pricing 약 7분
AI 뉴스Research

GPT‑5.5가 GPT‑5.4급 지연시간을 유지하면서 코딩·브라우징·분석 능력을 강화해 ChatGPT에 도입됩니다. 동시에 Google Gemma 4와 Alibaba Qwen3.6‑27B는 효율적인 오픈 모델을 앞세우고, 새로운 MoE 연구는 훈련 계산량을 더 줄입니다.

OpenAIGPT-5.5Gemma 4Qwen3.6-27B 약 10분
AI 뉴스Research

"초소형 모델 + 클라우드" 핸드오프로 응답을 기기에서 먼저 시작하고, 큰 모델이 문장 중간에 이어 받아 지연을 숨긴다. 함께 공개된 논문들은 LoRA 층 선택을 정밀화하고, 에이전트 심사 역량을 벤치마크하며, 언어에서 행동까지 로봇 학습을 하나로 묶는다.

On-device AIPEFTBenchmarksAgents 약 9분
AI 뉴스Business

ChatGPT Images 2.0가 웹을 참고해 한 번의 프롬프트로 최대 8장의 통일된 이미지를 만든다. 동시에 규제 압박과 인재 전쟁은 기능 활용과 컴플라이언스·용량 관리의 균형을 요구한다.

OpenAIChatGPT Images 2.0AnthropicAWS Trainium 약 8분
AI 뉴스Research

River-LLM은 키-값(KV) 공유로 디코더 전용 모델이 생성 도중 레이어를 건너뛰어도 맥락을 잃지 않도록 해 실제 지연을 줄였다고 주장한다. 함께 주목할 점: 터미널 에이전트 보상 악용 3,632건을 모은 데이터셋과 7.2백만 환자의 250억 기록으로 학습된 헬스케어 모델.

early exitKV cacheinference-time controlagent security 약 9분
AI 뉴스Business

블룸버그에 따르면 구글이 메타·Anthropic와의 계약에 이어 추론용 신규 칩을 준비 중입니다. 동시에 Adobe와 Siemens가 에이전트형 AI를 엔터프라이즈에 투입하며 더 빠르고 저렴한 자동화를 예고합니다.

GoogleNvidiaInference chipsAdobe CX Enterprise 약 7분
AI 뉴스Research

935건의 소거(ablation)를 분석한 결과, AI 아키텍처 변경은 적합도 효과 분포가 긴 꼬리를 보였고(68% 악화, 19% 중립, 13% 개선), 새로운 발상이 물결치듯 등장하는 로지스틱 패턴도 확인됐다. 같은 호에서 로보틱스 벤치마크와 확산 모델 샘플링 편향 교정법도 발표됐다.

evolutionary dynamicsNeural Architecture SearchRoboLabdiffusion models 약 8분
AI 뉴스Research

RadAgent는 흉부 CT 판독을 도구 기반의 단계형 워크플로로 바꾸고 정확도와 강건성을 끌어올렸다. 동시에 지식 탐색, 일관된 웹 UI 생성, 모델을 감싸는 ‘하니스’가 주목받고 있다.

medical imagingAI agentsRAGweb generation 약 6분
AI 뉴스Research

채널을 나눈 ‘3상’ 잔차 스트림으로 1,536개 파라미터만 더해도 123M 모델의 퍼플렉시티가 7.2% 낮아지고 학습 수렴은 거의 2배 빨라졌다. 동시에 RL 미세조정, 시각 추론 강화, 커널·컴파일러 최적화로 2–5배 속도 향상 연구가 이어진다.

TransformersReinforcement LearningCompiler OptimizationKernel Tuning 약 9분
AI 뉴스Research

사용자는 평범한 지시만 했는데도 데스크탑·웹 에이전트가 심각한 피해를 낳을 수 있다는 연구가 나왔습니다. 한편 더 빠르고 안전한 모델을 위한 훈련·구조 연구가 속도를 내고, 모바일·브라우저를 아우르는 대형 오픈소스 에이전트 업데이트도 공개됐습니다.

Agent safetyBenchmarksDistillationLooped models 약 9분
AI 뉴스Business

OpenAI가 월 100달러 요금제로 개발자용 구간을 채우는 사이, Microsoft는 자체 음성·이미지 모델을 공개했다. 일본 SoftBank는 ‘물리 AI’ 국산화를 띄우고, 미국에서는 광고 보이콧 담합 의혹에 규제 신호가 나왔다.

OpenAIMicrosoftClaude MaxCodex 약 11분
AI 뉴스Research

LG의 EXAONE 4.5가 시각·텍스트 동시 학습과 초장문 맥락으로 문서 과제를 정면 돌파했다. 한편 NVIDIA는 에이전트용 하이브리드 모델을 내놓고, 3D 탐지와 효율적 생성 연구도 전진했다.

Vision-Language ModelsLong-context3D DetectionGenerative Models 약 8분
AI 뉴스Weekly

분주했던 한 주: Meta의 새 모델은 앱을 Top 5로 끌어올렸고, Anthropic은 강력한 버그 탐지 AI의 접근을 제한했으며, Microsoft는 사내 모델 3종을 출하하고 Alibaba는 최상위 동영상 생성기를 자처 — 더 깊게 내장되고, 더 엄격히 통제되며, 더 유용해진 AI의 흐름을 보여준다.

약 14분
AI 뉴스Research

확률확산 모델의 샘플링이 건너뛸 수 없는 최소 단계가 처음으로 제시됐습니다. 동시에 자율주행의 OL-CL 격차와 코딩 에이전트의 쓰기 실패를 다루는 실용적 해법도 나왔습니다. 속도를 원한다면, 한계를 알고 시스템으로 우회하는 날입니다.

diffusion modelssampling theoryspeculative decodingautonomous driving 약 8분
AI 뉴스Research

익명으로 등장해 순위표를 휩쓴 HappyHorse-1.0이 알리바바 프로젝트로 확인됐다. 동시에 에이전트의 ‘기억’을 다루는 논문과 도구가 주목받으며 실사용 기준이 달라지고 있다.

Alibabavideo generationArtificial AnalysisLLM agents 약 8분
AI 뉴스Research

메타의 Muse Spark가 공개되며 앱 스토어 상위권에 진입했고, 제품 내 쇼핑·추천 등 소비자 기능에 AI를 직접 묶는 전략이 확인됐다. 동시에 연구계는 추론 일반화 조건, 확산형 디코딩 속도, 실사용 에이전트 벤치마크로 초점이 이동했다.

MetaMuse Sparkmultimodal LLMdiffusion decoding 약 10분
AI 뉴스Weekly

OpenAI의 메가 라운드, 구글의 오픈 Gemma 4, 마이크로소프트의 합리적 가격의 미디어 모델, 그리고 AWS와의 파트너십은 운영비가 더 낮고 셀프호스팅이 쉬우며 일상 업무에 더 가까운 AI로의 흐름을 보여준다.

약 13분
AI 뉴스Weekly

자금, 정책, 엔지니어링이 동시에 움직인 한 주: 오픈AI의 100억 달러 조달과 미국 AI 프레임워크가 무대를 깔고, 구글의 KV 캐시 압축은 더 저렴한 추론을 예고했으며, Anthropic 유출은 사이버보안의 긴박함을 부각—게다가 실시간 온디바이스 TTS까지 직접 시도할 수 있다.

약 16분