AI 뉴스 | 0to1log

행동 에이전트에 언제 상기시킬지 판단하는 별도 ‘메모리 에이전트’가 Terminal-Bench 2.0과 τ^2-Bench에서 pass@1을 각각 8.3점, 6.8점 높인다. 추가로 선형 어텐션 트레이드오프 가이드, 온디바이스 오디오 런타임, 프레임 간 추론을 학습한 비디오 모델을 다룬다.

long-horizon agentslinear attentionquantized inferencevideo reasoning 약 8분 2026. 7. 12.

AI 뉴스Research

AI가 조종하는 오픈소스 브라우저 등장: BrowserOS, 'BrowserClaw' 공개

BrowserOS가 macOS·Windows 설치 파일과 함께 에이전트 중심 브라우저를 공개했다. InsForge는 코딩 에이전트 백엔드를 업데이트했고, 새로운 벤치마크는 400개 실시간 과제를 평가한다.

agentic AIbrowser automationopen sourcebenchmark 약 4분 2026. 7. 11.

AI 뉴스Business

메타, 9월부터 ‘아이리스’ AI 칩 생산 시작 — 2027년 14GW 목표

로이터가 본 내부 메모에 따르면 메타는 자체 데이터센터 칩을 양산에 투입해 AI 비용을 낮추려 하고, 동시에 개발자용 코딩 모델 가격도 공개했다.

Metacustom siliconAI infrastructurecoding models 약 9분 2026. 7. 10.

AI 뉴스Research

픽셀 단위 지구 관측 모델 스케일링 규칙 — 395회 실험으로 검증

1,024개의 GH200 슈퍼칩으로 수행한 대규모 실험은 사전학습 손실이 성능 예측에 부정확하다는 점과 최적의 연산 배분 규칙을 제시한다 — 2,100만 매개변수 학생 모델은 128차원의 92%를 16차원·저장 용량 1/8로 유지한다.

Earth ObservationScaling LawsAgentic RLCoding Agents 약 7분 2026. 7. 10.

AI 뉴스Business

DeepSeek, 자체 AI 추론 칩 개발 착수 — Nvidia·Huawei 의존도 낮추기 신호

로이터에 따르면 이 중국 스타트업은 파운드리·메모리 업체와 협의를 시작하고 칩 설계 인재 채용을 조용히 늘렸습니다. 또한 오늘은 오픈AI가 GPT-5.6의 광범위 출시에 미국 승인을 받았고, 메타가 인스타그램·왓츠앱에 Muse Image를 선보였습니다.

DeepSeekOpenAIGPT-5.6Meta Muse 약 9분 2026. 7. 9.

AI 뉴스Research

재학습 없이 장문 컨텍스트 메모리 8.3배 축소, 64K에서도 품질 유지

장문 모델의 키–값 캐시를 압축해 정확도를 유지하면서 64K에서 초당 72.8토큰을 달성했다. 더불어 한 개 레이어만의 강화 학습이 전체 업데이트에 근접하고, 오픈소스 도구가 JSON 토큰을 최대 95% 줄인 소식도 나왔다.

KV cache compressionlong-context inferencereinforcement learning post-traininglayer-wise training 약 6분 2026. 7. 9.

AI 뉴스Business

중국, 자국 AI 모델 해외 접속 제한 검토

알리바바·바이트댄스·Z.ai와의 회의로 중국이 최고급 모델에 대한 통제를 강화하려는 신호가 나왔다. 비용 압박 속에 마이크로소프트는 자체 모델을 쓰기 시작했고 미국 기업들은 더 저렴한 중국산 모델로 눈을 돌리고 있다.

China AI policyMicrosoftOpenAIAnthropic 약 8분 2026. 7. 8.

AI 뉴스Research

새 검증기 방식, 조밀 피드백으로 AI 에이전트 성능 상승

LLM-as-a-Verifier는 추가 학습 없이 이산 점수 대신 연속 점수로 평가해, Terminal-Bench V2에서 86.5%를 포함해 코딩·로보틱스·의료 과제에서 성과를 보였다.

verificationlong-contextKV cachereinforcement learning 약 6분 2026. 7. 8.

AI 뉴스Business

Station F, F/ai 액셀러레이터 확대 — AI 스타트업 수익 전환 가속

파리의 Station F가 9월 F/ai 2기를 운영하고 GitHub·HubSpot 등 파트너를 추가한다. 6개월 내 100만 유로 매출을 목표로 하며, 1기는 프리시드로 3,400만 달러를 조달해 유럽의 AI 상용화 속도를 보여준다.

Station FEurope AIacceleratorsM&A 약 7분 2026. 7. 7.

AI 뉴스Research

6조 토큰 벤치마크가 비전-언어 학습에 유리한 데이터 혼합을 제시

DataComp-VLM은 160개 데이터셋을 묶어 지시형 혼합이 캡션 중심 필터링보다 낫다는 결과를 제시한다. 여기에 에이전트 보안 프레임워크와 송신 제어를 갖춘 로컬 연구 도구도 공개됐다.

Vision-Language ModelsData curationBenchmarkingAgent security 약 4분 2026. 7. 7.

AI 뉴스Business

SK하이닉스, AI 투자자 공략 위해 290억 달러 미국 상장 추진

SK하이닉스가 290억 달러 규모로 미국 상장을 추진해 AI 자본에 직접 접근하고 밸류에이션 격차를 줄이려 한다. 덧붙여: 2026년 유니콘 급증과 일부 고급 Siri 기능이 프로 모델에만 머물 수 있는 이유.

SK HynixMicron TechnologyAI memoryUS listing 약 7분 2026. 7. 6.

AI 뉴스Research

온디바이스 소형 에이전트, 대형 모델의 기억을 이식받아 3배 빨라졌다

DuoMem의 듀얼 공간 지식 이식으로 40억(4B) 파라미터 모델이 ALFWorld에서 4.3%→77.9%로 상승하고, 720억(72B) 교사보다 벽시계 기준 3배 이상 빠르게 작업을 끝낸다. 한편 Program-as-Weights는 ‘모호한’ 함수를 작은 어댑터로 컴파일해 6억(0.6B) 인터프리터가 맥북 M3에서 초당 30 토큰으로 실행한다.

On-device AIDistillationLoRAAgents 약 5분 2026. 7. 6.

AI 뉴스Weekly

값은 낮추고 용량은 조인다: Sonnet 5 기본 전환, 초저가 이미지 생성기, Meta의 GPU 클라우드

더 저렴한 모델과 도구가 전면에 등장하는 가운데 용량과 표준은 더 엄격해졌다. Anthropic의 Sonnet 5가 값싼 기본 모델이 되고, 구글의 이미지 생성기는 예산형 속도로, Meta는 GPU 클라우드를 노린다.

약 18분 2026. 7. 5.

AI 뉴스Business

AI로 빠르게 출범한 스타트업, 연준은 일자리 영향 검토

Here Now Health가 AI로 계획과 피치를 다듬어 16명으로 성장했다. 한편 메타는 에이전트 일정 기대를 낮추고, 앤트로픽은 신약 개발을 모색한다.

AI adoptionSmall businessAnthropicMeta 약 8분 2026. 7. 5.

AI 뉴스Research

새 연구: 그리드 기반 최근접 탐색, 차원 늘어도 속도 유지

스케일링 연구에 따르면 단순한 그리드 방식이 고차원 유사도 검색에서도 처리 속도를 비교적 안정적으로 유지한다. 여기에 기억을 ‘기술’로 학습하는 에이전트, 비문자적 검색 헤드를 골라내는 기법, 간단한 안전 모니터, Hermes Agent 대규모 릴리스까지 포함됐다.

ANN searchscaling lawsLLM agentsmemory optimization 약 8분 2026. 7. 5.

AI 뉴스Business

인도, 6월 AI 채용 16%↑·IT 일자리 3%↓

Naukri 자료에 따르면 인도 3,150억 달러 IT 산업이 긴축하는 가운데 기업들은 AI 채용을 우선하고, 블룸버그 지수는 AI 토큰 가격이 5월 고점 대비 약 20% 낮아졌다고 본다. 초기자본은 Magnify Ventures의 4,660만 달러 펀드 II를 통해 가정·돌봄 AI로도 유입된다.

IndiaAI hiringIT servicesLLM pricing 약 7분 2026. 7. 4.

AI 뉴스Research

모델 가중치만으로 학습 데이터 비율을 읽어내는 새 방법

WARP는 기준 모델과 미세 조정 모델 사이의 경로를 모사해 도메인 비율을 추정하며 BERT와 GPT‑2에서 평균 절대 오차 0.046~0.104을 기록한다. 또한 코딩 에이전트 분산 풀 리퀘스트 공격, 파라미터 수준 언러닝 검증, 긴 문맥 증거 재생, 에이전트 OS 공개 소식.

model auditingweight-space analysisdata provenanceLLM security 약 6분 2026. 7. 4.

AI 뉴스Business

미국, 자율적 AI 모델 기준 추진…기업은 ROI 지원 찾는다

로이터에 따르면 백악관이 프런티어 모델 공개를 벤치마크와 접근 규정으로 관리하는 자율 기준을 협의 중이다. 한편 Microsoft는 25억 달러 통합 법인을 출범했고, 저가 중국 모델이 관심을 모으는 가운데 MGX의 490억 달러 펀드가 마감되는 반면 CoreWeave 채권은 약세를 보인다.

US AI policyAI standardsMicrosoft Frontier CompanyGLM-5.2 약 11분 2026. 7. 3.

AI 뉴스Research

한 개 레이어 학습만으로 언어모델 강화학습 성능 대부분 회복

Qwen 계열 모델을 층별로 분석한 결과, 강화학습 후반학습에서 단 하나의 트랜스포머 레이어만 조정해도 전체 파라미터를 모두 조정한 성능에 맞먹거나 앞서는 경우가 확인됐다. 성능 향상은 스택의 중간 레이어에 몰려 있어 더 저렴하고 표적화된 후반학습 가능성을 시사한다.

Reinforcement learningTransformersLayer-wise trainingHealthcare agents 약 5분 2026. 7. 3.

AI 뉴스Business

메타, 잉여 AI 컴퓨팅 판매할 클라우드 사업 추진

메타가 자체 데이터센터에서 원시 컴퓨팅 임대와 모델 호스팅을 제공하는 ‘Meta Compute’를 추진한다. AWS·Azure·구글 클라우드와의 정면 경쟁 신호로, 메타 주가는 오르고 일부 네오클라우드 주가는 약세를 보였다.

Metacloud computingAI infrastructureneocloud 약 9분 2026. 7. 2.

AI 뉴스Research

200만 쌍 데이터셋으로 지시 기반 비디오 편집이 외형을 넘어선다

Goku는 200만 개 지시 정렬 비디오 편집 쌍, 1,000건 벤치마크, 지시 준수에서 최대 8% 향상 모델을 제시한다. 아울러 두 논문은 능동 실험으로 배우는 에이전트와 역할 인지 보상으로 학습을 다듬는 방법을 보여준다.

video editinginstruction followingLLM agentsreinforcement learning 약 5분 2026. 7. 2.

AI 뉴스Business

Anthropic, Claude Sonnet 5로 에이전트형 AI 비용 낮춘다

Anthropic가 기본 모델을 Claude Sonnet 5로 바꾸고 8월 31일까지 100만 입력 토큰당 2달러의 도입가를 적용한다. 한편 구글은 저가형 이미지 생성 모델을 내놓았고, 칩 신생사 Etched는 10억 달러 규모 주문을 밝혔다.

AnthropicClaude Sonnet 5GoogleNano Banana 2 Lite 약 9분 2026. 7. 1.

AI 뉴스Research

35B 에이전트, 호라이즌 확장으로 1조 파라미터급 성능에 근접

35B 전문가 혼합 에이전트가 4.5만 토큰 길이의 궤적과 1조 파라미터 모델과 견줄 장기 과제 성능을 보고했다. 배포 단계에서 스스로 진화하는 월드 모델과 11,260개 세션에서 재구성한 상호작용 코딩 벤치마크도 제안됐다.

LLM agentsMixture-of-Expertslong-horizon planningworld models 약 5분 2026. 7. 1.

AI 뉴스Business

AI 투자 확대, 기업 부채 급증…은행은 달러 넘어 채권 판매 다변화

AI 관련 차입이 투자등급 채권의 15%에 근접했고, 아마존과 알파벳은 지난 12개월간 다국통화로 600억 달러를 조달했다. 동시에 사용량 기반 요금제 확대로 기업들은 더 작고 저렴한 모델을 선호하는 흐름이 뚜렷하다.

AmazonAlphabetCorporate bondsAI costs 약 6분 2026. 6. 30.

AI 뉴스Research

로봇 내비게이션·계획을 하나로: Vesta가 전문 모델 조합을 능가

하나의 범용 로봇 모델이 위치 파악, 공간 추론, 내비게이션, 장기 기억을 통합해 평균 20% 이상 향상과 실제 과제 성공률 35% 이상 상승을 보고했다. Qwen의 후속 보고서는 1,560만 샘플로 학습한 조작용 정렬 프레임워크와 재구성 가능한 내비게이션 모델을 제시한다.

Embodied AIRoboticsVision-Language-ActionNavigation 약 5분 2026. 6. 30.

AI 뉴스Business

수출 제한과 컴퓨트 부족이 아시아형 AI의 틈새를 연다

앤트로픽 모델 수출 제한의 빈틈을 사카나 AI와 중국 360이 파고들고, 구글은 Gemini 용량을 제한한다. 170,000개 GPU 계약은 컴퓨트 접근성이 핵심 경쟁력임을 보여준다.

AnthropicSakana AINvidiaGoogle Cloud 약 12분 2026. 6. 29.

AI 뉴스Research

LISA, 제어형 이미지·비디오 생성 학습을 가속하면서 추론 비용 추가 없음

제어 분기를 ‘우도 점수’에 맞춰 정렬하는 새 정규화로 품질과 수렴 속도를 끌어올렸습니다. 다른 논문들은 웹 에이전트의 한계를 드러내고 정답 라벨 없이도 강화 학습이 성능을 높일 수 있음을 보였습니다.

diffusion modelscontrollable generationagent benchmarkingreinforcement learning 약 6분 2026. 6. 29.

AI 뉴스Weekly

오픈AI, Daybreak 보안 자동화·커스텀 추론 칩 공개; 딥마인드–A24 협력, 메타는 크리에이터 동반 앱 테스트

오픈AI는 버그 ‘발견’에서 ‘수정’으로 이동하고 커스텀 추론 칩을 공개했으며, 딥마인드는 A24와 손잡았고, 메타는 크리에이터 동반 앱을 선보였다 — AI가 더 저렴해지고 더 깊이 내장되며 거버넌스가 강화되는 신호다.

약 16분 2026. 6. 28.

AI 뉴스Business

오픈AI, IPO 연기 보도 — 지금 중요한 이유

CNBC는 오픈AI가 상장을 내년으로 미룬다고 전했습니다. 동시에 중국 Zhipu는 무료 모델로 상위권 성능에 근접했습니다. 시장 신호는 분명합니다: ‘가성비’로 모델을 고르라는 것.

OpenAIIPOZhipu AIGLM 5.2 약 6분 2026. 6. 28.

AI 뉴스Research

하나의 모델이 객체 수를 세고, 정확한 개수로 이미지를 생성한다

ABACUS는 30억 매개변수 기반 모델을 개조해 객체·군중 카운팅과 ‘개수 보존’ 이미지 생성을 함께 수행하며 7개 벤치마크 최상위 성능을 보고한다. 보강 논문들은 긴 추론을 위한 키-값 캐시를 줄이는 법과 물리 신호로 위성 예보를 개선하는 법을 제시한다.

Vision-language modelsObject countingKV cache compressionDiffusion models 약 5분 2026. 6. 28.

AI 뉴스Business

미국 검토 하에 OpenAI, GPT-5.6 출시… 저가형 티어 도입

OpenAI의 새 모델 Sol·Terra·Luna는 코딩·사이버보안을 겨냥하며, Sol은 100만 토큰 기준 입력 5달러·출력 30달러로 책정됐다. 프리뷰는 고객별 승인 방식으로 이뤄지고, 일부 합법적 작업도 보호장치에 의해 제한될 수 있다고 The Verge가 전했다.

OpenAIGPT-5.6AI safetyPricing 약 7분 2026. 6. 27.

AI 뉴스Research

보강학습 사후 학습으로 AI 에이전트 단계별 점수화

‘Progress Advantage’ 신호는 보강학습으로 학습된 정책의 로그확률만으로 각 행동을 평가한다—별도 보상 모델이 필요 없다. 함께 볼 것: JetSpec의 최대 9.64배 디코딩 가속, 67개 모델 분석이 조합 한계를 제시.

reinforcement learningLLM agentsspeculative decodingensembles 약 8분 2026. 6. 27.

AI 뉴스Business

페이스북, 크리에이터 성장을 돕는 AI 동반자 앱 시험

크리에이터 스튜디오를 바탕으로 한 이 시험용 앱은 AI 어시스턴트, 댓글 초안, 일일 우선순위를 묶어 수작업 분석을 줄인다. Adobe의 Topaz 인수와 구글 인재 이동까지, AI가 창작 업무 속으로 더 깊이 들어간 한 주였다.

MetaFacebookAdobeTopaz Labs 약 8분 2026. 6. 26.

AI 뉴스Research

AI 비디오 생성의 물리 타당성을 점검하는 새 평가법

구조화된 질문 그래프로 비디오의 물리 법칙 준수를 채점하고 인간 평가와의 상관을 제시한다. Sora 2, Veo 3, Wan 2.1을 새 물리 데이터셋으로 비교했다.

text-to-videoevaluationLLM safetyagent memory 약 6분 2026. 6. 26.

AI 뉴스Business

오픈AI, 브로드컴과 만든 AI 칩 공개 — 서비스 비용 절감 겨냥

오픈AI의 Jalapeño ASIC은 더 저렴하고 효율적인 추론을 겨냥한다. 한편 미 정부는 메타에 자발적 모델 검토를 요구하고, 기업들은 늘어난 AI 비용을 조이기 시작했다. 피그마는 코드 중심 업데이트를 공개했다.

OpenAIBroadcomAI chipsMeta 약 9분 2026. 6. 25.

AI 뉴스Research

로봇이 추가 시연 없이 새 기술을 익힌다 — InSight, 동작을 조각 단위로 조정

시연을 작은 ‘원시 동작’으로 쪼개고 성공 시도를 학습 세트에 계속 추가해 InSight는 긴 작업을 조합한다. AGORA의 아카이브 기반 테스트와 Composio의 1,000+ 도구 개발 키트까지 더해, 행동하고 추론하는 에이전트의 실전성이 한층 강화된다.

roboticsvision-language-actionagentic AIbenchmarks 약 4분 2026. 6. 25.

AI 뉴스Business

OpenAI, GPT‑5.5‑Cyber·Codex Security로 패치 자동화를 앞세운다

오픈AI가 ‘발견’에서 ‘수정’으로 초점을 옮겼다. 보안 모델이 CyberGym 85.6%를 기록했고, 토큰 비용 절감을 내건 AI 메모리 스타트업은 9,800만 달러를 유치했다.

OpenAIcybersecurityGPT-5.5-CyberCodex Security 약 7분 2026. 6. 24.

AI 뉴스Research

TROPT, 텍스트 트리거 최적화를 표준화해 AI 레드팀 테스트 단순화

이 오픈 프레임워크는 30개+ 레시피와 단일 인터페이스를 제공해 모델·목표·최적화를 손쉽게 교체하고 공정 비교와 빠른 탈옥 연구를 돕는다. 장기 과제 에이전트의 ‘조기 고착’을 진단하는 논문과 코드-언어를 교차 활용하는 다중 모달 모델 훈련 소식도 함께 나왔다.

Discrete optimizationLLM agentsJailbreaksReinforcement learning 약 7분 2026. 6. 24.

AI 뉴스Business

딥마인드, A24와 영화 제작 AI 파트너십 체결 — 7,500만 달러 투자 보도

구글이 영화 제작자와 직접 맞닿는 통로를 확보했다는 점에서 의미가 크다. 한편 알파벳은 잇따른 AI 핵심 인재 이탈과 ‘확실한 성과’를 요구하는 고객 압박에 직면해 있다.

GoogleDeepMindA24AI content creation 약 8분 2026. 6. 23.

AI 뉴스Research

연구진, 3조 토큰 AI 학습 말뭉치의 서사 구조 지도화

돌마(Dolma)에서 행위자·배경·사건을 11개 차원으로 계량해 NarraBERT와 NarraDolma를 공개했다. 장문 검색, 메모리 기반 슬라이드 에이전트, 더 빠른 4D 아바타 연구도 나왔다.

pretraining dataRAG3D Gaussian Splattingdeveloper tools 약 6분 2026. 6. 23.

AI 뉴스Business

애플, iOS 27 앱 전반에 실용형 AI 도입

애플의 AI는 이제 시리뿐 아니라 메시지, 사파리, 캘린더, 애플 캐시 곳곳에 스며든다. 무엇이 바뀌고 일상 작업이 어떻게 빨라지는지 핵심만 짚었다.

AppleiOS 27Apple IntelligenceAnthropic 약 8분 2026. 6. 22.

AI 뉴스Research

법률 AI 감사가 오류 방향을 짚고 허위 검출 45% 감소

LegalHalluLens는 환각을 유형별로 나누고 위험 방향 지수(Risk Direction Index, RDI)로 오류가 과장인지 누락인지까지 보여준다. 여기에 맞춘 다중 에이전트 토론으로 40억 파라미터 백본만으로 허위 검출을 45% 줄였다.

hallucination auditinglegal AIagentic RAGFID 약 6분 2026. 6. 22.

AI 뉴스Weekly

Android 17의 Gemini, Adobe CC AI 어시스턴트, 오픈AI 샤지어 영입, Baseten 15억 달러 — 더 빠르고 자동화·거버넌스 강화된 AI

AI가 기본 도구 속으로 더 깊이 들어왔다: Android 17은 Gemini를 기본 탑재했고, Adobe는 Creative Cloud 전반에 어시스턴트를 내놨으며, 오픈AI는 샤지어를 영입했고, Baseten은 추론을 위해 15억 달러 조달을 추진 중이다 — 속도, 신뢰성, 거버넌스의 한 주.

약 17분 2026. 6. 21.

AI 뉴스Business

Elastic, AI SRE 경쟁 속 DeductiveAI 최대 8,500만 달러 인수 합의

TechCrunch에 따르면 Elasticsearch로 유명한 Elastic이 DeductiveAI를 최대 8,500만 달러에 인수하기로 합의했다. 이번 거래는 관측성 제품에 자동 장애 감지·복구 기능을 더하기 위해 기존 기업들이 인수를 활용하는 흐름을 보여준다.

ElasticDeductiveAIObservabilityAIOps 약 4분 2026. 6. 21.

AI 뉴스Research

강화 학습 보상으로 대형 언어 모델이 결정적 근거를 고른다

ContextRL은 거의 동일한 두 맥락 중 어떤 것이 정답을 뒷받침하는지 고르게 학습시켜, 장기 과제 5개에서 +2.2%, 시각적 질의응답 12개 벤치마크에서 +1.8%를 보였다.

Reinforcement LearningMultimodal LLMsGroundingLegal AI 약 5분 2026. 6. 21.

AI 뉴스Business

Baseten, 130억 달러 가치로 15억 달러 조달 추진 — 추론 인프라에 자금 집중

5개월 전 3억 달러 시리즈E에 이어 Baseten이 130억 달러 가치로 15억 달러 조달을 마무리 중이라는 보도다. 한편 기업들은 ‘수년 → 수개월’ 실행 성과를 내고, 마케팅용 에이전트 도구에도 자금이 몰린다.

BasetenAI inferenceVenture capitalY Combinator 약 9분 2026. 6. 20.

AI 뉴스Research

LMCache, 새로운 캐시 계층으로 LLM 메모리 재사용 가속

LMCache가 모델의 주의 메모리를 캐시 계층으로 묶어 배포했고, CUDA 12.9 나이틀리 휠이 공개됐다. 두 논문은 명시적 상태 관리가 정책 준수와 첫 토큰 지연(최대 27배 단축)에 기여함을 보여준다.

LMCacheKV cacheLLM inferenceCUDA 12.9 약 6분 2026. 6. 20.

AI 뉴스Business

오픈AI, IPO 앞두고 구글 제미니 공동 리드 영입

트랜스포머 논문 공동 저자이자 제미니 공동 리드 노엄 샤지어가 오픈AI로 합류합니다. 같은 날 메타는 1.6GW 규모 AI 컴퓨팅을 확보하고, 어도비는 포토샵·프리미어 등에 AI 어시스턴트를 공개했습니다.

OpenAIGoogleTalent mobilityData centers 약 8분 2026. 6. 19.

AI 뉴스Research

사람 평가에서 LLM 개인화가 일반 답변과 차이 없다는 연구

실제 사용자 대화 550건을 바탕으로 한 연구에서 대형 언어 모델의 개인화는 속성 추출·선정·개인화 응답 작성 등 세 단계에서 흔들렸고, 모델 판정과 사람 평가는 엇갈렸다. 두 가지 경량 학습 개입이 초기 단계 정합성은 높였지만, 학습된 보상 모델은 사람 평점과의 상관이 제한적이었다.

LLM personalizationhuman evaluationaudio-visual generationworld models 약 6분 2026. 6. 19.

AI 뉴스Business

Anthropic·DeepMind, G7에서 ‘미국 주도 AI 연합’ 제안

6월 17일 G7 비공개 회의에서 기술 리더들이 AI 테스트·접근 규칙의 공조를 촉구했고, 한편 투자자들은 AI 결과를 검증하는 도구에 2,700만 달러를 베팅했다.

G7AnthropicGoogle DeepMindAI policy 약 6분 2026. 6. 18.

AI 뉴스Research

층 너비를 조절한 언어 모델이 같은 품질에 연산 22% 절감

깊이에 따라 넓고-좁고-넓은 구조를 쓰는 트랜스포머가 같은 크기의 모델을 이기면서 키-값 캐시 메모리를 15% 줄였다. 동시에 멀티에이전트 런타임을 형식 검증하고, 분리형 추론을 게임이론으로 조정하며, 시각 중심 검색 에이전트를 제안한 논문과 CPU 우선의 LocalAI 업데이트가 나왔다.

TransformersSystems for MLDisaggregated inferenceMultimodal agents 약 6분 2026. 6. 18.

AI 뉴스Business

Android 17, Gemini 기능과 멀티태스킹 업그레이드로 공개

구글이 픽셀 우선 기능으로 안드로이드에 AI를 더 깊게 통합했고, Wear OS 7에는 최대 10% 배터리 개선과 자동화가 추가됐다.

GoogleAndroid 17GeminiWear OS 약 6분 2026. 6. 17.

AI 뉴스Research

Ling-2.6·Ring-2.6 공개 — 1조 파라미터 모델 포함

하나는 즉시 응답, 다른 하나는 깊은 추론에 맞춰 설계되었고, 하이브리드 선형 어텐션과 새로운 강화 학습 프레임워크를 결합했다. 오늘의 기타 소식: 23개 과제 비디오 임베딩 벤치마크, 문맥 인지형 강화 학습 기법, 빠른 키-값(KV) 캐시 지우개.

LLMagentic AIreinforcement learningattention mechanisms 약 8분 2026. 6. 17.

AI 뉴스Business

메타, 페이스북에 ‘AI 모드’ 도입 — 공개 게시물로 답변

새 검색 모드는 그룹과 릴스의 공개 게시물을 요약해 답을 제시한다. 동시에 창작 도구와 월 3.99달러 구독은 메타가 사용자·크리에이터 체류를 노린다는 신호다.

MetaFacebookAI ModeSovereign AI 약 9분 2026. 6. 16.

AI 뉴스Research

의료 AI가 어디서 틀리는지 짚는 새 벤치마크

ClinHallu는 다중 모달 대형 언어 모델(MLLM)의 시각 인식, 지식 회상, 추론 통합 단계별 오류를 7,031건으로 라벨링하고, 추론 흔적을 활용한 미세조정이 오류를 줄인다는 근거를 제시한다.

MLLMMedical AI3D geometryDiffusion transformer 약 5분 2026. 6. 16.

AI 뉴스Business

미 정부 지시로 Anthropic 신규 모델 외국인 차단, 인도 AI 논쟁 촉발

Anthropic가 6월 12일 지시에 따라 Fable 5와 Mythos 5의 외국인 접근을 중단했다고 밝혔다. 이 조치는 접근 리스크를 현실화하며 인도의 주권·오픈소스 대안 모색을 자극한다.

AnthropicIndiaExport controlsMeta 약 8분 2026. 6. 15.

AI 뉴스Research

프롬프트 보정으로 대형 언어 모델 판정 오류의 34.8%만 교정

새 연구는 확신이 높은 오류일수록 수정이 어렵고, 텍스트 암기보다 과제 정의 일치가 정확도를 더 잘 설명한다는 점(부분 상관계수 +0.41)을 보여준다.

LLM evaluationknowledge graphsdata attributionagents 약 7분 2026. 6. 15.

AI 뉴스Weekly

애플, 앱·Xcode에 에이전트 내장… 오픈AI 비공개 S‑1, 350억 달러 컴퓨트 플랫폼, 프로메테우스 120억 달러

애플이 일상 앱과 Xcode에 에이전트를 내장했고, 오픈AI가 IPO의 문을 열었으며, 350억 달러 규모 컴퓨트 플랫폼이 윤곽을 드러냈다 — 모두가 에이전트 퍼스트 업무와 컴퓨트 연동형 계약을 향하고 있음을 시사한다.

약 15분 2026. 6. 14.

AI 뉴스Business

미국 주 법무장관 연합, OpenAI 조사 착수 — 뉴욕주 소환장 발부

주정부 주도의 조사는 광고, 데이터 처리, 이용자 영향까지 겨냥한다. 한편 Sensor Tower에 따르면 ChatGPT 앱은 월간 이용자 10억 명을 돌파했다.

OpenAIRegulationAttorneys GeneralChatGPT 약 7분 2026. 6. 14.

AI 뉴스Research

유추 중심 검색으로 추론 향상 — AIME 2025에서 최대 7.1포인트 상승

새로운 사후 훈련 레시피가 유추 인식 검색과 강화 미세조정을 결합한다. HyperTool과 EurekAgent는 도구 호출을 묶고 환경을 설계해 에이전트 안정성을 높이고 11달러 미만 비용으로 새로운 결과를 내는 방식을 보여준다.

ReasoningRetrievalReinforcement Fine-TuningAgent Systems 약 6분 2026. 6. 14.

AI 뉴스Business

베이조스가 지원한 Prometheus, '범용 엔지니어' 위해 120억 달러 조달

물리 세계용 AI 스타트업 Prometheus가 410억 달러 가치에 올랐습니다. 제조·설계 자동화를 위한 컴퓨트에 자금을 투입하는 가운데, Mistral의 30억 유로 라운드 협의는 유럽의 ‘주권형’ AI 베팅을 시사합니다.

PrometheusJeff Bezosphysical AIfundraising 약 6분 2026. 6. 13.

AI 뉴스Research

AI 에이전트가 더 저렴하고 안전해졌다: WebChallenger 아키텍처, 안전 ‘워밍업’ 효과, 엔비디아 추론 업데이트

새 웹 에이전트 프레임워크가 공개 가중치로 유사 성능에 접근했고, 연구는 워밍업 작업 뒤 안전성이 9~52% 상승함을 보였다. 엔비디아는 TensorRT‑LLM 사전 릴리스를 내놓고 모델 지원 추가와 MoE 백엔드 이슈를 공지했다.

web agentsLLM safetytool retrievalcoding agents 약 8분 2026. 6. 13.

AI 뉴스Business

Anthropic·OpenAI, IPO를 서두르는 사이 가격 압박은 사용자에게 번진다

두 경쟁사는 일주일 간격으로 기업공개를 추진했고, Anthropic은 최고 모델의 가격을 올리고 사용을 제한했으며 OpenAI는 고객 유지를 위해 토큰 단가 인하를 검토 중이다.

OpenAIAnthropicIPOAI pricing 약 10분 2026. 6. 12.

AI 뉴스Research

AI 공급망, 감사 착수: 1,060개 모델 의존성 추적

ModSleuth라는 에이전트가 데이터 필터부터 평가까지 모델이 의존한 대상을 되짚어 다중 단계 라이선스 의무와 학습·배포 불일치를 드러낸다. 함께 발표된 논문은 긴 문맥 추론 가속(SparDA), 되살릴 수 있는 시각 토큰 라우팅(Reroute), 예측시장 1.2만 건 데이터로 평가한 사회 세계 모델을 다뤘다.

LLM auditingdependency graphssparse attentionvision-language models 약 7분 2026. 6. 12.

AI 뉴스Business

AI 인프라 자금, 2026년 채권 5,700억 달러로 이동

모건스탠리는 AI 데이터센터 투자를 채권이 떠받친다고 본다. OpenAI의 비공개 IPO 신청과 Anthropic의 정책 제안은 가격과 안전 규범에 대한 압력을 키운다.

Morgan StanleyAI debtOpenAI IPOAnthropic policy 약 7분 2026. 6. 11.

AI 뉴스Research

‘안전해 보이는’ AI 모델 내부의 숨은 위험 드러난다

연구진은 개입 기반 테스트와 잠재 취약성 점수를 제안해 출력 중심 안전성과 내부 견고성의 간극을 보여준다.

LLM safetylatent vulnerabilitymulti-agent systemsdistributed training 약 7분 2026. 6. 11.

AI 뉴스Business

애플, Xcode 27에 에이전틱 코딩 도입·AI 모델 접점 통합

새 프레임워크로 애플·서드파티 모델을 활용하고, 스몰 비즈니스 대상 개발자는 프라이빗 클라우드 컴퓨트에서 클라우드 API 요금이 없다. 다만 최상위 온디바이스 기능은 12GB 하드웨어가 필요하다.

AppleXcode 27Siri AIBroadcom 약 8분 2026. 6. 10.

AI 뉴스Research

vLLM 업데이트, AMD Zen CPU 추론 가속·Mellum v2 지원

패치 v0.22.1이 AMD Zen CPU에서 양자화 추론 속도를 높이고 새 모델 호환을 추가했다. 동시에 두 편의 논문은 전문가 라우팅과 저랭크 모델을 경쟁력 있게 압축하는 실용적 경로를 제시한다.

vLLMLLM inferenceModel compressionMixture-of-Experts 약 4분 2026. 6. 10.

AI 뉴스Business

오픈AI, 비공개 S-1 제출… 상장 시점은 미정

챗GPT 제작사가 상장을 향한 첫 공식 절차에 들어갔지만 시점은 정하지 않았다. 한편 애플은 핵심 앱에 ‘Apple Intelligence’를 확대하고 구글은 NotebookLM을 연구 용도로 강화했다.

OpenAIIPOApple IntelligenceWWDC 약 7분 2026. 6. 9.

AI 뉴스Research

이중언어 인지 벤치마크, 시각-언어 모델의 약점을 드러내다

BloomBench는 기억부터 창출까지를 기준으로 평가해 이해는 강하지만 사실 회상과 창의적 종합은 약하며 영어–아랍어 성능 격차가 있음을 드러낸다. 함께 본 연구: 계층 메모리로 장시간 비디오 추론, 10년 사회 시뮬레이션을 통한 모델 학습, 공간 추론을 높이는 토큰.

Vision-Language ModelsBenchmarkingLong-video understandingAgentic retrieval 약 7분 2026. 6. 9.

AI 뉴스Business

AI 대규모 주식 발행 가능성에 증시 부담 커진다

블룸버그는 AI 관련 대규모 주식 발행 계획이 수요를 초과할 수 있다고 보도했다. 메타의 대규모 조달 검토 보도 뒤 나스닥 100은 4.8% 하락, 메타는 5.5% 하락했다. 동시에 OpenAI는 상장 준비 속에 수익성 강화를 노린 ChatGPT ‘슈퍼앱’을 예고했다.

AI capital marketsOpenAIChatGPTenterprise AI 약 8분 2026. 6. 8.

AI 뉴스Research

사람형 로봇, 전신 작업을 하나로 조정하는 단일 컨트롤러 등장

HANDOFF는 세 개의 전문 컨트롤러를 하나로 묶고 Unitree G1에서 자연어 기반 작업을 시연한다. 함께 공개된 논문은 로봇 속도 제어와 재질 인식 이미지 선택을 더한다.

humanoid roboticsmixture-of-expertsvision-language modelsrobot control 약 5분 2026. 6. 8.

AI 뉴스Weekly

에이전트의 실전 배치: MS 자체 추론모델·스카우트, 메타 비즈니스 에이전트, 구글 Gemma 4 12B 로컬, 딥시크 74억 달러

에이전트가 채팅에서 실행으로 이동했다. MS가 자체 모델+에이전트 스택을 내놓고, 메타는 WhatsApp/Instagram에 비즈니스 봇과 페이스북에 크리에이터 도우미를 심었으며, 구글은 Gemma 4 12B를 로컬 구동 크기로 맞췄다 — 거대 자금은 여전히 AI로 흘러들고 있다.

약 18분 2026. 6. 7.

AI 뉴스Business

마이크로소프트, 오픈AI 계약 변경으로 ‘초지능’ 직접 개발 길 열렸다

빌드 2026에서 마이크로소프트 AI 수장이 계약 변경으로 자사 ‘초지능’ 모델 개발이 가능해졌다고 밝혔다. 동시에 7개 MAI 모델과 기업용 에이전트 튜닝 기능을 공개했다.

MicrosoftOpenAIEnterprise AIAI agents 약 7분 2026. 6. 7.

AI 뉴스Research

유럽 자율주행 데이터셋, 신호등 등 교통 요소를 3D로 매핑 — 4D 레이더·400m 라이다 포함

KITScenes Multimodal은 고해상도 카메라, 장거리 라이다, 4D 레이더, 완성도 높은 고정밀 지도를 결합하고, 지도 구축부터 종단형 주행까지 4개 벤치마크를 제시한다. 로봇 조작의 가능성 단서와 CAD 기하 이해를 강화한 두 편의 논문도 함께 나왔다.

autonomous drivingmultimodal datasetvision-language-actionrobotics 약 5분 2026. 6. 7.

AI 뉴스Business

로보틱스 스타트업 Generalist AI, 4억 달러 조달…기업가치 20억 달러

Radical Ventures가 주도하고 Nvidia와 Bezos Expeditions가 참여해 로보틱스·자동화에 대한 자금이 몰리고 있다. 한편 Meta의 모델 공개 지연과 Anthropic의 비공개 IPO 신청은 당장의 수익성과 기초 체력에 시선을 모으게 한다.

NvidiaRoboticsAnthropic IPOMeta AI 약 7분 2026. 6. 6.

AI 뉴스Research

코딩 에이전트, SABER 벤치마크에서 54% 이상 안전 위반

SABER는 단일 답변이 아니라 실제 프로젝트 작업공간의 최종 상태로 코딩 AI를 평가한다. 최고 성능 모델조차 유해 안전 위반이 54% 이상으로 측정돼 실무 운영 안전의 공백이 드러났다.

LLM agentssafety benchmarksmultimodal LLMscode models 약 6분 2026. 6. 6.

AI 뉴스Business

메타, 세 나라에서 페이스북 크리에이터용 AI 어시스턴트 공개

페이스북에 대화형 크리에이터 어시스턴트가 도입돼 맞춤형 업로드 타이밍과 콘텐츠 아이디어를 제안하고, AI 번역 릴스 지원 언어도 확대됐다. 팀 입장에선 기획 속도가 빨라지고 외부 도구 의존이 줄어들 수 있다.

MetaFacebookCreatorsOn-device AI 약 8분 2026. 6. 5.

AI 뉴스Research

에이전트가 추론 과정을 조절해 토큰 지출을 줄인다

새 컨트롤러가 AI의 추론을 지켜보며 예산 안에서 생각하도록 지시한다. 별도 연구는 예산 초과 사고 63건과 러스트 기반 안전장치를 정리했고, AI 안경 데이터셋은 장기 기억을 시험한다.

Chain-of-ThoughtLLM agentsInference-time controlRust 약 7분 2026. 6. 5.

AI 뉴스Business

메타, 자사 앱 전반에 AI 비즈니스 에이전트 출시로 엔터프라이즈 본격 공략

왓츠앱·메신저·인스타그램에서 약속 예약, 판매 마감, 상담 이관까지 처리하는 AI 에이전트를 내놓고, Shopify·Zendesk 등과 연결되는 플랫폼도 공개했다. 초기에는 무료 제공 후 유료 구독을 도입한다.

MetaAI agentsEnterprise AIGoogle Gemma 약 11분 2026. 6. 4.

AI 뉴스Research

행동 학습이 ‘고정 클립’에서 ‘사건 단위’로 이동 — WALL-WM

의미 있는 ‘사건’에 맞춰 학습을 재구성하고 가변 길이 제어를 지원한 WALL‑WM이 실세계 일반화에서 최고 성능을 보고했다. 동시에 20억 프레임 규모 Humanoid‑GPT, 실시간 통합 YOLO26, 긴 추론을 위한 2비트 KV 캐시 양자화가 발표됐다.

World Action ModelVision-Language-ActionYOLO26KV cache quantization 약 5분 2026. 6. 4.

AI 뉴스Business

마이크로소프트, 첫 자사 추론형 AI ‘MAI‑Thinking‑1’ 공개

중형급 모델과 함께 이미지·음성·전사·코딩 모델도 나왔다. 오픈AI 의존과 비용을 낮추려는 행보가 뚜렷하다.

MicrosoftMAI-Thinking-1OpenAI CodexEnterprise AI 약 12분 2026. 6. 3.

AI 뉴스Research

변하는 부분만 보내는 방식으로 비디오 AI 속도 상승

AdaCodec가 중복 프레임을 압축해 토큰 예산을 줄이고 첫 토큰 출력 시간을 9.26초에서 1.62초로 단축했다. 로봇 어포던스와 조밀 모델을 전문가 혼합으로 바꾸는 기법 논문도 함께 나왔다.

video MLLMpredictive codingrobot affordancemixture of experts 약 5분 2026. 6. 3.

AI 뉴스Business

Anthropic, 미국 IPO 비공개 제출…OpenAI보다 먼저 움직였다

Anthropic가 비공개로 IPO를 제출하며 AI 상장 경쟁에서 먼저 나섰다. 동시에 엔비디아의 Cosmos 3와 AI 일기예보 모델 소식은 자본시장 이슈가 현실 시스템 적용으로 이어지고 있음을 보여준다.

AnthropicIPONvidia Cosmos 3Embodied AI 약 9분 2026. 6. 2.

AI 뉴스Research

새 3D 기법이 포인트 맵의 국지 표면 기하를 끌어올렸다

SurGe는 국지 표면 지표와 두 가지 학습 기법으로 포인트 맵의 미세 기하 오류를 줄이면서 글로벌 정확도를 유지한다. 에이전트 ‘하니스’ 설계와 1스텝 비디오 생성 연구가 함께 주목받으며, 단순한 모델 대형화가 아닌 정밀도와 지연시간 개선의 흐름이 드러난다.

3D reconstructionvideo generationLLM agentsagentic systems 약 7분 2026. 6. 2.

AI 뉴스Business

메모에 따르면 메타, AI 펜던트 시험과 AI 안경 확대 추진

The Information이 본 메모를 인용한 TechCrunch 보도에 따르면 메타가 목걸이형 AI 펜던트를 개발하고 ‘Wearables for Work’ 구독을 준비 중이다. 올해 1분기 40억 달러 적자를 낸 Reality Labs의 반전을 AI 웨어러블에서 찾겠다는 베팅이다.

MetaWearablesSemiconductorsVenture Capital 약 8분 2026. 6. 1.

AI 뉴스Research

질의별 AI 적응이 빨라졌다: HullFT의 볼록 기법

HullFT는 소수의 학습 예제로 프롬프트를 재구성하고 반복 예시에서 그라디언트를 재사용해 비트‑퍼‑바이트를 낮추면서 실행 시간을 줄인다. 함께 공개된 두 논문은 기하·볼록 기법으로 로봇의 움직임 인식과 억양에 강한 음성 언어 판별을 끌어올린다.

LLMtest-time finetuningFrank–Wolfe optimizationrobotics perception 약 5분 2026. 6. 1.

AI 뉴스Weekly

AI가 더 싸지고 투명해졌다: Anthropic 650억 달러 조달, YouTube 자동 라벨, Google 검색 대화형 전환

Anthropic가 비용·속도 제어를 더했고, YouTube는 AI 라벨을 눈에 띄게 만들었으며, Google은 검색을 대화형 도우미로 바꿨다 — 이미 쓰는 도구 안에서 AI가 더 싸고, 더 투명하며, 더 통제 가능해진 한 주.

약 16분 2026. 5. 31.

AI 뉴스Business

어도비 Firefly AI 어시스턴트, 여러 단계 편집은 해주지만 품질은 들쭉날쭉

The Verge의 체험에 따르면 어도비의 대화형 어시스턴트는 편집 과정을 또렷이 설명하고 반복 작업을 빠르게 처리하지만, 결과물은 초보 수준처럼 보여 사람 검수가 필요하다. 동시에 AI 최적화 PC 스토리지와 AI의 수학 난제 해결은 대화형을 넘어선 확장 흐름을 보여준다.

AdobeFirefly AI AssistantAI PCSilicon Motion 약 6분 2026. 5. 31.

AI 뉴스Research

함수 호출로 프롬프트를 스스로 고치는 대형 언어 모델, 추론 성능 최대 12.9포인트 향상

전체 데이터셋을 진단해 프롬프트를 자동 수정하는 워크플로가 등장했다. 더불어 메모리 기반 추론과 동영상 생성 메모리 절감 기법도 주목받는다.

prompt optimizationlatent reasoningvideo diffusionKV cache 약 7분 2026. 5. 31.

AI 뉴스Business

마이크로소프트, 코파일럿 강화를 위한 자체 코딩 AI 공개

로이터에 따르면 마이크로소프트가 빌드에서 자체 코딩 모델 등 특화 AI를 준비 중이며, 아사나는 StackAI를 인수하고 Groq는 추론 사업 확대를 위해 6.5억 달러 조달을 추진한다.

MicrosoftGitHub CopilotOpenAIGroq 약 7분 2026. 5. 30.

AI 뉴스Research

비전-언어 모델이 '위'와 '거리'를 혼동 — 새 벤치마크가 편향을 드러낸다

연구진은 여러 모델 계열에서 반복되는 사진 원근 편향을 확인하고, 이미지 위치 단서와 진짜 3차원(3D) 추론을 분리하는 SpatialTunnel을 공개했다.

Vision-language modelsKV cache evictionWeb agentsGenerative datasets 약 6분 2026. 5. 30.

AI 뉴스Business

Anthropic, 650억 달러 조달로 9,650억 달러 평가… Opus 4.8 공개

이번 조달로 Anthropic의 기업가치가 OpenAI를 넘어섰고, 새 모델은 ‘노력 수준’ 제어와 더 빠르고 저렴한 응답을 추가했다. 한편 OpenAI는 선거 대비 안전장치를 공개했다.

AnthropicOpenAIClaude Opus 4.8AI valuation 약 8분 2026. 5. 29.

AI 뉴스Research

Anthropic, Claude Opus 4.8 공개 — 같은 가격에 더 빠른 ‘fast mode’와 동적 워크플로 추가

이번 업그레이드는 실무 통제에 초점을 맞췄다. 더 빠르고 저렴해진 fast mode, 비용·품질을 조절하는 노력도구, 대규모 코드 작업을 위한 병렬 서브에이전트가 추가됐고, 테스트에서는 ‘정직성’ 개선이 보고됐다.

AnthropicClaude Opus 4.8Agentic AIScalable oversight 약 8분 2026. 5. 29.

AI 뉴스Business

코그니션, 250억 달러 사전 평가로 10억 달러 조달 — Devin 확장

Devin 개발사 코그니션은 빠른 기업 채택과 4.92억 달러 런레이트를 내세우며 투자를 유치했고, 유튜브는 사실적인 AI 영상을 자동 라벨링해 투명성을 높인다.

CognitionDevinYouTubeAI labeling 약 6분 2026. 5. 28.

AI 뉴스Research

Gemini Embedding 2, 영상·음성·이미지·텍스트 검색을 하나로

하나의 ‘네이티브 멀티모달’ 임베딩이 주요 이미지·영상·텍스트 벤치마크에서 강한 검색 성능을 보여, 검색·추천·검색 증강 생성 파이프라인 단순화를 가리킨다.

multimodal embeddingsretrievalGPU kernelsRLHF 약 6분 2026. 5. 28.

AI 뉴스Business

알트만, AI로 ‘일자리 종말’ 가능성 낮다… OpenRouter 13억 달러 평가

OpenAI CEO가 초기의 일자리 상실 우려를 수정하며 ‘인간적 상호작용’의 중요성을 강조했다. 한편 OpenRouter는 1억 1,300만 달러를 유치했고, 모멘텀 주식은 AI 테마에 올라탔다.

OpenAISam AltmanOpenRouterCapitalG 약 8분 2026. 5. 27.

AI 뉴스Research

비디오 생성, 동작을 먼저 계획해 더 자연스러운 장면 구현

MotiMotion은 동작 제어를 ‘추론 후 생성’으로 재구성하고 새 벤치마크를 제시한다. 보상부터 터미널 피드백까지 신뢰성을 겨냥한 세 편의 에이전트 학습 논문과, GPU 없이 구동되는 MIT 라이선스 로컬 엔진(LocalAI)도 나왔다.

video generationreinforcement learningagentsreward hacking 약 7분 2026. 5. 27.

AI 뉴스Business

새 연구들, AI 스케일링 초점을 추론 컴퓨트와 신호 품질로 이동

어트랙터 기반 추론, 섀넌 스케일링 법칙, 단계적 비전 학습을 제안한 3편의 논문이 나왔습니다. 추론 컴퓨트 조절과 입력 노이즈 감소로 정확도를 높일 수 있다는 메시지입니다.

Scaling lawsTest-time computeVision-language modelsInference efficiency 약 6분 2026. 5. 26.

AI 뉴스Research

추론·지각·3D 에이전트: 모델이 ‘생각’하는 방식을 다시 짚은 4편

추론을 ‘학습된 수렴점’으로 보고, 모델 학습을 잡음 채널의 용량 문제로 해석하며, 비전-언어 모델에서 ‘보기’와 ‘생각하기’를 분리해 성과를 끌어올리고, 언어 지시로 3D 장면을 촬영하는 에이전트 과제를 실행 가능하게 만든 연구들이 나왔다.

scaling lawsreasoningvision-language models3D agents 약 7분 2026. 5. 26.

AI 뉴스Business

구글, 에이전트형 검색과 10초 AI 동영상에 무게

구글이 대화형 에이전트를 중심으로 검색을 재설계하고 AI 모드의 엔진으로 Gemini 3.5 Flash를 내세웠습니다. 동시에 10초짜리 AI 동영상 생성이 앱에 적용되며, 가격·보안 이슈가 기업의 AI 도입 방식을 바꾸고 있습니다.

GoogleGeminiAI agentsSearch 약 8분 2026. 5. 25.

AI 뉴스Research

ConvexTok, 1% 이내 ‘거의 최적’ 토크나이저 인증

볼록 최적화로 설계한 새 토크나이저가 탐욕적 규칙을 대체해 바이트당 비트 효율을 높이고, 어휘가 최적에 얼마나 가까운지 인증까지 제공한다. 또한 소비자 노트북에서 라이브 음악 생성, 과학 진보 예측 한계, 프롬프트 가능한 동물 3D 복원, 항상 최신 컨텍스트를 유지하는 증분 인덱싱 엔진 소식.

TokenizationConvex optimizationDiffusion modelsMusic generation 약 6분 2026. 5. 25.

AI 뉴스Weekly

에이전트의 실전 배치: 구글 Gemini 내장, 엔비디아 Vera 출하, ChatGPT 재정 미리보기, 블랙스톤-구글 50억 달러 TPU 동맹

에이전트가 채팅에서 행동으로 도약: 구글은 Gemini를 내장형 도우미로 만들고, 엔비디아는 에이전트 오케스트레이션용 CPU를 출하했으며, 오픈AI는 ChatGPT에 재정 보기 기능을 열고, 50억 달러 TPU 합작 벤처도 윤곽을 드러냈다 — 일상 도구 속 어시스턴트가 더 빠르고 저렴해진다는 신호다.

약 17분 2026. 5. 24.

AI 뉴스Weekly

AI, 채팅을 넘어 앱 속 보안·실행으로

AI가 채팅창을 떠났다. 오픈AI는 40억 달러 규모 배포 유닛과 보안 프로그램을 세웠고, 마이크로소프트의 에이전트 시스템은 윈도우즈 취약점 16건을 찾아냈으며, 메타는 암호화된 무로그 채팅을 추가했고 Claude는 SMB 도구로 들어갔다 — 지금 바로 시도해볼 수 있는 구체적 액션도 하나 제시한다.

약 20분 2026. 5. 17.

AI 뉴스Weekly

오픈AI 1,220억 달러 조달·AWS 2GW 트레이니엄 협력, 엔비디아 Vera CPU 공개… 엔터프라이즈 에이전트가 ‘더 빠르고 더 통제된’ 모습으로 일로 들어온 한 주

에이전트 플랫폼과 가드레일이 출하되고, ChatGPT는 기본으로 더 빨라졌으며, 엔비디아는 새 CPU로 에이전트 병목을 겨냥했고, 오픈AI는 대규모 자금과 AWS 용량을 확보했다 — 파일럿에서 프로덕션으로 에이전트를 옮기는 데 방점이 찍힌 한 주.

약 18분 2026. 5. 10.

AI 뉴스Weekly

에이전트 실전화 가속: GPT‑5.5 배포, MS–OpenAI 멀티클라우드, 펜타곤 Gemini 확대, 엔비디아 Vera CPU 공개

에이전틱 AI가 실전에 들어섰다: GPT‑5.5는 다단계 업무를 겨냥하고, 오픈AI는 멀티클라우드·정부 채널을 열었으며, 펜타곤은 Gemini를 수백만 명으로 확대하고, 엔비디아는 에이전트 루프용 CPU를 공개했다. 이번 주 달라진 점과 직접 해볼 실험 한 가지를 짚었다.

약 19분 2026. 5. 3.

AI 뉴스Weekly

GPT‑5.5 공개, DeepSeek 100만 컨텍스트 예고, 구글의 앤스로픽 최대 400억 달러 약정, 지메일 AI 오버뷰 탑재

에이전트가 활약한 한 주: GPT‑5.5가 다단계 업무에 도전하고, DeepSeek가 장문 컨텍스트 비용을 낮췄으며, 구글은 앤스로픽을 위해 수십억 달러 규모의 컴퓨트를 확보했다 — 지메일과 어도비는 보조원을 일상 워크플로에 들였다.

약 18분 2026. 4. 26.

AI 뉴스Weekly

에이전트가 ‘일’을 시작한 주: OpenAI–AWS 500억 달러 협력, Meta 1GW+ 칩, Claude 4.7·GPT‑5.4·Chrome 업데이트

AWS가 OpenAI의 핵심 유통사가 되고, Meta는 1GW+ 커스텀 AI 칩을 예약했으며, Anthropic은 난도 높은 코딩을 겨냥해 Claude를 업그레이드했고, Chrome의 AI 모드는 분할 화면으로 진화했다. 결론: 에이전트는 단순한 대화를 넘어 실제 일을 점점 더 해낸다.

약 19분 2026. 4. 19.

AI 뉴스Weekly

앱 안으로 더 깊이, 접근은 더 엄격하게: 제품 내장형·제한형 AI의 부상

분주했던 한 주: Meta의 새 모델은 앱을 Top 5로 끌어올렸고, Anthropic은 강력한 버그 탐지 AI의 접근을 제한했으며, Microsoft는 사내 모델 3종을 출하하고 Alibaba는 최상위 동영상 생성기를 자처 — 더 깊게 내장되고, 더 엄격히 통제되며, 더 유용해진 AI의 흐름을 보여준다.

약 14분 2026. 4. 12.

AI 뉴스Weekly

운영비는 낮추고 셀프호스팅은 쉬워진 한 주: OpenAI 1,220억 달러 조달·AWS와 Trainium 제휴, 구글 Gemma 4 오픈, MS 미디어 특화 모델 출시, Shield AI 20억 달러+인수

OpenAI의 메가 라운드, 구글의 오픈 Gemma 4, 마이크로소프트의 합리적 가격의 미디어 모델, 그리고 AWS와의 파트너십은 운영비가 더 낮고 셀프호스팅이 쉬우며 일상 업무에 더 가까운 AI로의 흐름을 보여준다.

약 13분 2026. 4. 5.

AI 뉴스Weekly

오픈AI 100억 달러 조달, 백악관 AI 프레임워크, 구글 KV 캐시 6배 압축, Anthropic ‘Mythos’ 유출

자금, 정책, 엔지니어링이 동시에 움직인 한 주: 오픈AI의 100억 달러 조달과 미국 AI 프레임워크가 무대를 깔고, 구글의 KV 캐시 압축은 더 저렴한 추론을 예고했으며, Anthropic 유출은 사이버보안의 긴박함을 부각—게다가 실시간 온디바이스 TTS까지 직접 시도할 수 있다.

약 16분 2026. 3. 29.