Nvidia, 에이전트형 AI용 1,200억 파라미터 Nemotron 3 Super 공개
이 오픈 웨이트 모델은 최대 5배 처리량과 100만 토큰 컨텍스트로 다중 에이전트 워크플로의 맥락 유지를 돕는다. 동시에 Nvidia는 통합 멀티모달 모델을 확장하고, 중국 Moonshot AI는 20억 달러를 유치했다.
한 줄 요약
Nvidia가 긴 컨텍스트와 멀티모달을 갖춘 에이전트형 AI 오픈 모델을 밀어붙이고, 중국 Moonshot AI는 오픈웨이트 수요 속에 20억 달러를 유치했다.
Big Tech
Nvidia Nemotron 3 Super: 에이전트형 AI용 1,200억 파라미터 오픈 모델
Nvidia의 Nemotron 3 Super는 1,200억 파라미터(추론 시 활성 120억) 오픈 웨이트 AI 모델로, 복잡한 다중 에이전트 애플리케이션을 더 빠르고 정확하게 구동하도록 설계됐다. 이 모델은 계획, 도구 호출, 실행을 수행하는 실사용 에이전트를 겨냥하며, 이전 Nemotron Super 대비 최대 5배 높은 처리량을 제시한다. 1
다중 에이전트 워크플로에서 대화형 기록과 도구 출력을 반복 전송해 토큰이 최대 15배로 불어나는 ‘컨텍스트 폭증’과, 매 단계 고도 추론이 요구되는 ‘사고 세금’을 줄이기 위해 100만 토큰 컨텍스트를 제공한다. Nvidia는 효율성과 공개성 부문에서 Artificial Analysis 1위를, AI‑Q 연구 에이전트의 DeepResearch Bench 및 DeepResearch Bench II 1위를 함께 제시한다. 1
구조적으로는 Mamba와 트랜스포머를 결합한 하이브리드 전문가 혼합(MoE)이며, 추론당 120억 파라미터만 활성화한다. 잠재 MoE와 다중 토큰 예측을 적용해 생성을 가속하고, Blackwell GPU에서 NVFP4 정밀도로 구동 시 Hopper의 FP8 대비 추론이 최대 4배 빨라지면서 정확도 손실이 없다고 한다. 또한 이전 Nemotron Super 대비 최대 2배 정확도를 제시한다. 1
이 모델은 관대한 라이선스의 오픈 웨이트로 공개되며, 10조 토큰 이상 사전·사후 학습 데이터와 15개 강화학습 환경을 포함한 방법론도 함께 제공된다. 초기 도입사는 Perplexity, CodeRabbit, Factory, Greptile 등이고, Amdocs, Palantir, Cadence, Dassault Systèmes, Siemens 같은 엔터프라이즈 플랫폼도 자동화에 활용 중이다. build.nvidia.com, Perplexity, OpenRouter, Hugging Face에서 이용 가능하며, NVIDIA NIM 마이크로서비스로 온프렘부터 클라우드까지 배포할 수 있다. 1
Industry & Biz
Moonshot AI: 오픈웨이트 수요 속 20억 달러 조달, 기업가치 200억 달러
오픈 웨이트 대형 언어 모델(LLM) Kimi 시리즈로 알려진 베이징의 Moonshot AI가 약 20억 달러를 유치해 기업가치 200억 달러에 도달했다. 이번 라운드는 Meituan의 Long‑Z Investment가 주도했고, Tsinghua Capital, China Mobile, CPE Yuanfeng이 참여했다고 TechCrunch는 Huafeng Capital의 게시글을 인용해 전했다. 2
중국 오픈 웨이트 모델에 대한 투자자 관심이 커지는 가운데, 일부 사용자는 약간의 성능 저하를 감수하고도 저렴한 추론 비용을 선호한다. Moonshot의 Kimi K2.5는 2026년 초 코딩 벤치마크에서 강한 성과를 보였고, 최신 Kimi K2.6은 OpenRouter에서 사용량 기준 2위를 기록하고 있다. 2
사업 측면에서는 유료 구독과 API 사용 확대에 힘입어 4월 연환산 매출이 2억 달러를 넘겼다. Huafeng Capital에 따르면 지난 6개월간 39억 달러를 추가로 조달했으며, 2025년 말 43억 달러 평가에서 2026년 초 7억 달러 조달 후 100억 달러 평가로 상승했다. 2
New Tools
Nvidia Nemotron 3 Nano Omni: 비전·오디오·언어 통합 멀티모달 에이전트용 모델
Nemotron 3 Nano Omni는 비전, 오디오, 언어를 하나로 통합한 오픈 멀티모달 모델로, 에이전트가 영상, 이미지, 오디오, 텍스트 전반을 한 번에 추론하도록 돕는다. 문서 지능과 오디오‑비디오 이해 리더보드에서 상위 성능을 보이며, 생산 환경 멀티모달 에이전트의 속도와 정확도를 동시에 겨냥한다. 3
비전·오디오 인코더를 30B‑A3B 하이브리드 MoE 구조 안에 통합해 모델 간 핸드오프를 줄이고, 동급 상호작용 수준에서 다른 오픈 옴니 모델 대비 처리량을 9배까지 높인다고 한다. H Company는 1920×1080 풀HD 화면 녹화를 빠르게 해석하는 컴퓨터 사용 에이전트 사례를 제시했다. 3
이 모델은 오픈 웨이트·데이터셋·학습 기법과 함께 제공되며, Hugging Face, OpenRouter, build.nvidia.com에서 NVIDIA NIM 마이크로서비스로 이용할 수 있다. Nvidia Jetson과 DGX 같은 로컬 장비부터 데이터센터와 주요 클라우드까지 일관 배포가 가능하며, Aible, ASI, Eka Care, Foxconn, Palantir 등 기업이 도입 또는 평가 중이다. 3
나에게 주는 의미
연구, 운영, 고객지원용 에이전트를 시범 구축 중이라면, Nemotron 3 Super의 100만 토큰 컨텍스트와 MoE 효율성은 재프롬프트와 오케스트레이션 수고를 줄이고 코드베이스나 수백 쪽 보고서를 한 번에 다루는 긴 작업의 안정성을 높인다. 이는 사이클 타임 단축과 ‘목표 이탈’ 같은 실패 감소로 이어질 수 있다. 1
영상·화면 녹화·혼합 문서가 섞인 업무에는 비전·오디오 핸드오프를 없애는 통합 멀티모달 스택(Nemotron 3 Nano Omni)이 지연을 줄이고 정확도를 높이는 효과가 있다. 컴퓨터 사용 에이전트, 규정 준수 문서 분석, 컨택센터 품질 점검 같은 과제에서 실익이 크다. 3
오픈 웨이트와 NIM 패키징은 로컬 파일럿부터 규제가 있는 온프렘 환경까지 배포 선택지를 넓혀 준다. 비개발 조직도 기존 데이터 거버넌스 규칙 안에서 빠르게 PoC를 수행한 뒤, 가치가 확인되면 단계적으로 확장하기 쉽다. 1
Moonshot AI의 20억 달러 조달은 유료 API와 더불어 오픈 웨이트 선택지에 대한 기업 관심이 커지고 있음을 시사한다. 팀 차원에서는 정확도·지연·총비용을 기준으로 오픈 모델과 프리미엄 모델을 과제별로 조합하는 ‘모델 포트폴리오’ 전략을 검토할 만하다. 2
지금 할 일
- Nemotron 3 Super로 장문 과제 시험: OpenRouter나 Hugging Face에서 50–100쪽 보고서를 넣고 요약과 후속 질의까지 한 세션에서 실행해 보라.
- Nemotron 3 Nano Omni로 멀티모달 파일럿: 차트가 포함된 PDF와 짧은 화면 녹화를 함께 올려, 두 정보를 모두 요구하는 질문에 얼마나 빠르게 답하는지 확인하라.
- 긴 컨텍스트 비용 기준선 잡기: 동일한 다단계 과제를 기존 방식과 단일 장문 컨텍스트 방식으로 각각 실행하고 토큰 수와 경과 시간을 기록해 비교하라.
- 거버넌스 맞춘 파일럿 설계: Nemotron 3 Super 라이선스와 NIM 배포 옵션을 검토하고, IT와 30분 미팅을 잡아 2주 온프렘·클라우드 파일럿 방안을 정하라.
댓글 (0)