오픈AI 1,220억 달러 조달로 AI 판 재편: 구글 Gemma 오픈, MS는 저가 멀티모달 모델로 압박
승자는 자본과 배포에서 갈린다: 오픈AI는 칩·데이터센터 선점, 구글은 라이선스 장벽 철거, MS는 가격으로 압박, 엔비디아는 100만 토큰 에이전트를 무장시켰다.
한 줄 요약
OpenAI가 1,220억 달러를 유치해 기업가치 8,520억 달러에 올랐고, 구글은 Gemma 4를 Apache 2.0으로 공개했으며, 마이크로소프트는 새 멀티모달 모델을 내놨습니다. NVIDIA는 에이전트형 AI에 초점을 맞췄고, 오라클은 AI 투자 재원을 위해 대규모 감원을 단행했습니다.
Big Tech
OpenAI, 1,220억 달러 조달로 기업가치 8,520억 달러
ChatGPT와 엔터프라이즈 API로 성장한 OpenAI가1,220억 달러를 유치하며 기업가치8,520억 달러를 기록했습니다. 아마존이 최대500억 달러,NVIDIA와소프트뱅크가 각각300억 달러를 댔고 마이크로소프트도 참여했습니다. 사상 최대급 비상장 라운드로, AI 수요가 여전히 가파르다는 신호입니다. 1
조건도 눈에 띕니다. 보도에 따르면 아마존 자금 중 350억 달러는 2028년까지IPO 또는AGI 마일스톤 달성 시 집행되며, NVIDIA·소프트뱅크는 올해 분할 집행합니다. 또한 고액자산가 등개인 투자자 채널을 처음 개방해**30억 달러+**를 확보, 향후 상장 유동성 기반을 넓혔습니다. 2
OpenAI는 이번 자금으로 초대규모 컴퓨트, 차세대 모델, 대규모 배포를 가속하겠다고 밝혔고, 월 매출 20억 달러 런레이트와 기업 매출 비중~40%(연말 50% 접근 예상)를 공개했습니다. 회사는 ChatGPT·코딩 에이전트·브라우징·툴을**‘AI 슈퍼앱’**으로 통합해 개인 사용 습관이 자연스럽게 업무로 확장되도록 하겠다는 전략을 강조했습니다. 3
다만 자본만으로 마진이 보장되진 않습니다. 칩·전력·데이터센터 비용과 경쟁(Anthropic, Google) 부담이 여전해, 모델 효율성과 상업화 실행력이 자금력만큼 중요해졌습니다. 최근 GPT‑5.4 등 제품 속도는 긍정적 신호지만, 수익성 방정식이 핵심 과제입니다. 4
구글, Gemma 4 공개 및 Apache 2.0 전환
구글이 Gemma 4 4종을 공개했습니다.E2B/E4B는 스마트폰·엣지용,26B MoE·31B Dense는 워크스테이션급으로, 기존 제한적 라이선스 대신Apache 2.0으로 전환했습니다. 대형 모델은 80GB H100 한 장에 비양자화 구동이 가능하다고 밝혔습니다. 5
기능은 에이전트 워크플로우에 맞춘 네이티브 함수 호출,구조화 JSON 출력, 긴 컨텍스트(엣지 128k, 대형 256k)에 더해, 시각 입력·음성 인식(E2B/E4B)을 지원합니다. Apache 2.0은 상업적 제약을 크게 줄여 기업의 프로덕션 도입 문턱을 낮춥니다. 6
Gemma 4는 Gemini 3와 같은 연구 계보를 공유하며 “파라미터 대비 지능”을 강조합니다. 배포는 AI Studio, Hugging Face, Kaggle, Ollama 등으로 바로 가능해, 로컬 추론·데이터 주권이 필요한 팀에 현실적인 대안이 됩니다. 7
마이크로소프트, 새로운 기저 모델 3종 공개
마이크로소프트 AI가 MAI‑Transcribe‑1(25개 언어 STT,Azure Fast 대비 2.5배 빠름),MAI‑Voice‑1(음성60초를 1초에 생성, 커스텀 보이스),MAI‑Image‑2(더 빠르고 사실적인 이미지)를 공개했습니다.Foundry·MAI Playground에서 이용 가능하며, 요금은**$0.36/시간**(음성인식),$22/100만자(음성합성),$5/100만 입력 토큰,$33/100만 이미지 출력 토큰부터입니다. 8
전략적으로 MS는 OpenAI와의 파트너십을 유지하면서도 텍스트 LLM을 넘어 미디어 워크로드(자막, 회의록, 보이스봇, 이미지 생성)에 최적화된 저비용 대안을 제시합니다. 향후 Bing, PowerPoint, Copilot 등 제품군과의 통합 여지도 큽니다. 9
핵심은 “가격·성능의 예측 가능성”입니다. 무거운 범용 LLM 대신 목적형 멀티모달 모델로 확실한 ROI를 내도록 해, 보수적인 IT 구매자에게 매력적인 카드가 됩니다. 8
Industry & Biz
오라클, AI 투자 속 대규모 감원 단행
오라클이 수천 명 규모 감원을 진행 중입니다. AI 데이터센터 투자로 부채·현금흐름 우려가 커진 가운데, 주가는 연초 대비 약25% 하락했습니다. 2025년 OpenAI 대형 계약의 영향으로잔여 이행의무 (RPO)는4,550억 달러로 급증했지만, 단기 재무 부담도 커졌습니다. 10
지역 공시도 나옵니다. 미주리 캔자스시티 캠퍼스에서만539명 해고(WARN 공시). ‘Stargate’처럼 대규모 데이터센터 프로젝트의 자금조달을 위해 인건비를 줄인다는 해석이 지배적이며, 약속 대비 진척 더딤도 논란을 키웁니다. 11
일부 매체는 전세계 약 3만 명, 이 중인도 1.2만 명 감원을 보도했지만 오라클은 총규모를 확인하지 않았습니다. 돌발적 이메일 통보 방식에 대한 비판도 커지며, 급박한 AI 전환 와중에 ‘사람 중심’ 변화관리의 중요성이 부각됩니다. 12
New Tools
구글 Gemma 4: 지금 당장 돌려볼 수 있는 오픈 모델
무엇: Apache 2.0으로 공개된 오픈웨이트 4종(폰~싱글 GPU 워크스테이션). 왜 중요:상업 제약 최소화+로컬 추론으로 데이터 유출 없이 에이전트, 오프라인 코드, 멀티모달 기능을 실험·출시하기 쉬워졌습니다. Hugging Face, Kaggle, Ollama, Google AI Studio에서 바로 사용 가능합니다. 5
가격: 모델 가중치는 무료(인프라 비용만). 대상: 모바일/엣지 개발자(E2B/E4B), 프라이버시·지연에 민감한 스타트업/기업, 온프렘 PoC가 필요한 팀. 써볼만한가: 네—이전 라이선스 제약이 걸림돌이었다면 특히. 6
팁: E2B는 E4B 대비 안드로이드에서 최대 3배 빠르고, 엣지 계열은 이전 대비 배터리 사용량을 최대 60% 줄입니다.128k 컨텍스트로 온디바이스 비서, OCR, 간단 음성 과제에 적합합니다. 7
NVIDIA Nemotron 3 Super: 100만 토큰·에이전트 특화 오픈 모델
무엇: 총 120B(활성12B) 하이브리드 MoE로100만 토큰 컨텍스트를 기본 지원, 멀티에이전트의 ‘컨텍스트 폭증’을 정면 돌파. 이전 대비5배 처리량, 도구 호출 신뢰성을 강조합니다. 13
가격: 퍼미시브 오픈 라이선스, Vertex AI·OCI·Perplexity·OpenRouter 등 또는 NVIDIA NIM으로 온프렘 배포. 대상: 대규모 코드·문서 전체를 기억해야 하는 에이전트, 심층 리서치·길이 제한 많은 워크로드. 써볼만한가: 네—컨텍스트 한계로 비용이 튀는 팀에 특히. 13
시작법: 먼저 Nemotron 3 Nano로 H100+vLLM에서 스루풋을 점검하고 Super로 확장하는 접근이 유용합니다. 절대 성능은 톱 폐쇄형 모델보다 약간 낮을 수 있지만, 훨씬 큰 컨텍스트와 토큰 경제성이 에이전트에는 이점입니다. 14 15
커뮤니티 반응
Hacker News (873↑) — Gemma 4가 메모리/연산 발자국을 낮추면서 폐쇄형 모델 성능에 근접하면 “대다수에게 실용적”이라는 기대가 큼.
"만약 이 모델들이 현재의 폐쇄형 모델들이 할 수 있는 일을 충분히 따라잡는다면, 제 용도에는 "충분히 좋을" 겁니다. 많은 사람들에게도 마찬가지일 것 같아요."
Hacker News (5↑) — 오라클의 이메일 일괄 통보 방식에 비판적. 최소한 사전 신호(유출이라도)가 직원 대비·평판 관리에 낫다는 의견.
"되돌아보면 메타의 해고 소식이 며칠 전에 '유출'된 게 오히려 다행이라고 생각해요. 직원들이 적어도 정신적으로 준비할 수 있었고, 메타는 '사전 발표한 건 아니다'라고 체면을 어느 정도 살릴 수 있었죠."
나에게 주는 의미
-
빌더 관점에서 오늘의 키워드는 통제권과 비용입니다. Gemma 4의 Apache 2.0 전환과 온디바이스 성능은 데이터 유출 없이 빠른 실험과 출시를 가능하게 합니다. 프라이버시·지연 민감한 업무라면 더 이상 미룰 이유가 줄었습니다. 5
-
에이전트 워크플로우에서는 Nemotron 3 Super가 컨텍스트 폭증과목표 이탈을 줄입니다. 100만 토큰 창과 MoE 처리량은 장문 히스토리·툴 출력 재전송 비용을 줄이고 일관성을 높여, 데모를 넘어 실제 운영에 가까워지게 합니다. 13
-
비용 책임자에게는 MS의 새 미디어 모델들이 명확한 단가로 회의록·보이스봇·이미지 등 대량 과제에 적합합니다. 모호한 LLM 과금 대신, 특정 워크로드의예측 가능한 ROI를 먼저 확보하기 좋습니다. 8
-
커리어·조직 관점에서는 OpenAI의 대형 조달이 인프라·온디바이스·플랫폼·Applied AI PM 수요를 키우는 한편, 오라클 사례는 급격한 구조조정 리스크를 상기시킵니다.AI 인프라·비용 통제·배포 회복력 역량이 ‘프롬프트 스킬’만큼 중요해졌습니다. 1 10
지금 할 일
- Gemma 4 로컬 테스트: Hugging Face/Ollama에서 E2B/E4B 또는 26B/31B를 받아 OCR→JSON 파이프라인 등 주간 반복 업무에 벤치마크하세요.
- MS MAI 모델 체험: Foundry 또는 MAI Playground로 회의록/보이스봇/이미지 배치를 테스트해 현 스택 대비 비용·지연을 비교하세요.
- 롱컨텍스트 에이전트 PoC: Nemotron 3 Super(또는 Nano 시범)로 실코드베이스나 500+페이지 문서를 넣어 작업 완료율과 시간·비용을 측정하세요.
- AI 비용 구조 점검: 현재 추론 지출·컨텍스트 길이·실패 패턴을 인벤토리하고, 기준치를 넘어가면 오픈모델로 자동 라우팅하도록 정책을 만드세요.
댓글 (0)