구글 Gemma 4 완전 오픈소스 전환, MS는 독자 AI 행보 가속
구글은 Apache 2.0 Gemma 4로 ‘로컬‑퍼스트’를 선언했고, 마이크로소프트는 자체 MAI 모델로 OpenAI 의존을 끊는다. 다음 두 분기, 판도가 바뀐다.
한 줄 요약
구글이 Gemma 4를 Apache 2.0으로 완전 공개했고, 마이크로소프트는 자체 AI 모델 3종을 기업용으로 출시했으며, OpenAI는 보안 스타트업과 테크 토크쇼를 잇따라 인수했습니다. 백악관은 연방 선점형 AI 정책 틀을 내놨습니다.
Big Tech
구글 Gemma 4 — Apache 2.0 완전 오픈소스 전환
구글 딥마인드는 가장 강력한 공개 모델인 Gemma 4를 발표하며, 핵심적으로 Apache 2.0 라이선스로 전환했습니다. E2B(약 23억 유효), E4B(약 45억 유효), 26B MoE(3.8B 활성), 31B 밀집형 등 4종으로 출시됐고, 최대 25.6만 토큰 문맥과 140+개 언어를 지원합니다. 오픈웨이트에서 한발 더 나아가 상업적 재사용까지 자유로워진 것이 포인트입니다. 1 2 3
왜 중요한가: Gemma 4는 80GB H100 한 장(BF16 무양자화)으로 구동되고, 24GB 소비자 GPU에서는 4비트 양자화로 돌아갑니다. 엔비디아·AMD가 데이터센터부터 RTX·Jetson, Instinct·Ryzen AI까지 ‘데이제로’ 최적화를 내놓았고, Arena AI 리더보드에서 31B가 오픈모델 상위 3위입니다. AIME 2026 수학은 Gemma 3 27B의 20.8%에서 89.2%로 수직 상승했습니다. 4 2 3
개발자 시사점: 네이티브 함수 호출과 구조화 JSON을 기본 지원해 ‘에이전트 워크플로’에 바로 투입 가능합니다. E2B/E4B는 온디바이스 오디오 입출력도 탑재했습니다. 다만 25.6만 문맥은 1,000만 토큰의 Llama Scout, 100만 토큰의 Qwen 대비 짧고, 26B MoE는 초기 환경에 따라 처리량 이슈가 보고됩니다(런치 후 빠른 개선 관측). 4 2 3
어디서 받나: Google AI Studio, Hugging Face(사전학습/지시튜닝), Kaggle, Ollama에서 바로 내려받아 실행할 수 있습니다. Apache 2.0 덕분에 출처표기만 지키면 상업적 재배포·개조가 가능합니다. 로컬 코드 어시스턴트나 주권형(온프렘) AI를 계획했다면 사실상 ‘허가 신호’입니다. 1 2
마이크로소프트, Foundry에 자체 AI 모델 3종 출시
마이크로소프트는 MAI-Transcribe-1(음성→텍스트), MAI-Voice-1(텍스트→음성), MAI-Image-2(텍스트→이미지)를 엔터프라이즈 전용 Foundry에 공개했습니다. 2025년 계약 재정비 이후 OpenAI 의존도를 낮추는 행보로, MAI-Transcribe-1은 25개 언어(FLEURS) 평균 WER 3.8%와 $0.36/시간 가격이 보도됐고, WPP는 MAI-Image-2를 대규모 적용 중입니다. 5 6 7
전략 포인트: Foundry는 이미 8만여 개 기업, 포춘 500 다수를 커버합니다. 모든 지표에서 OpenAI를 이길 필요 없이, ‘충분히 좋고’ Azure에 통합되어 있으면 지출을 돌리기 쉽습니다. MAI Superintelligence 팀의 첫 결과물로, 1~2년 내 자체 대규모 LLM 계획도 병행됩니다. 6 5
실무 적용: Teams·Copilot 사용자라면 전사(Transcribe)+합성(Voice) 오디오 파이프라인과 빠른 이미지 생성이 하나의 계약·거버넌스로 묶입니다. Whisper·DALL·E 대체를 노리는 직접 경쟁 구도이며, Azure 네이티브 거버넌스·SLA가 장점입니다. 8 5
OpenAI, Promptfoo 인수로 에이전트 보안 강화
OpenAI는 2024년 설립돼 포춘 500의 25%가 사용 중인 AI 보안 스타트업 Promptfoo를 인수해, OpenAI Frontier에 자동 레드팀·에이전트 워크플로 보안 평가·리스크 모니터링을 내장합니다. 오픈소스 인터페이스/라이브러리 지원도 계속될 전망입니다. ‘에이전트 보안’이 플랫폼 기본 기능으로 격상되는 신호입니다. 9
기업 입장에서는 자율 에이전트의 오작동·정보유출 리스크를 배포 전 자동 점검하는 파이프라인을 갖출 수 있게 됩니다. 평가 항목 공개와 감사를 전제로 보안 승인 시간이 단축될 여지가 있습니다. 9
최근 OpenAI의 M&A는 인프라·도구·보안을 아우르며, ChatGPT와 에이전트 플랫폼을 ‘엔터프라이즈 레디’로 포지셔닝합니다. 거래 금액은 비공개지만, 관건은 규제 산업에서 파일럿을 운영단계로 옮길 만큼의 신뢰를 줄 수 있느냐입니다. 9
OpenAI, 일간 테크 토크쇼 TBPN 인수
OpenAI는 3시간 생방 테크 토크쇼 TBPN도 인수했습니다. CNBC는 비용절감과 제품 조정 국면에서 이례적이라 보도했고, PitchBook은 TBPN이 전략 조직 산하(글로벌 대외책임자 직속)로 편제되며 ‘편집 독립’을 약속받았다고 전했습니다. 10 11
의미: 규제 논쟁이 뜨거워지는 시점에 자체 채널을 확보해 제품·정책·사례를 직접 전달하려는 ‘직행 커뮤니케이션’ 전략입니다. 영향력은 크지만, 이해상충 우려와 포커스 분산 리스크도 존재합니다. 10
현업 관점에선 제품 설명, 고객 사례, 안전/정책 메시지가 원 저작자 관점에서 더 자주 제공될 가능성이 큽니다. 마케팅 측면에서는 AI 벤더들이 전통 PR을 우회할 조짐으로 읽힙니다. 11 10
Industry & Biz
백악관, 국가 AI 정책 프레임워크 발표
백악관은 ‘과도한’ 주(州) AI 규제를 연방법으로 선점(프리엠션)하되, 아동보호·소비자보호·사기방지·데이터센터 부지(조닝)·주정부 조달 등은 주 권한으로 남기는 국가 AI 정책 프레임워크를 공개했습니다. 7대 축은 아동보호, 지역사회/인프라, 지식재산, 표현의 자유, 혁신, 인력 양성, 프리엠션이며, 전담 AI 규제기관 신설보다 분야별 기존 기관을 선호합니다. 12 13
블랙번 상원의원안과 비교하면, 백악관안은 혁신친화·경량 규제 성향이고, 블랙번안은 개발자 주의의무, 편향감사, 출처표시, 집행 강화가 포함된 처방적 성격입니다. 누가 책임을 지는지(개발사 vs. 도입사), 어떤 공개의무가 있는지, 주별 규정이 얼마나 통일되는지가 핵심 쟁점입니다. 12
실무 체크리스트: 연방 선점이 진전돼도 주의 일반법(소비자·아동보호)은 그대로 적용됩니다. 연령확인, 저작권 트레이닝 공정이용(법원 판단 대기), 딥페이크 방지, 데이터센터 전력·입지 영향 등 프레임워크가 짚은 영역을 거버넌스 문서와 프로세스에 반영해야 합니다. 14 13
New Tools
Gemma 4: 로컬·엣지에서 바로 써보기
Google AI Studio(호스팅)와 Hugging Face, Kaggle, Ollama(로컬)로 접근 가능합니다. 노트북·Jetson은 E4B부터, H100 단일카드(BF16)는 31B, 24GB GPU는 4비트 양자화로 실행해 보세요. E2B/E4B는 12.8만, 26B/31B는 25.6만 토큰 문맥을 지원합니다. 1 2
강점: 복합추론, 수학, 코딩, 함수호출, 구조화 JSON 등 도구 연동에 적합합니다. 소형은 온디바이스 오디오 I/O가 있어 오프라인 음성 인식/이해가 가능합니다. 초기 26B MoE 처리량 변동성은 유의하고, 지연이 민감하면 31B 밀집형을 고려하세요. 4 3
Apache 2.0으로 상업적 활용·재배포·파생 모델 공개가 자유롭습니다(출처표기 필수). 데이터 주권, 비용 통제, 벤더 독립이 중요한 ‘로컬 퍼스트 AI’ 로드맵에 최적입니다. 1 15
마이크로소프트 MAI 모델(기업 한정)
MAI-Transcribe-1은 다국어 정확도·속도가 강점이며 $0.36/시간이 보도됐고, MAI-Voice-1은 단일 GPU에서 1초 이내 60초 음성을 합성합니다. MAI-Image-2는 Arena.ai 상위권으로, Bing·PowerPoint에 통합 중입니다. OpenAI·Anthropic 모델과 같은 Foundry에서 관리하되, MS 네이티브로 지출을 모으는 전략입니다. 6 5
대상: 규제 산업·대기업. Azure 거버넌스·조달 단순화·SLA 일원화가 장점이며, Teams·Copilot 사용자라면 전사·합성 오디오 루프를 한 계약으로 대체할 수 있습니다. 8 7
쓸 만한가? 콜센터·인터뷰·회의록·합성 내레이션 등 오디오 중심 업무, 그리고 오피스 환경의 빠른 이미지 생성에는 비용·속도 면에서 현실적 이점이 큽니다. 6 5
커뮤니티 반응
Hacker News (1.8K↑) — 혼합: 로컬 실행 기대 속에 도구/패키징 이슈가 있었지만 재설치로 해결되기도 했고, ‘과도한 기대’에 대한 신중론도 공존.
"업데이트 - LM Studio를 새로 받아오니 문제가 해결된 것 같습니다"
"나는 대부분 사람들보다 더 많은 걸 해보는 편이라, "드디어 기다림이 끝났다, 단 두 번만 더 개선하면 된다" 같은 말은 하지 않아요"
나에게 주는 의미
Gemma 4의 Apache 2.0은 법무 허들을 낮춥니다. 내망에서 데이터가 안 나가는 로컬 코파일럿, 도메인 특화 에이전트, 사내 코드 어시스턴트를 비용예측 가능하게 운영할 수 있습니다. 디바이스별로 크기를 매칭하고(E2B/E4B=엣지, 26B/31B=서버), MoE vs. 밀집형을 지연 민감도에 맞춰 선택하세요. 1 4
M365 사용 조직은 MAI 3종으로 오디오·이미지 워크플로를 ‘원 스택’으로 묶을 수 있습니다. OpenAI·Anthropic LLM을 계속 쓰더라도, 전사·합성·이미지 레일을 MS 네이티브로 바꾸면 조달·보안심사가 간단해집니다. 6 5
보안 측면에서 OpenAI-프롬프트푸 인수는 ‘에이전트 보안’을 CI/CD에 넣으라는 신호입니다. 릴리즈 전에 프롬프트 인젝션, 도구 오남용, 데이터 유출을 자동 점검하는 테스트 스위트를 구축하세요(오픈소스도 충분히 유용). 9
정책은 연방 표준 쪽으로 기웁니다. 그래도 주의 일반법은 유효하므로, 연령확인, 저작권 트레이닝 공정이용(법원 판단 대기), 딥페이크 대응, 데이터센터 전력·입지 이슈를 거버넌스 문서·프로세스에 반영해 두는 게 안전합니다. 14 12
지금 할 일
- Gemma 4 로컬 실행: Ollama 또는 Hugging Face로 E4B를 받아 노트북에서 코드 어시스턴트·RAG 미니 PoC를 돌려보며 MoE vs. 밀집형 지연을 비교하세요.
- MAI-Transcribe-1 파일럿: 일주일치 회의·콜 녹음을 배치 전사해 정확도·속도·비용을 현재 스택과 대조하세요.
- 에이전트 자동 레드팀 도입: 프롬프트 인젝션·툴 오남용·데이터 유출을 점검하는 오픈소스 평가 하네스를 CI에 붙여 릴리즈 전 보안 게이트를 추가하세요.
- AI 라이선스·IP 메모 작성: Apache 2.0 모델 사용 기준, 출처표기, 학습데이터 출처 증빙 방식을 문서화해 고객/감사 대응을 준비하세요.
댓글 (0)