AI 뉴스Research

약 7분 2026. 6. 2.

3D reconstructionvideo generationLLM agentsagentic systemsevaluation metricsopen source tools

새 3D 기법이 포인트 맵의 국지 표면 기하를 끌어올렸다

SurGe는 국지 표면 지표와 두 가지 학습 기법으로 포인트 맵의 미세 기하 오류를 줄이면서 글로벌 정확도를 유지한다. 에이전트 ‘하니스’ 설계와 1스텝 비디오 생성 연구가 함께 주목받으며, 단순한 모델 대형화가 아닌 정밀도와 지연시간 개선의 흐름이 드러난다.

기사에서 찾기

읽기 모드

한 줄 요약

오늘의 논문은 실용 개선에 초점을 맞춘다: 포인트 맵의 국지 3D 표면을 더 정확히 복원하고, 지연을 줄인 1스텝 비디오 생성을 안정화하며, 모델 못지않게 그 주변 시스템(하니스)의 설계와 평가를 끌어올리려는 흐름이 두드러진다.

Research Papers

SurGe: 포인트 맵의 국지 표면 기하 개선

포인트 맵 기반 3D 복원은 전체 형태는 맞추지만 국지 표면 방향이 틀어지는 일이 잦다. SurGe는 이런 국지 오류를 드러내는 “포인트 맵 법선 지표”를 제안하고, 동시에 글로벌 정확도를 유지하면서 해당 오류를 줄인다. ¹

이를 위해 두 가지를 더한다. 깊이 정규화된 3D 유한 차분을 감독하는 포인트 그라디언트 매칭 손실과, 특징을 단계적으로 업샘플링하면서 이웃 정보를 혼합하는 이웃 주의 디코더(Neighborhood Attention Decoder, NAD)다. ¹

SurGe는 8개 제로샷 단안 기하 벤치마크에서 글로벌 포인트 맵 절대 상대 오차(Absolute Relative Error, AbsRel)의 평균 순위가 가장 좋았고, 로컬 포인트 맵 및 포인트 맵 법선 평가에서도 일관된 향상을 보였다. ¹

에이전트 자기-진화: ‘업데이트 능력’과 ‘이득’을 구분하다

이 논문은 실행 기록을 바탕으로 프롬프트·스킬·메모리·도구 같은 모델 외부 구조(‘하니스’)를 스스로 갱신하는 대형 언어 모델(Large Language Model, LLM) 에이전트를 대상으로, 어떤 모델이 유용한 갱신을 잘 만들고, 또 어떤 모델이 그 갱신으로 실제 성능 이득을 얻는지 분석한다. ²

핵심은 두 능력의 분리다. 하니스-업데이트(지속 가능한 유용한 갱신 작성)와 하니스-이득(갱신 적용 후 과제 해결 성과)이다. 결과적으로 하니스-업데이트는 기본 모델 능력과 거의 무관하며(Qwen3.5-9B의 갱신도 Claude Opus 4.6 수준의 이득을 냈다), 하니스-이득은 비단조적이다. 약한 모델은 이득이 작고, 중간급 모델이 가장 크게 이득을 보며, 강한 모델은 중간급보다 이득이 작았다. 약한 모델의 낮은 이득은 하니스 아티팩트를 불러오지 못하거나, 불러와도 충실히 따르지 못하는 실패 양상에서 비롯된다. ²

One-Forcing: 1스텝 자동회귀 비디오 생성을 안정화

One-Forcing은 Self-Forcing의 지식 증류 목적 함수에 보조 적대적 생성 신경망(Generative Adversarial Network, GAN) 손실을 더해, 품질을 유지하면서도 지연을 줄이는 ‘1스텝’ 자동회귀 비디오 생성을 가능하게 하는 학습 레시피다. ³

VBench에서 83.76을 기록해 1스텝 인과적 비디오 생성 방식 중 최고 성능을 보였고, 다단계 강력 기법과도 경쟁력을 유지한다. 또한 프레임 단위 1스텝 자동회귀 생성을 청크 단위 모델 대비 약 3분의 1의 학습 비용으로 안정적으로 달성했다. ³

모델 스케일에서 시스템 스케일로: 에이전트 하니스 확장

이 포지션 페이퍼는 에이전트형 AI의 다음 병목이 더 큰 모델이 아니라, 메모리·검색·도구 사용·장기 오케스트레이션·검증·거버넌스를 포괄하는 감사 가능하고 모듈식인 ‘에이전트 하니스’라는 시스템 설계에 있다고 주장한다. 모델 중심 평가는 이런 상호작용을 놓치기 쉽다. ⁴

논문은 컨텍스트 거버넌스, 신뢰할 수 있는 메모리, 동적 스킬 라우팅의 세 병목과 함께, 경로 품질·메모리 위생·컨텍스트 효율·통신 충실도·검증 비용·시간 경과에 따른 안전한 진화를 측정하는 하니스 수준 벤치마크 의제를 제시한다. 이를 구체화하기 위해 파이썬 네이티브 참조 하니스인 CheetahClaws를 제안하고, Claude Code와 OpenClaw와 비교한다. ⁴

Open Source & Repos

InsForge: 에이전트 코딩을 위한 올인원 백엔드

InsForge는 데이터베이스, 인증, 스토리지, 컴퓨트, 호스팅, AI 게이트웨이를 한데 묶어 코딩 에이전트가 엔드 투 엔드로 풀스택 앱을 배포할 수 있게 하는 오픈소스 백엔드 플랫폼이다. npm에는 소프트웨어 개발 키트(Software Development Kit, SDK)도 제공한다. ⁵

저장소는 Apache-2.0 라이선스와 활동 배지를 명시하며, 2026-05-29의 v2.1.10 업데이트 등 지속적인 개편이 진행되고 있음을 보여준다. ⁵

왜 중요한가

핵심은 실용성이다. SurGe는 사람이 바로 알아차리는 국지 표면 왜곡을 평가·학습에 반영하게 만들고, One-Forcing은 샘플링 단계를 1로 줄여 상호작용형 비디오 응답을 지연 없이 가깝게 만든다. ¹

동시에 에이전트 연구는 메모리·라우팅·거버넌스를 포괄하는 하니스 설계가 모델 성능 못지않게 실사용 신뢰성을 좌우한다고 강조한다. 이는 더 큰 모델뿐 아니라 하니스 수준 평가와 재사용 가능한 인프라에 대한 투자 필요성을 시사한다. ⁴

출처 5

[1] Arxiv SurGe: Improved Surface Geometry in Point Maps [2] Arxiv Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents [3] Arxiv One-Forcing: Towards Stable One-Step Autoregressive Video Generation [4] Arxiv From Model Scaling to System Scaling: Scaling the Harness in Agentic AI [5] Github InsForge/InsForge: The all-in-one, open-source backend platform for agentic coding

도움이 되었나요?

0to1log Weekly

최신 AI 뉴스 모음집