제01권 · 제10호 데일리 디스패치 2026년 5월 24일

최신 AI 뉴스 모음집

AI · 논문데일리 큐레이션공개 아카이브
AI 뉴스Research
약 7분

재훈련 없이 기반 모델과 어댑터를 잠그는 방법이 나왔다

LoREnc는 복구 가능한 저순위 신호를 억제해 도난 가중치나 무단 어댑터를 무력화하고, 허가된 어댑터는 성능을 1% 미만 오버헤드로 복구한다. 더불어 토큰을 절약하는 자기 조절형 계획, 다중 에이전트의 캐시 공유 보안, 챗봇의 검색 의존을 보여주는 연구를 다룬다.

읽기 모드

한 줄 요약

보안과 효율, 신뢰가 함께 전진한다: 재훈련 없는 모델 보호, 토큰을 아끼는 자기 조절형 계획, 안전한 공유 메모리, 그리고 검색 의존을 드러낸 챗봇 평가 — 여기에 표 처리 개선 오픈소스 업데이트까지.

Research Papers

LoREnc: 재훈련 없이 기반 모델·어댑터 보호

LoREnc는 모델 내부의 저순위 방향을 잠가 도난 가중치나 무단 플러그인 어댑터가 쓸모없는 출력을 내도록 만들고, 허가된 어댑터만 원래 성능을 복구하게 하는 훈련 불필요한 기법이다. 대상은 기반 모델(Foundation Model, FM)과 저순위 적응(Low-Rank Adaptation, LoRA) 어댑터로, 원본 학습 데이터 없이 지적 재산 유출과 모델 복구 공격을 다룬다. 1

방법은 가중치의 스펙트럼을 잘라 우세한 저순위 성분을 억제한 뒤, 허가된 어댑터 안에서 누락 정보를 보상하고, 보호된 어댑터의 구조적 지문을 숨기도록 직교 재매개변수를 적용한다. 실험에서 무단 사용자는 구조적으로 붕괴된 출력을 내고, 허가된 사용자는 정확히 동일한 성능을 복구했으며, 계산 오버헤드는 1% 미만이다. 1

온디바이스 모델이나 배포되는 어댑터를 운영하는 팀에는 재훈련이나 데이터 접근 없이 훔친 사본의 유용성을 떨어뜨리는 자물쇠-열쇠 패턴을 제공한다. 워터마킹과 이용 정책과 함께 낮은 오버헤드의 하드닝 층으로 실용적 선택지가 된다. 1

SR^2AM: 스스로 계획 깊이를 조절하는 에이전트 추론

이 연구는 에이전트가 언제, 얼마나 깊게 계획할지를 스스로 결정하도록 가르친다. 시뮬레이션 추론(미래 상태 예측), 자기 조절(계획 여부·깊이 결정), 반응 실행(세부 행동)의 세 부분으로 의사결정을 분해해, 대형 언어 모델(Large Language Model, LLM)의 사고의 사슬(Chain-of-Thought, CoT) 안에 SR^2AM(Self-Regulated Simulative Reasoning Agentic LLM)으로 구현했다. v0.1-8B와 v1.0-30B는 각각 120–355B, 685B–1T 시스템과 맞먹는 Pass@1을 보였다. 2

효율성도 크다. v1.0-30B는 유사한 에이전트형 LLM 대비 추론 토큰을 25.8–95.3% 줄였고, 강화학습(Reinforcement Learning, RL)은 평균 계획 지평을 22.8% 늘리면서 계획 빈도는 2.0%만 증가해 더 자주가 아니라 더 멀리 계획하도록 학습했음을 보였다. 수학·과학·표·웹 작업에서 같은 경향을 보였다. 2

LCGuard: 다중 에이전트의 KV 캐시 공유를 안전하게

다중 에이전트 시스템은 복잡한 협업을 위해 숨은 상태를 교환하는데, 키-값(Key-Value, KV) 캐시를 공유하면 사용자 입력이나 에이전트 고유 문맥이 조용히 새어 나갈 수 있다. LCGuard는 공유 KV를 잠재 작업 메모리로 보고 전송 전에 표현 수준 변환을 학습해 민감 정보의 재구성을 어렵게 한다. 3

저자들은 적대적 디코더가 민감 입력을 재구성하면 누출로 간주하는 운영적 정의를 세우고, 작업 의미를 보존하면서 복원 가능한 정보를 줄이도록 LCGuard를 학습시킨다. 여러 모델 계열과 벤치마크에서 LCGuard는 재구성 기반 누출과 공격 성공률을 낮추면서 표준 KV 공유 기준선과 유사한 작업 성능을 유지했다. 3

상업용 챗봇의 뉴스 중개 평가: 검색 편향과 취약점

2월 9–22일(14일) 동안 여섯 개 챗봇(Gemini 3 Flash·Pro, Grok 4, Claude 4.5 Sonnet, GPT-5, GPT-4o mini)을 BBC 뉴스에서 뽑은 2,100개 사실 질문으로 평가했다(미국·캐나다, 아랍어, 아프리카, 힌디어, 러시아어, 터키어 서비스). 최상위 시스템은 보도 수 시간 후의 이슈에 대해 객관식 정확도 90%를 넘겼지만, 자유서술형에서는 11–13%포인트, 전체 군집 평균으로는 16–17%포인트 하락했다. 4

세 가지 패턴이 드러났다. 첫째, 힌디어에서 최저 정확도(79%, 타 지역 89–91%)와 함께 인용 출처가 영어권 위키백과로 쏠리는 검색 편향이 관찰됐다. 둘째, 오류의 70% 이상은 추론이 아니라 검색 실패에서 비롯됐다. 셋째, 질문에 미묘한 거짓 전제가 포함되면 정확도가 19–70%로 떨어졌고, 가장 취약한 모델은 허구 사실을 64% 비율로 받아들였다. 거짓 전제 탐지 성능과 적대적 정확도의 순위가 어긋나는 탐지-정확도 역설도 보고됐다. 4

Open Source & Repos

Unstructured: 표 중심 분할 옵션 추가(0.22.30)

Unstructured는 복잡한 문서를 깨끗한 구조화 조각으로 바꾸는 오픈소스 추출-변환-적재(Extract, Transform, Load, ETL) 도구로, 대형 언어 모델(Large Language Model, LLM)과 검색 증강 생성(Retrieval-Augmented Generation, RAG) 파이프라인에 맞는 입력을 만든다. 5

2026-05-22 공개된 0.22.30 릴리스는 표 단위 분할(table chunking) 옵션을 추가해 행·열 분절 방식을 더 세밀하게 제어할 수 있게 했다. 임베딩 전 조각화 단계에서 표 맥락을 유지하려는 팀에 실용적 개선이다. 5

왜 중요한가

오늘의 공통 축은 보안·효율·신뢰다. 저순위 구조 암호화는 어댑터 배포를 더 안전하게 만들 수 있고, 토큰을 아끼는 계획은 더 적게 쓰고 더 멀리 생각하는 에이전트를 제시하며, 안전한 KV 공유는 사용자 문맥을 보호한다. 동시에 챗봇의 정확도는 검색 인프라와 언어 형평성에 크게 의존한다. 1

실무 관점에서는 모델을 자물쇠-열쇠로 배포하고, 계획이 이득일 때만 토큰을 쓰며, 공유 캐시는 민감 자산으로 다루고, 특히 영어 밖 영역까지 문서 파싱과 검색 품질에 투자하는 것이 핵심이다. 4

이번 주 시도해볼 것

  1. Unstructured 표 분할 옵션: pip로 unstructured를 설치하고 0.22.30의 table chunking을 문서에 적용해 본다(깃허브 참고). 5
  2. 검색 편향 점검: 챗봇 연구의 거짓 전제 섹션을 읽고, 자신이 쓰는 도구에 힌디어·영어로 같은 질문을 던져 인용 출처 변화를 관찰한다. 4

출처 5

도움이 되었나요?

댓글 (0)