딥러닝 LLM · 생성AI

Model Distillation모델 증류

난이도

쉽게 이해하기

모델 증류는 큰 모델이 가진 지식을 작은 모델에게 옮겨 담는 학습 방식이다. 작은 모델은 정답 라벨만 보는 것이 아니라 teacher 모델이 어떤 답을 얼마나 그럴듯하게 봤는지도 배운다. 목표는 더 빠르고 저렴하게 비슷한 품질을 내는 것이다.

숙련된 선생님이 정답만 알려주는 것이 아니라 왜 이 답이 더 그럴듯한지 감각까지 알려주는 상황과 비슷하다. 예를 들어 큰 언어 모델이 만든 답변을 이용해 작은 고객지원 모델을 학습시키거나, 큰 비전 모델의 예측 분포를 작은 모바일 모델이 따라 하게 만들 수 있다.

AI 서비스를 운영하면 모델 품질만큼 추론 비용과 응답 속도가 중요해진다. 증류는 큰 모델의 장점을 유지하면서 더 작은 모델을 배포하려는 전략이다. 특히 특정 도메인, 반복 업무, edge device, 대량 요청 처리에서 비용 대비 효과를 검토할 때 자주 등장한다.

★논문
Distilling the Knowledge in a Neural Network
teacher-student 지식 증류와 soft target 학습의 핵심 논문이다.
★논문
DistilBERT, a distilled version of BERT
대형 언어 모델 계열에서 증류가 압축과 추론 효율 개선에 쓰이는 대표 사례다.
·공식 문서
Knowledge Distillation
Transformers 기반 지식 증류 학습 루프와 구현 관점을 보여준다.

도움이 되었나요?