Fine-tuning파인튜닝
쉽게 이해하기
파인튜닝은 이미 학습된 모델을 특정 목적에 맞게 더 훈련시키는 것이다. 기본 모델이 영어, 코딩, 상식, 문서 요약을 넓게 배웠다면, 파인튜닝은 “우리 회사 답변 형식”, “법률 문서 분류”, “의료 상담 톤”처럼 좁은 목표를 반복 연습시키는 과정이다. 단순히 지식을 추가하는 것보다 행동 패턴을 안정화하는 데 더 가깝다.
비유와 예시
- 신입 교육: 기본 역량이 있는 사람에게 회사 프로세스와 말투를 훈련한다.
- 콜센터 답변: 같은 정책을 항상 정해진 형식으로 말하게 만든다.
- 코드 스타일: 특정 repository의 naming, formatting, review style을 더 잘 따르게 한다.
한눈에 비교
| 방법 | 주로 해결하는 문제 | 장점 | 주의점 |
|---|---|---|---|
| Prompting | 한 번의 지시로 행동 유도 | 빠르고 저렴 | 일관성 한계 |
| RAG | 외부 지식 검색 | 최신/사내 지식 반영 | 검색 품질 의존 |
| Fine-tuning | 반복되는 행동·형식 학습 | 일관성, domain adaptation | 데이터 품질과 eval 필요 |
| LoRA/PEFT | 적은 파라미터만 학습 | 비용 절감 | base model 제약 |
어디서 왜 중요한가
파인튜닝은 모델이 “무엇을 알아야 하는가”보다 “어떻게 대답해야 하는가”가 반복적으로 중요한 경우에 유용하다. 예를 들어 출력 JSON schema를 안정적으로 따르거나, 특정 라벨 체계로 분류하거나, 회사의 문체를 유지하는 데 도움이 된다. 반대로 최신 문서 내용을 넣는 목적이라면 RAG가 더 적합한 경우가 많다.
자주 하는 오해
- “파인튜닝은 지식을 넣는 방법이다” → 최신 사실 주입은 RAG가 더 적합할 수 있다.
- “데이터가 많을수록 무조건 좋다” → 품질 낮은 예시는 나쁜 행동을 학습시킨다.
- “training loss가 낮으면 성공이다” → 별도 eval set에서 실제 task 성능을 봐야 한다.
- “작은 데이터면 비용도 항상 작다” → 데이터 정제, eval, 재학습 비용이 더 클 수 있다.
대화에서는 이렇게
- “이건 지식 검색 문제가 아니라 출력 형식 일관성 문제라 fine-tuning 후보입니다.”
- “먼저 base model + prompt + RAG baseline을 만들고, eval에서 안 되는 부분만 튜닝합시다.”
- “training set과 test set이 섞이면 성능이 좋아 보이는 착시가 생깁니다.”
- “LoRA로 시작하고, 효과가 부족하면 full fine-tuning을 검토합시다.”
함께 읽으면 좋은 용어
참고 자료
- Supervised fine-tuning
SFT workflow, dataset, training job, evaluation-first 접근을 설명하는 공식 API 문서.
- Fine-tuning best practices
training/test set, prompt consistency, evaluation considerations를 다루는 best-practice 문서.
- Fine-tuning
pretrained model을 task/domain dataset으로 이어 학습하는 fine-tuning 절차를 설명한다.
- PEFT
LoRA 같은 parameter-efficient fine-tuning 방법과 adapter 기반 학습 맥락을 제공한다.
- SFTTrainer
LLM supervised fine-tuning training loop와 데이터 포맷 관점의 실무 참고 자료.