← 용어집

ML 기초

전통 ML 알고리즘, 학습 이론, 평가 방법

17개 용어

ML 기초 LLM · 생성AI
Agentic workflows
에이전트 워크플로우
에이전트 워크플로우는 여러 개의 전문화된 AI 에이전트가 서로 상호작용하며 계획·추론·도구 사용을 통해 다단계 문제를 자율적으로 해결하도록 설계된 동적 작업 흐름을 말한다. 단일 에이전트나 고정된 순서의 정적 플로우…
LLM · 생성AI ML 기초
CoT
사고 과정
CoT(Chain-of-Thought)는 대규모 언어 모델이 복잡한 문제를 풀 때 중간 추론 단계를 생성하거나 모방하도록 프롬프트·예시·학습 절차로 유도해 최종 답변의 정확도를 높이려는 reasoning 기법이다.
ML 기초 수학 · 통계
F1 Score
F1 점수
F1 점수는 이진 또는 다중 분류 모델의 성능을 평가할 때 사용하는 지표로, 정밀도(precision)와 재현율(recall)의 조화 평균이다. 0과 1 사이의 값을 가지며, 불균형 데이터에서 정확도만으로는 판단하기…
LLM · 생성AI 딥러닝 ML 기초
Fine-tuning
파인튜닝
파인튜닝은 이미 사전학습된 모델을 특정 task, domain, 스타일, 출력 형식에 맞게 추가 학습하는 과정이다. 전체 파라미터를 업데이트할 수도 있고 LoRA 같은 parameter-efficient 방법으로 일…
인프라 · 하드웨어 딥러닝 ML 기초
GPU
그래픽 처리 장치
GPU는 대규모 병렬 스레드와 전용 메모리 계층을 통해 행렬 중심의 동일 패턴 계산을 고처리량으로 실행하는 가속 프로세서로, 고대역폭 메모리와 고속 인터커넥트를 활용해 AI 학습·추론 같은 데이터 병렬 워크로드의 처…
LLM · 생성AI 딥러닝 ML 기초
LLM
대규모 언어 모델
대규모 언어 모델은 대규모 텍스트 말뭉치로 사전학습되어 자연어를 이해·생성하는 딥러닝 계열 모델로, 주로 Transformer를 기반으로 한 자기-어텐션으로 토큰 간 관계를 병렬로 포착하고(디코더 중심일 경우 다음 …
LLM · 생성AI 딥러닝 ML 기초
LoRA
로라
LoRA는 큰 모델의 원래 가중치는 고정하고 작은 low-rank adapter만 학습해 fine-tuning 비용을 줄이는 방법이다.
ML 기초
MARL
다중 에이전트 강화학습
다중 에이전트 강화학습은 여러 개의 인공지능 에이전트가 같은 환경에서 서로 상호작용하며 학습하는 AI 기술로, 각 에이전트는 자신의 행동을 통해 보상을 얻고, 협력하거나 경쟁하면서 최적의 전략을 찾는다.
ML 기초 LLM · 생성AI
multi-stage training
다단계 학습
다단계 학습은 AI 모델, 특히 대형 언어 모델(LLM)을 개발할 때 여러 단계에 걸쳐 데이터를 다르게 활용하며 점진적으로 모델을 개선하는 학습 방식이다. 각 단계는 사전학습, 중간학습, 후학습 등으로 나뉘며, 각 …
LLM · 생성AI 딥러닝 ML 기초
NLP
자연어 처리
자연어 처리(NLP)는 컴퓨터가 인간의 언어를 해석하고 생성하도록 하는 인공지능 분야로, 대규모 언어 데이터에서 토큰 단위 패턴과 문맥을 학습한 모델을 통해 번역·요약·감정 분류 같은 과업을 수행해 비정형 텍스트를 …
ML 기초 수학 · 통계
overfitting
오버피팅
과적합은 모델이 훈련 데이터의 잡음까지 규칙처럼 학습해 보지 못한 데이터에서 성능이 악화되는 일반화 실패다. 훈련·테스트 성능 격차가 커질 때 드러난다.
ML 기초 LLM · 생성AI
post-training
후훈련
후훈련은 사전 훈련된 모델을 지시 따르기, 안전성, 도메인 지식, 인간 선호에 맞게 조정하는 단계다. 보통 SFT, 선호 데이터 기반 보상 모델·DPO·RLHF, 평가와 안전 필터를 반복해 base 모델의 행동을 제…
ML 기초 LLM · 생성AI
pre-training
사전 훈련
사전 훈련은 대규모 원천 데이터에서 다음 토큰 예측, 마스킹 복원, 대비학습 같은 자기지도 목적을 먼저 최적화해 범용 표현과 초기 가중치를 만드는 단계다. 이 체크포인트는 이후 미세조정·후훈련·RAG·에이전트화의 기…
ML 기초
RL
강화 학습
강화 학습은 에이전트가 환경과의 상호작용을 통해 정책을 개선해 누적 보상을 극대화하는 기계학습 패러다임으로, 문제를 순차적 의사결정의 마르코프 결정 과정(MDP)으로 두고 행동의 결과로 얻는 보상 신호를 토대로 학습…
LLM · 생성AI 딥러닝 ML 기초
Self-Attention
셀프 어텐션
셀프 어텐션은 입력 안의 각 요소가 같은 입력의 다른 모든 요소를 비교해, 무엇에 더 집중해야 하는지 가중치를 계산한 뒤 그 정보를 종합해 새로운 표현을 만드는 메커니즘이다. 트랜스포머에서 핵심 역할을 하며, 멀리 …
ML 기초 LLM · 생성AI
supervised fine-tuning
지도 미세 조정
지도 미세 조정은 이미 사전학습된 AI 모델에 사람이 직접 정답을 달아준 데이터(라벨링 데이터)를 추가로 학습시켜, 특정 작업이나 목적에 더 잘 맞게 성능을 높이는 과정입니다. 이 방식은 모델이 실제로 원하는 답을 …
데이터 엔지니어링 LLM · 생성AI ML 기초
Synthetic Data
합성 데이터
합성 데이터는 실제 관측값을 그대로 노출하지 않고 통계적 규칙, 시뮬레이션, 생성 모델 등을 통해 만든 데이터로, 학습·평가·개인정보 보호·희귀 사례 보강에 사용된다.