← 용어집
LLM · 생성AI
대형 언어 모델, 생성AI, 에이전트, RLHF, 멀티모달
101개 용어
1-million-token context window
100만 토큰 컨텍스트 창
100만 토큰 컨텍스트 창은 AI 모델이 한 번에 처리할 수 있는 최대 텍스트 길이를 나타내며, 이는 모델이 더 많은 정보를 한 번에 고려할 수 있게 해준다.
1M context
100만 토큰 컨텍스트
100만 토큰 컨텍스트는 대형 언어 모델이 한 번의 응답(추론)에서 동시에 참고할 수 있는 입력과 대화 이력의 최대 길이가 약 100만 토큰에 달함을 뜻한다. 이는 모델이 더 긴 문서 묶음이나 장시간의 작업 흐름을 …
agentic access management
행위적 접근 관리
행위적 접근 관리는 AI 에이전트가 기업 시스템과 상호작용하는 방식을 관리하는 새로운 분야로, 동적이고 의도 기반의 제어와 실시간 책임성을 추가합니다.
agentic AI
대리 AI
대리 AI는 특정 목표를 제한된 감독 하에 달성할 수 있는 자율적인 인공지능 시스템이다. 이는 인간의 의사결정을 모방하여 실시간으로 문제를 해결하는 AI 에이전트로 구성된다.
agentic model
에이전틱 모델
에이전틱 모델은 주어진 명령이나 문제를 단순히 한 번에 처리하는 것이 아니라, 여러 단계에 걸쳐 스스로 계획을 세우고, 도구를 사용하며, 중간 결과를 바탕으로 다음 행동을 결정하는 인공지능 모델을 말합니다. 주로 복…
Agentic workflows
에이전트 워크플로우
에이전트 워크플로우는 여러 개의 전문화된 AI 에이전트가 서로 상호작용하며 계획·추론·도구 사용을 통해 다단계 문제를 자율적으로 해결하도록 설계된 동적 작업 흐름을 말한다. 단일 에이전트나 고정된 순서의 정적 플로우…
AI accelerator
AI 가속기
AI 가속기는 인공지능(AI)과 머신러닝(ML) 작업을 빠르고 효율적으로 처리하기 위해 특별히 설계된 하드웨어 장치입니다. 일반적인 CPU와 달리, 대규모 행렬 연산과 병렬 처리를 최적화하여 신경망 학습과 추론 속도…
AI chip
AI 칩
AI 칩은 인공지능(AI) 및 머신러닝(ML) 작업을 빠르고 효율적으로 처리하도록 특별히 설계된 집적 회로(IC)입니다. 일반적인 중앙처리장치(CPU)와 달리, AI 칩은 대규모 데이터 연산과 복잡한 신경망 모델 실…
AI ecosystem
AI 생태계
AI 생태계는 인공지능 기술의 개발, 배포, 사용을 지원하는 다양한 구성 요소와 이해관계자들의 네트워크를 의미한다.
AI fraud
AI 사기
AI 사기는 인공지능 기술을 활용하여 사기 행위를 탐지하고 방지하는 방법을 말한다. 이는 대량의 데이터를 분석하여 의심스러운 패턴과 행동을 실시간으로 식별한다.
AI model development
AI 모델 개발
AI 모델 개발은 데이터를 처리하고 패턴을 인식하며 예측하거나 자동으로 결정을 내리는 인공지능 모델을 설계, 훈련, 최적화하는 과정입니다. 이 과정은 적절한 알고리즘 선택, 데이터셋 준비, 반복적인 테스트와 검증을 …
AI robotics
AI 로보틱스
AI 로보틱스는 인공지능(AI) 기술을 로봇에 적용하여, 로봇이 스스로 주변 환경을 인식하고, 학습하며, 상황에 맞게 판단하고 행동할 수 있도록 만드는 융합 기술입니다. 기존의 단순 반복 작업만 하던 로봇과 달리, …
AI vision
AI 비전
AI 비전은 인공지능 기술을 활용해 이미지나 영상을 분석하고 이해하는 기술로, 기존의 규칙 기반 머신 비전보다 복잡하고 다양한 시각적 문제를 자동으로 해결할 수 있습니다. 주로 딥러닝을 이용해 사물 인식, 결함 탐지…
AI-native framework
AI 네이티브 프레임워크
AI 네이티브 프레임워크는 인공지능을 핵심 구성 요소로 처음부터 설계된 시스템이나 프로세스를 의미하며, AI 기능이 시스템의 모든 부분에 깊이 통합되어 있다.
AI-powered filmmaking tools
AI 기반 영화 제작 도구
AI 기반 영화 제작 도구는 인공지능 기술을 활용하여 영화 제작 과정의 여러 단계를 자동화하거나 향상시키는 소프트웨어 및 시스템입니다. 이러한 도구는 시나리오 작성, 편집, 시각 효과 생성 등 다양한 분야에서 활용됩…
Anthropic
앤트로픽
앤트로픽은 샌프란시스코에 본사를 둔 인공지능 안전·연구 기업으로, 대규모 언어 모델 제품군인 Claude를 개발하고 ‘신뢰할 수 있고, 해석 가능하며, 제어 가능한’ AI 시스템을 만드는 것을 목표로 한다. 공익기업…
Attention Is All You Need
어텐션 이즈 올 유 니드
어텐션 이즈 올 유 니드는 Transformer 모델을 소개한 논문으로, 자연어 처리에서의 혁신적인 접근 방식을 제안합니다.
AUC (Area Under the Curve)
곡선 아래 면적
AUC는 ROC 곡선 아래의 면적을 나타내며, 모델의 분류 성능을 평가하는 지표로 사용됩니다.
battery life
배터리 수명
배터리 수명은 전자기기나 시스템에서 배터리가 한 번 충전으로 사용할 수 있는 시간 또는 전체적으로 사용할 수 있는 기간을 의미합니다. AI 및 IT 분야에서는 배터리 수명이 기기의 성능, 사용 경험, AI 기능의 지…
Bedrock
베드록
아마존 베드록은 다양한 제공사의 대형 언어·생성 모델을 하나의 관리형 서비스로 제공하고, 통합 API로 추론, 임베딩, 에이전트/플로우, 지식 베이스 등을 운영할 수 있게 해주는 AWS 서비스다. 최근에는 OpenA…
benchmark tests
벤치마크 테스트
벤치마크 테스트는 컴퓨터 시스템이나 소프트웨어의 성능을 평가하기 위해 표준화된 테스트를 수행하는 과정입니다.
BERT
버트
BERT는 2018년 Google이 공개한 트랜스포머 기반의 양방향 언어 표현 모델로, 문장을 왼쪽과 오른쪽 방향을 동시에 고려해 단어의 문맥을 이해하도록 사전학습(pretraining)한 뒤 다양한 NLP 태스크에…
cloud AI infrastructure
클라우드 AI 인프라
클라우드 AI 인프라는 인공지능(AI) 모델의 개발, 학습, 배포, 운영을 위해 클라우드 환경에서 제공되는 컴퓨팅 자원(서버, GPU, TPU 등), 스토리지, 네트워크, 소프트웨어 플랫폼을 통합한 기반 시스템을 의…
combinator library
조합자 라이브러리
조합자 라이브러리는 여러 개의 작은 함수나 모듈(조합자)을 조립해 복잡한 동작을 쉽게 만들 수 있도록 도와주는 소프트웨어 라이브러리입니다. 주로 인공지능 에이전트, 데이터 처리, 파싱 등에서 다양한 기능을 유연하게 …
content accuracy
콘텐츠 정확도
콘텐츠 정확도는 정보가 사실과 얼마나 일치하는지를 측정하는 기준으로, 데이터의 신뢰성과 품질을 평가하는 데 사용됩니다.
content hallucination
콘텐츠 환각
콘텐츠 환각은 AI 모델이 실제로 존재하지 않는 정보를 생성하거나 잘못된 정보를 제공하는 현상을 말합니다.
content recommendations
콘텐츠 추천
콘텐츠 추천은 AI 알고리즘을 사용하여 사용자 데이터를 분석하고, 사용자가 관심을 가질 만한 콘텐츠를 예측하여 제안하는 시스템이다.
cross-platform AI
크로스 플랫폼 AI
크로스 플랫폼 AI는 특정 운영체제나 기기에 제한되지 않고, 다양한 플랫폼(예: iOS, Android, Windows, 웹 등)에서 동일하게 동작하거나 서비스를 제공할 수 있는 인공지능 기술 또는 시스템을 의미합니…
data misinterpretation
데이터 오해
데이터 오해는 데이터를 잘못 해석하여 잘못된 결론이나 결정을 내리는 것을 의미합니다.
deep learning architecture
딥 러닝 아키텍처
딥 러닝 아키텍처는 인공 신경망의 구조와 설계를 의미하며, 데이터 처리와 학습을 위한 다양한 계층과 연결 방식을 포함합니다.
driver optimization
드라이버 최적화
드라이버 최적화는 인공지능(AI) 기술을 활용해 운전자(드라이버)의 경로, 운전 습관, 업무 배분 등을 효율적으로 개선하는 과정입니다. 이를 통해 연료 소모, 배송 시간, 안전성 등 다양한 운영 지표를 향상시킬 수 …
ecosystem integration
생태계 통합
생태계 통합은 AI, 소프트웨어, 하드웨어 등 다양한 기술과 서비스가 하나의 플랫폼이나 환경에서 유기적으로 연결되어 작동하도록 만드는 전략 또는 기술을 의미한다. 이는 단일 제품이 아니라, 여러 서비스와 앱, 기기,…
edge AI
엣지 AI
엣지 AI는 인공지능(AI) 모델이나 알고리즘을 클라우드 서버가 아닌 사용자 가까이에 위치한 엣지(Edge) 디바이스에서 직접 실행하는 기술입니다. 이를 통해 데이터가 생성된 현장에서 실시간으로 분석과 의사결정을 내…
edge deployment
에지 배포
에지 배포는 AI 모델이나 애플리케이션을 중앙 데이터센터나 퍼블릭 클라우드가 아닌 사용자가 가까이 있는 현장 장비, 통신국사, 기지국, 지역 엣지 데이터센터 등에 배치해 추론을 수행하는 방식이다. 이 방식은 지연시간…
Edge inference
엣지 추론
엣지 추론은 인공지능 모델이 중앙 클라우드가 아닌, 사용자의 가까운 위치(엣지 디바이스나 로컬 서버)에서 직접 데이터를 처리하고 예측 결과를 내는 기술입니다. 이를 통해 실시간 반응성과 낮은 지연 시간, 그리고 클라…
embedding
임베딩
임베딩은 복잡한 데이터를 기계 학습 알고리즘이 쉽게 처리할 수 있도록 저차원 공간에 표현하는 수학적 방법입니다.
Floating-point operations (FLOPs)
부동소수점 연산
부동소수점 연산(Floating-point operations, FLOPs)은 소수점이 포함된 숫자(예: 3.14, 0.0001) 사이에서 이루어지는 덧셈, 곱셈 등과 같은 수학적 계산을 의미합니다. AI, 과학 계…
foundation model
기초 모델
기초 모델은 대량의 데이터로 사전 학습되어 다양한 작업에 적용할 수 있는 대규모 AI 모델을 의미합니다.
gaming industry
게임 산업
게임 산업은 비디오 게임의 개발, 마케팅, 판매를 포함하는 산업으로, 최근에는 인공지능(AI)의 도입으로 큰 변화를 겪고 있다.
Gemini
제미나이
Gemini는 Google이 개발한 멀티모달 대규모 언어 모델(LLM) 계열과 이를 기반으로 한 챗봇/앱을 가리키며, 텍스트뿐 아니라 이미지, 오디오, 비디오, 코드 등 다양한 형태의 입력을 이해하고 생성할 수 있도…
Gemini 3.1
제미니 3.1
제미니 3.1은 구글이 개발한 대규모 멀티모달 인공지능 모델로, 텍스트, 이미지, 음성 등 다양한 형태의 데이터를 동시에 이해하고 처리할 수 있도록 설계된 최신 AI 모델입니다. 이 모델은 이전 버전보다 더 빠르고 …
Gemma 4
젬마 4
젬마 4는 Google DeepMind가 공개한 경량 오픈 가중치 대규모 언어 모델(LLM) 계열의 최신 버전으로, 에이전트 실행에 유리한 함수 호출과 구조적 JSON 출력 같은 기능을 기본 지원하며, 경량 하드웨어…
geothermal energy
지열 에너지
지열 에너지는 지구 내부의 열을 이용하여 전기나 열을 생산하는 에너지원으로, 지속 가능하고 청정한 에너지원으로 주목받고 있다.
GPT-4o
GPT-4o
GPT-4o는 OpenAI가 개발한 최신 대형 언어 모델로, 텍스트, 음성, 이미지 등 다양한 입력을 동시에 이해하고 처리할 수 있는 멀티모달 AI 모델이다. 기존 GPT-4 대비 더 빠르고, 다양한 입력 방식에 대…
GPT-5.4
GPT-5.4
GPT-5.4는 OpenAI에서 개발한 최신 대규모 언어 모델로, 이전 버전보다 더 복잡한 문장과 다양한 주제를 이해하고 생성할 수 있는 인공지능 모델이다. 주로 텍스트 생성, 요약, 번역, 코드 작성 등 다양한 A…
grouped-query attention
그룹 쿼리 어텐션
그룹 쿼리 어텐션은 대규모 언어 모델(LLM)이나 트랜스포머 모델에서 여러 쿼리(query)를 그룹으로 묶어 효율적으로 어텐션 연산을 처리하는 기술이다. 이 방식은 계산량과 메모리 사용을 줄이면서도 기존 어텐션 구조…
hallucination
환각
인공지능 환각은 대규모 언어모델(LLM)이나 생성형 AI가 실제로 존재하지 않거나 사실과 다른 내용을 그럴듯하게 만들어 내는 현상이다. 이는 모델이 학습 데이터의 패턴을 바탕으로 다음에 올 말을 예측하는 과정에서 검…
Hardware utilization
하드웨어 활용도
하드웨어 활용도는 컴퓨터 시스템의 CPU, GPU, 메모리 등 물리적 자원이 실제로 얼마나 효율적으로 사용되고 있는지를 나타내는 지표입니다. AI 및 IT 분야에서는 주어진 하드웨어가 최대한의 성능을 발휘하도록 자원…
inference cost
추론 비용
추론 비용은 학습이 끝난 AI 모델에 데이터를 넣어 예측, 생성, 분류 같은 결과를 얻는 데 드는 운영 비용을 뜻한다. 특히 LLM에서는 프롬프트와 응답이 만들어내는 모든 토큰이 연산을 소모해, 사용량과 처리량이 늘…
inference latency
추론 지연 시간
추론 지연 시간은 AI 모델이 입력을 받아서 결과를 내놓기까지 걸리는 실제 시간입니다. 주로 챗봇, 코드 생성기, 이미지 분석 등에서 사용자가 요청을 보낸 순간부터 AI가 답을 돌려줄 때까지의 대기 시간을 의미하며,…
Inference pipeline
추론 파이프라인
추론 파이프라인은 학습이 완료된 AI 모델이 실제 데이터를 받아 예측 결과를 내기까지 거치는 일련의 처리 단계를 의미합니다. 데이터 전처리, 모델 추론, 후처리 등 여러 과정을 순차적으로 연결해, AI가 실제 서비스…
inference workload
추론 워크로드
추론 워크로드란 이미 학습된 인공지능 모델이 실제 환경에서 새로운 데이터를 받아 예측, 분류, 생성 등 결과를 내는 작업의 집합을 의미합니다. 이는 AI가 실제로 서비스를 제공할 때 발생하는 계산 작업으로, 모델 학…
just-in-time access
즉시 접근
즉시 접근은 필요한 작업을 수행할 때에만 사람이나 비인간 주체에게 시간 제한적이고 작업 특정적인 권한을 부여하고, 작업이 완료되면 즉시 그 권한을 철회하는 접근 제어 방식이다.
knowledge base
지식 기반
지식 기반은 정보를 효율적으로 저장, 조직화, 검색하는 시스템으로, AI 기술을 활용하여 사용자 의도를 이해하고 자동화된 응답을 제공한다.
Latent MoE
잠재적 전문가 혼합
Latent MoE는 표준 MoE(전문가 혼합)에서 각 전문가 계산을 모델의 전체 숨김 차원이 아닌 더 낮은 차원의 잠재 공간으로 투영해 수행한 뒤 다시 원래 차원으로 되돌리는 구조다. 동일한 희소 라우팅을 유지하면…
live audio translation
실시간 음성 번역
실시간 음성 번역은 사용자가 말하는 소리를 인공지능이 즉시 인식하여, 다른 언어로 번역한 뒤 바로 음성이나 텍스트로 제공하는 기술입니다. 이 과정은 음성 인식, 기계 번역, 음성 합성 등 여러 AI 기술이 결합되어 …
LLM
대규모 언어 모델
대규모 언어 모델(LLM)은 방대한 텍스트 데이터로 학습된 딥러닝 모델로, 인간 언어를 이해하고 생성하는 데 특화되어 있다. 주로 트랜스포머 아키텍처와 자기-어텐션을 사용하며, 다음 단어 예측 같은 자기지도 학습과 …
Mercor APEX-Agents benchmark
메르코르 APEX-에이전트 벤치마크
메르코르 APEX-에이전트 벤치마크는 인공지능 에이전트의 성능을 평가하기 위한 표준화된 테스트 세트입니다. 다양한 환경에서 에이전트의 효율성과 능력을 측정하는 데 사용됩니다.
mixture of experts
전문가 혼합
전문가 혼합은 여러 개의 특화된 AI 모델(전문가) 중에서 상황에 따라 가장 적합한 모델을 선택하거나 조합해 문제를 푸는 인공지능 구조다. 각 전문가 모델은 특정 유형의 데이터나 작업에 특화되어 있으며, 전체 시스템…
Model parallelism
모델 병렬 처리
모델 병렬 처리는 하나의 대형 인공지능 모델을 여러 장치(예: 여러 GPU)로 나누어 각 장치가 모델의 일부 연산을 담당하도록 분산시키는 기술입니다. 주로 모델이 너무 커서 한 대의 장치 메모리에 모두 올릴 수 없을…
multi-agent system
다중 에이전트 시스템
다중 에이전트 시스템은 여러 개의 인공지능 에이전트가 동일한 환경에서 각자 또는 협력하여 특정 목표를 달성하기 위해 상호작용하는 시스템입니다. 각 에이전트는 독립적으로 의사결정을 내리거나, 정보를 교환하며 전체적으로…
multi-hop retrieval
다중 홉 검색
다중 홉 검색은 AI가 복잡한 질문에 답할 때, 한 번에 하나의 정보만 찾는 것이 아니라 여러 단계(홉)에 걸쳐 연관된 정보를 차례로 검색해 최종 답을 도출하는 기술입니다. 주로 대형 언어 모델(LLM)이나 복잡한 …
multi-layer convolutional neural network
다층 합성곱 신경망
다층 합성곱 신경망은 여러 개의 합성곱 층을 쌓아 복잡한 패턴을 인식하고 학습하는 인공 신경망의 한 종류입니다.
Multi-modal model
멀티모달 모델
멀티모달 모델은 텍스트, 이미지, 오디오, 비디오 등 여러 종류의 데이터를 동시에 처리하고 통합하여 더 풍부하고 정확한 결과를 만들어내는 인공지능 모델입니다. 기존의 단일 데이터 타입만 다루는 모델과 달리, 다양한 …
Multi-silicon inference
멀티 실리콘 추론
멀티 실리콘 추론은 AI 모델의 추론 과정을 CPU, GPU, 고용량 메모리 서버 등 다양한 종류의 하드웨어(실리콘)에서 동시에 분산 실행하여, 에너지 효율과 처리 속도를 극대화하는 기술입니다. 이 방식은 기존 단일…
multi-stage training
다단계 학습
다단계 학습은 AI 모델, 특히 대형 언어 모델(LLM)을 개발할 때 여러 단계에 걸쳐 데이터를 다르게 활용하며 점진적으로 모델을 개선하는 학습 방식이다. 각 단계는 사전학습, 중간학습, 후학습 등으로 나뉘며, 각 …
multimodal
멀티모달
멀티모달은 텍스트, 이미지, 오디오, 비디오 등 서로 다른 형태(모달리티)의 데이터를 동시에 처리하고 통합해 더 정확하고 풍부한 이해를 만드는 인공지능 접근이다. 각 모달의 정보를 정렬·융합하여 단일 모달보다 더 강…
multimodal model
멀티모달 모델
멀티모달 모델은 텍스트, 이미지, 음성 등 여러 종류의 데이터를 동시에 이해하고 처리할 수 있는 인공지능 모델이다. 이 모델은 다양한 형태의 정보를 결합해 더 복잡한 문제를 해결하며, 최근에는 수학, 과학, UI 이…
native computer use
네이티브 컴퓨터 사용
네이티브 컴퓨터 사용은 사용자가 컴퓨터나 소프트웨어를 자연스럽고 직관적으로 사용할 수 있도록 설계된 인터페이스나 기능을 의미합니다.
Neuro-symbolic AI
신경-기호 AI
신경-기호 AI는 신경망(딥러닝 등) 기반의 데이터 학습 능력과 기호적(논리, 규칙, 지식 표현 등) 추론 방식을 결합한 인공지능 분야입니다. 이 방식은 패턴 인식과 논리적 추론, 설명 가능성 등 양쪽의 장점을 동시…
NLP
자연어 처리
자연어 처리(NLP)는 컴퓨터가 인간의 언어를 읽고, 이해하고, 생성하도록 만드는 인공지능의 한 분야다. 텍스트와 음성을 분석해 의미를 파악하고 문맥에 맞게 반응하거나 새로운 문장을 만들어내며, 언어학과 머신러닝(특…
Nvidia
엔비디아
엔비디아는 GPU로 알려진 가속 칩과 이를 활용하는 소프트웨어를 제공하는 기술 기업으로, 딥러닝·자연어 처리·컴퓨터 비전 등 AI 작업을 빠르게 처리할 수 있도록 하드웨어부터 플랫폼, 개발 도구까지 아우르는 풀스택 …
on-device AI
온디바이스 AI
온디바이스 AI는 스마트폰, 노트북 등 사용자의 기기 자체에서 인공지능 모델을 실행하는 기술로, 데이터를 클라우드로 보내지 않고도 AI 기능을 사용할 수 있게 해준다. 이 방식은 개인정보 보호와 빠른 응답 속도에서 …
on-device inference
온디바이스 추론
온디바이스 추론은 인공지능 모델이 클라우드 서버가 아니라 스마트폰, 노트북, IoT 기기 등 사용자의 디바이스 내에서 직접 실행되어 결과를 도출하는 기술입니다. 이 방식은 데이터가 외부로 전송되지 않아 개인정보 보호…
open frontier models
오픈 프론티어 모델
오픈 프론티어 모델은 여러 AI 연구소가 협력하여 개발하는 개방형 AI 모델로, 투명성과 협업을 강조하며 다양한 산업에서의 특화된 활용을 목표로 한다.
open-source LLM
오픈소스 대형 언어 모델
오픈소스 대형 언어 모델은 누구나 자유롭게 사용할 수 있도록 소스 코드와 학습된 모델이 공개된 대규모 인공지능 언어 모델을 의미한다. 기업이나 개인이 직접 수정, 배포, 활용할 수 있어 AI 개발의 진입 장벽을 낮추…
open-source models
오픈소스 모델
오픈소스 모델은 모델의 소스 코드, 가중치, 학습 과정과 같은 세부 정보를 공개해 누구나 검사하고, 로컬에서 실행하거나 목적에 맞게 수정·재학습할 수 있는 AI 모델을 말한다. 단순히 API로 사용만 허용하는 ‘오픈…
OpenAI
오픈에이아이
오픈에이아이는 인공지능 연구 조직이자 플랫폼으로, 안전하고 유익한 범용 인공지능(AGI)을 지향하며 대규모 기반 모델과 이를 활용하는 서비스·API를 개발·제공한다. GPT 계열의 대형언어모델, DALL·E, Sor…
output tokens
출력 토큰
출력 토큰은 AI 모델이 입력을 처리한 후 생성하는 텍스트의 조각들로, 모델이 입력 토큰을 기반으로 가장 가능성이 높은 다음 토큰을 예측하여 일관되고 맥락에 맞는 출력을 생성한다.
Oxide LCD
옥사이드 LCD
옥사이드 LCD는 산화물 반도체(주로 IGZO)를 사용한 액정 디스플레이로, 기존 LCD에 비해 전력 소모가 크게 줄고, 1Hz에서 120Hz까지 동적으로 주사율을 조절할 수 있는 최신 기술입니다. 특히 AI 기능이…
post-training
후 훈련
후 훈련은 AI 모델이 초기 데이터셋으로 학습된 후, 성능을 향상시키고 실질적인 요구 사항을 충족하기 위해 모델을 정제하고 최적화하는 과정입니다.
power efficiency
전력 효율
전력 효율은 컴퓨터 시스템이나 AI 하드웨어가 주어진 전력을 얼마나 효과적으로 실제 연산 작업에 사용하는지를 나타내는 지표입니다. 즉, 같은 전력을 사용할 때 더 많은 연산을 처리하거나, 동일한 작업을 더 적은 전력…
pre-training
사전 훈련
사전 훈련은 머신러닝 모델을 대규모의 일반적인 데이터셋으로 초기화하여, 이후 특정 작업에 맞게 미세 조정하는 과정을 의미한다.
processing speed
처리 속도
처리 속도는 컴퓨터나 시스템이 주어진 작업이나 데이터를 얼마나 빠르게 처리할 수 있는지를 나타내는 지표입니다.
PyTorch
파이토치
파이토치는 오픈 소스 딥러닝 프레임워크로, 신경망을 구축하고 학습시키는 데 사용됩니다. 파이썬 기반의 직관적인 인터페이스와 유연성 덕분에 연구자와 개발자 모두에게 널리 사랑받으며, 이미지 인식, 자연어 처리, 생성형…
RAG
검색 증강 생성
검색 증강 생성(RAG)은 대규모 언어 모델이 답을 만들기 전에 외부 지식베이스에서 관련 정보를 먼저 찾아(검색) 그 문맥을 함께 넣어 생성하도록 하는 아키텍처다. 고정된 학습 데이터만으로는 최신성·정확성이 떨어질 …
real-time inference
실시간 추론
실시간 추론은 훈련된 머신러닝 모델이 실시간으로 입력 데이터를 받아 즉각적으로 예측을 생성하는 과정을 의미한다. 이는 시스템이 환경에 신속하게 반응할 수 있게 하여 현대 인공지능 애플리케이션의 핵심 기능을 제공한다.
recurrent mechanism
순환 메커니즘
순환 메커니즘은 인공지능 모델 내부에서 이전 단계의 출력을 다음 단계의 입력으로 다시 사용하는 구조를 의미합니다. 이 방식은 모델이 과거 정보를 기억하거나 반복적으로 처리해야 하는 작업에서 효율성과 성능을 높이는 데…
refresh rate
재생률
재생률은 디스플레이 장치가 1초에 화면 이미지를 몇 번 새로 그리는지를 나타내는 값으로, 단위는 헤르츠(Hz)입니다. 예를 들어 60Hz 재생률은 1초에 60번 화면이 갱신된다는 뜻입니다. 이는 프레임레이트(초당 생…
Retrieval-Augmented Generation
검색 증강 생성
검색 증강 생성(Retrieval-Augmented Generation, RAG)은 대형 언어 모델(LLM)이 답변을 생성하기 전에 외부 지식베이스에서 관련 정보를 검색해 활용하는 인공지능 아키텍처입니다. 이를 통해…
RLHF
인간 피드백 기반 강화학습
인간이 직접 평가하거나 수정한 결과를 바탕으로 AI가 더 나은 행동을 학습하도록 만드는 강화학습 방법입니다. 주로 대형 언어 모델(LLM)에서 자연스러운 답변과 안전성을 높이기 위해 사용됩니다.
Self-Attention
셀프 어텐션
셀프 어텐션은 입력 안의 각 요소가 같은 입력의 다른 모든 요소를 비교해, 무엇에 더 집중해야 하는지 가중치를 계산한 뒤 그 정보를 종합해 새로운 표현을 만드는 메커니즘이다. 트랜스포머에서 핵심 역할을 하며, 멀리 …
self-editing context
셀프 에디팅 컨텍스트
셀프 에디팅 컨텍스트란 코드 생성 AI 모델이 스스로 작성한 코드나 답변을 반복적으로 검토하고 수정하는 과정을 모델 내부에서 직접 수행하는 맥락을 의미합니다. 이 방식은 기존의 한 번에 답을 내는 구조와 달리, AI…
self-verification
자체 검증
자체 검증은 인공지능 모델이 자신의 출력 결과를 스스로 평가하고 검증하는 과정입니다. 이 방식은 모델이 생성한 답변이나 예측이 사실에 맞는지, 오류나 환각(hallucination)이 없는지 내부적으로 점검하는 다양…
supervised fine-tuning
지도 미세 조정
지도 미세 조정은 이미 사전학습된 AI 모델에 사람이 직접 정답을 달아준 데이터(라벨링 데이터)를 추가로 학습시켜, 특정 작업이나 목적에 더 잘 맞게 성능을 높이는 과정입니다. 이 방식은 모델이 실제로 원하는 답을 …
sustainable energy
지속 가능한 에너지
지속 가능한 에너지는 환경에 해를 끼치지 않으면서도 장기적으로 사용할 수 있는 에너지를 의미하며, 주로 재생 가능 에너지원에서 얻어집니다.
TensorFlow
텐서플로우
텐서플로우는 구글 브레인 팀이 개발한 오픈소스 머신러닝 및 딥러닝 프레임워크로, 수치 계산과 대규모 인공지능 모델 학습·추론을 효율적으로 지원합니다. 텐서플로우는 데이터 흐름 그래프 구조를 기반으로 다양한 하드웨어(…
token usage
토큰 사용
토큰 사용은 AI 모델이나 API에서 특정 작업을 수행하기 위해 사용되는 단위인 '토큰'의 사용량을 나타낸다. 이는 주로 자연어 처리에서 텍스트를 분할하여 처리하는 데 사용된다.
Transformer
트랜스포머
트랜스포머는 입력 시퀀스(텍스트, 음성 등) 내 각 토큰이 서로를 **self-attention**으로 참조하도록 설계된 신경망 아키텍처로, 전체 시퀀스를 병렬 처리하며 번역, 요약, 분류, 텍스트 생성 같은 작업을…
verification-centric agents
검증 중심 에이전트
검증 중심 에이전트는 AI가 스스로 답을 내기 전에 중간 단계마다 결과를 점검하고, 최종적으로도 근거가 충분한지 확인하는 구조를 갖춘 인공지능 시스템을 말합니다. 이 방식은 단순히 답을 생성하는 기존 AI와 달리, …
vision-language model
비전-언어 모델
비전-언어 모델은 이미지, 그림, 차트 등 시각 정보와 텍스트(언어) 정보를 동시에 이해하고 처리할 수 있도록 설계된 인공지능 모델이다. 이 모델은 사진을 보고 설명을 하거나, 차트 이미지를 분석해 답을 내는 등 다…