제01권 · 제10호 CS · AI · Infra 2026년 5월 13일

AI 용어집

용어 사전레퍼런스학습
LLM · 생성AI

Context Engineering컨텍스트 엔지니어링

난이도

쉽게 이해하기

LLM 에이전트가 프로토타입에선 잘 되다가 실제 서비스에서 실패하는 큰 이유는, 모델이 봐야 할 맥락이 빠지거나 형식이 흐트러져 잘못된 행동을 고르는 경우가 많기 때문입니다. 같은 질문이라도 누가, 어떤 권한으로, 어떤 자료를 근거로 답해야 하는지가 달라지는데, 이 정보가 입력에 정리되어 있지 않으면 모델은 손쉬운 추측을 합니다. 결과는 엉뚱한 도구 호출, 오래된 답변, 불필요하게 긴 응답 시간으로 이어집니다. 컨텍스트 엔지니어링은 이런 문제를 “입력 설계”로 풀어냅니다. 안내 데스크 직원이 손님 정보, 요청서, 내부 매뉴얼, 사용 가능한 설비 목록을 한 장에 정리해 담당자에게 넘기는 것과 비슷합니다. 모델이 읽을 지시문, 대화 이력, 검색으로 찾은 스니펫, 사용할 수 있는 도구와 그 설명, 그리고 출력 형식을 한데 모아 ‘한 턴’의 컨텍스트로 꾸려 넣는 겁니다. 구체적으로는 에이전트 루프의 각 단계에서 컨텍스트를 다룹니다. 모델 호출 전에 시스템 지시문을 현재 상황에 맞게 갱신하고, 대화 이력과 필요한 스니펫만 압축해 넣습니다. 도구 단계에선 어떤 도구가 보일지와 입력 스키마, 기본 인자를 제한해 모델의 선택지를 관리합니다. 여러 턴에 걸쳐서는 요약·리마인더·메모리를 통해 중요한 정보만 남기고, 기록과 권한 같은 런타임 상태는 지속적으로 유지합니다.

비유와 예시

  • 권한에 따른 답변 통제: 관리자는 요금 변경이 가능하지만 뷰어는 읽기 전용인 상황입니다. 시스템 지시문에 역할별 허용 작업을 넣고, 도구 스키마에 기본 필터를 고정하여 모델이 위험한 호출을 선택하지 않도록 합니다.
  • 지식형 상담 에이전트: 문서 저장소에서 검색한 스니펫을 재정렬·요약해 짧은 증거 묶음으로 전달합니다. 긴 본문을 그대로 넣지 않고, 필요한 문단만 인용과 출처를 포함해 컨텍스트 창에 배치합니다.
  • 긴 세션 관리: 30턴이 넘는 대화에서는 초반 맥락이 흐려집니다. 이전 내용을 요약해 리마인더로 남기고, 오래된 세부사항은 컴팩션으로 숨겨 비용과 지연을 줄입니다.

한눈에 비교

컨텍스트 엔지니어링프롬프트 엔지니어링RAG
범위한 턴의 전체 입력 설계(지시문·이력·도구·스니펫)지시문/템플릿 문구 최적화외부 지식 검색·주입
주된 레버도구 가시성, 출력 스키마, 세션 관리톤·규칙·예시 작성인덱싱, 검색, 리랭킹
데이터 소스상태/스토어/런타임 설정 포함주로 고정 텍스트문서 코퍼스/메타데이터
지속성일시+지속 컨텍스트 모두 다룸일시 컨텍스트 중심검색 결과는 일시적
비용/지연토큰·도구 호출을 함께 관리프롬프트 길이 관리검색/리랭킹 비용 영향

컨텍스트 엔지니어링은 프롬프트와 RAG를 포괄해 ‘무엇을 얼마나 어떤 형식으로’ 넣을지 결정하는 상위 설계입니다.

어디서 왜 중요한가

  • 에이전트 실패 원인 교정: 모델 능력보다 ‘맞는 컨텍스트 부재’가 신뢰성을 해치는 주된 이유로 지적되며, 입력을 재설계해 성공률을 끌어올리는 실무가 자리잡았습니다.
  • 검색 품질 우선 문화: 지식형 에이전트에선 검색 스니펫의 품질이 답변 상한을 결정하므로, 인덱싱·필터·리랭킹을 먼저 튜닝하는 순서가 정착되었습니다.
  • 지시문을 명세처럼 관리: 운영 중 발견된 실패는 지시문 한 줄 수정으로 해결되는 경우가 많아, 버전 관리와 런타임 변수 템플릿화가 권장됩니다.
  • 도구 노출과 스키마 제어: 단계별 허용 도구와 인자 고정으로 잘못된 선택과 비용 급증을 방지하는 패턴이 확산되었습니다.
  • 세션 장기화 대응: 요약·리마인더·컴팩션으로 토큰 비용과 지연을 억제하며, 모니터링과 반복 개선이 상시 업무로 편입되었습니다.

자주 하는 오해

  • ❌ 오해: "좋은 한 줄 프롬프트면 충분하다" → ✅ 실제: 지시문뿐 아니라 이력, 도구, 스니펫, 출력 형식까지 함께 설계해야 안정성이 올라갑니다.
  • ❌ 오해: "검색만 붙이면 품질이 오른다" → ✅ 실제: 검색 스니펫의 선별·요약·배치가 핵심이며, 부적절한 조립은 오히려 잡음을 늘립니다.
  • ❌ 오해: "도구는 많이 보일수록 똑똑하다" → ✅ 실제: 단계별로 필요한 도구만 노출하고 스키마를 좁혀야 잘못된 선택과 비용 폭주를 막습니다.

대화에서는 이렇게

  • "이번 릴리스에서 시스템 지시문 버전을 올리고, 요금 문의는 등급 확인 절차를 필수 규칙으로 추가합시다."
  • "리서치 단계에선 web_search만 허용하고 요약 단계는 검색을 숨겨 프롬프트를 가볍게 하죠."
  • "30턴 넘어가면 실패율이 오르니, 리마인더 삽입과 이력 컴팩션을 15턴마다 강제할게요."
  • "검색 스니펫 MMR 리랭킹 켜고, 길이는 총 1,200토큰으로 캡을 두면 지연이 안정됩니다."
  • "비용 튀는 케이스는 툴 인자 고정(argument override)으로 외부 API 범위를 좁혀보죠."

함께 읽으면 좋은 용어

참고 자료

도움이 되었나요?