제01권 · 제10호 CS · AI · Infra 2026년 5월 14일

AI 용어집

용어 사전레퍼런스학습
LLM · 생성AI

Agent Loop에이전트 루프

난이도

쉽게 이해하기

복잡한 일을 한 번에 끝내기 어려운 이유는, 중간중간 계획을 바꾸고 다음 행동을 골라야 하기 때문입니다. 챗봇처럼 한 번 묻고 한 번 답하는 구조만으로는 웹을 검색하고, 파일을 읽고, 다시 계산하는 여러 단계를 스스로 연결하기 어렵습니다. 이런 문제를 해결하는 방식이 바로 에이전트 루프입니다. 비유하자면, 비서가 보고서를 만들 때 ‘자료 찾기 → 요약하기 → 표 채우기 → 검토’처럼 체크리스트를 돌며 매 단계 결과를 보고 다음 할 일을 정하는 흐름입니다. 에이전트도 매 턴마다 “무슨 도구를 쓸까?”, “끝낼 수 있을까?”를 스스로 묻고 결정합니다. 필요하면 사람에게 승인을 요청하고, 예산이 부족하면 멈춥니다. 구체적으로는 한 반복에서 문맥을 조립하고(세션 기록, 메모리, 시스템 프롬프트), LLM이 다음 행동을 고르면 도구를 실행해 결과를 얻습니다. 그 결과는 세션 상태에 영속 저장되어 다음 반복의 입력이 됩니다. 운영 환경에서는 이 반복이 내구성 있게 체크포인트로 기록되고, 반복 횟수·토큰 예산·종료 신호 등 조건으로 루프를 제어합니다.

비유와 예시

  • 장애 대응 런북 실행: 에이전트가 모니터링 경보를 읽고 로그 조회 도구를 호출한 뒤, 결과를 분석해 다음 점검 항목을 선택합니다. 충분한 증거가 모이면 보고서를 정리하고 루프를 종료합니다.
  • 분석 리서치 보조: 문헌 검색 도구로 자료를 모으고, 요약 후 공백을 확인해 추가 검색을 반복합니다. 인용이 충분하고 질문에 답할 수 있으면 최종 답안을 반환합니다.
  • 코딩 작업 순환: 요구사항을 읽고 파일 시스템 도구로 코드를 수정한 후 테스트를 실행합니다. 실패 로그를 관찰해 수정 계획을 갱신하고, 테스트가 통과하면 PR 요약을 작성하며 종료합니다.

한눈에 비교

에이전트 루프단발성 챗봇 응답배치 워크플로우
흐름생각→행동→관찰 반복1회 질의→응답미리 정해진 단계 순차 실행
결정 주체LLM이 매 턴 다음 행동 선택없음(단일 답변)설계자가 고정 정의
도구 사용런타임 선택/병렬/재시도보통 없음단계별 고정 호출
상태/메모리세션에 누적·압축·전달대화 기록 일부작업 간 공유 제한적
제어/안전장치반복 제한·예산·휴먼 게이트길이 제한 정도재시도·타임아웃 위주

에이전트 루프는 실행 중에 행동을 스스로 선택·수정할 수 있어 불확실한 과제를 단계적으로 완성하는 데 유리합니다.

어디서 왜 중요한가

  • 내구 체크포인트 도입: 각 반복의 프롬프트, 도구 I/O, 타이밍이 저장되어 중단 후 같은 지점에서 재개가 가능합니다.
  • 세션 직렬화 관행: 세션별 큐로 실행을 직렬화해 도구·메시지 경합을 방지하고 대화 기록의 일관성을 유지합니다.
  • 휴먼 승인 게이트 확산: 고위험 도구 호출 전 승인 단계를 삽입해 운영 안전성과 책임 경계를 분명히 합니다.
  • 예산·반복 상한 관리: 토큰/비용 누적을 추적해 예산을 넘기기 전 종료하거나 요약·압축을 트리거합니다.
  • 관측 가능성 강화: 반복별 스텝을 분리해 재시도·실패 원인을 추적하고, 병렬 도구 실행 시 병목을 파악합니다.

자주 하는 오해

  • ❌ 오해: 에이전트 루프는 무한히 돌며 자율적으로 완수한다 → ✅ 실제: 명시적 종료 조건, 반복/예산 상한, 타임아웃으로 제어합니다.
  • ❌ 오해: 모델이 곧바로 외부 시스템을 조작한다 → ✅ 실제: 호스트가 도구를 실행하고, 필요 시 휴먼 승인을 거칩니다.
  • ❌ 오해: 메모리는 대화 전체를 그대로 보관한다 → ✅ 실제: 컨텍스트 창을 고려해 중간 기록을 요약·압축하고 필요한 핵심만 유지합니다.

대화에서는 이렇게

  • "이번 에이전트 루프는 6턴 만에 종료됐고, 도구 호출은 3회였어요. 병목은 2번째 LLM 호출에서 나왔습니다."
  • "보안 이슈라 4단계에서 휴먼 승인 게이트를 켰고, 승인 후에만 배포 API를 치도록 했습니다."
  • "토큰 예산 체크가 빨리 걸려서 중간에 컨텍스트 압축을 한 번 넣었더니 비용이 안정됐어요."
  • "같은 세션 레인에서만 실행되게 직렬화했더니 중복 댓글 전송이 사라졌습니다."
  • "실패 시에만 해당 스텝 재시도가 돌게 분리했더니, LLM 재호출 없이 도구만 재실행돼 안정적입니다."

함께 읽으면 좋은 용어

참고 자료

도움이 되었나요?