Agent Loop에이전트 루프
쉽게 이해하기
복잡한 일을 한 번에 끝내기 어려운 이유는, 중간중간 계획을 바꾸고 다음 행동을 골라야 하기 때문입니다. 챗봇처럼 한 번 묻고 한 번 답하는 구조만으로는 웹을 검색하고, 파일을 읽고, 다시 계산하는 여러 단계를 스스로 연결하기 어렵습니다. 이런 문제를 해결하는 방식이 바로 에이전트 루프입니다. 비유하자면, 비서가 보고서를 만들 때 ‘자료 찾기 → 요약하기 → 표 채우기 → 검토’처럼 체크리스트를 돌며 매 단계 결과를 보고 다음 할 일을 정하는 흐름입니다. 에이전트도 매 턴마다 “무슨 도구를 쓸까?”, “끝낼 수 있을까?”를 스스로 묻고 결정합니다. 필요하면 사람에게 승인을 요청하고, 예산이 부족하면 멈춥니다. 구체적으로는 한 반복에서 문맥을 조립하고(세션 기록, 메모리, 시스템 프롬프트), LLM이 다음 행동을 고르면 도구를 실행해 결과를 얻습니다. 그 결과는 세션 상태에 영속 저장되어 다음 반복의 입력이 됩니다. 운영 환경에서는 이 반복이 내구성 있게 체크포인트로 기록되고, 반복 횟수·토큰 예산·종료 신호 등 조건으로 루프를 제어합니다.
비유와 예시
- 장애 대응 런북 실행: 에이전트가 모니터링 경보를 읽고 로그 조회 도구를 호출한 뒤, 결과를 분석해 다음 점검 항목을 선택합니다. 충분한 증거가 모이면 보고서를 정리하고 루프를 종료합니다.
- 분석 리서치 보조: 문헌 검색 도구로 자료를 모으고, 요약 후 공백을 확인해 추가 검색을 반복합니다. 인용이 충분하고 질문에 답할 수 있으면 최종 답안을 반환합니다.
- 코딩 작업 순환: 요구사항을 읽고 파일 시스템 도구로 코드를 수정한 후 테스트를 실행합니다. 실패 로그를 관찰해 수정 계획을 갱신하고, 테스트가 통과하면 PR 요약을 작성하며 종료합니다.
한눈에 비교
| 에이전트 루프 | 단발성 챗봇 응답 | 배치 워크플로우 | |
|---|---|---|---|
| 흐름 | 생각→행동→관찰 반복 | 1회 질의→응답 | 미리 정해진 단계 순차 실행 |
| 결정 주체 | LLM이 매 턴 다음 행동 선택 | 없음(단일 답변) | 설계자가 고정 정의 |
| 도구 사용 | 런타임 선택/병렬/재시도 | 보통 없음 | 단계별 고정 호출 |
| 상태/메모리 | 세션에 누적·압축·전달 | 대화 기록 일부 | 작업 간 공유 제한적 |
| 제어/안전장치 | 반복 제한·예산·휴먼 게이트 | 길이 제한 정도 | 재시도·타임아웃 위주 |
에이전트 루프는 실행 중에 행동을 스스로 선택·수정할 수 있어 불확실한 과제를 단계적으로 완성하는 데 유리합니다.
어디서 왜 중요한가
- 내구 체크포인트 도입: 각 반복의 프롬프트, 도구 I/O, 타이밍이 저장되어 중단 후 같은 지점에서 재개가 가능합니다.
- 세션 직렬화 관행: 세션별 큐로 실행을 직렬화해 도구·메시지 경합을 방지하고 대화 기록의 일관성을 유지합니다.
- 휴먼 승인 게이트 확산: 고위험 도구 호출 전 승인 단계를 삽입해 운영 안전성과 책임 경계를 분명히 합니다.
- 예산·반복 상한 관리: 토큰/비용 누적을 추적해 예산을 넘기기 전 종료하거나 요약·압축을 트리거합니다.
- 관측 가능성 강화: 반복별 스텝을 분리해 재시도·실패 원인을 추적하고, 병렬 도구 실행 시 병목을 파악합니다.
자주 하는 오해
- ❌ 오해: 에이전트 루프는 무한히 돌며 자율적으로 완수한다 → ✅ 실제: 명시적 종료 조건, 반복/예산 상한, 타임아웃으로 제어합니다.
- ❌ 오해: 모델이 곧바로 외부 시스템을 조작한다 → ✅ 실제: 호스트가 도구를 실행하고, 필요 시 휴먼 승인을 거칩니다.
- ❌ 오해: 메모리는 대화 전체를 그대로 보관한다 → ✅ 실제: 컨텍스트 창을 고려해 중간 기록을 요약·압축하고 필요한 핵심만 유지합니다.
대화에서는 이렇게
- "이번 에이전트 루프는 6턴 만에 종료됐고, 도구 호출은 3회였어요. 병목은 2번째 LLM 호출에서 나왔습니다."
- "보안 이슈라 4단계에서 휴먼 승인 게이트를 켰고, 승인 후에만 배포 API를 치도록 했습니다."
- "토큰 예산 체크가 빨리 걸려서 중간에 컨텍스트 압축을 한 번 넣었더니 비용이 안정됐어요."
- "같은 세션 레인에서만 실행되게 직렬화했더니 중복 댓글 전송이 사라졌습니다."
- "실패 시에만 해당 스텝 재시도가 돌게 분리했더니, LLM 재호출 없이 도구만 재실행돼 안정적입니다."
함께 읽으면 좋은 용어
참고 자료
- Agent Loop (OpenClaw)
에이전트 루프의 입출력, 큐잉, 훅, 스트리밍 동작.
- Build an Agent Tool Loop
ReAct 스타일 루프 구현과 내구 스텝·예산·컨텍스트 관리.
- Production agent architecture — Durable execution for workflows and agents
내구 에이전트 루프의 참조 아키텍처와 DO_WHILE 패턴.
- Agent Architecture and Control Loops in AI System Design
모델·도구·지시와 제어 루프의 상호작용을 설명.
- What Is the AI Agent Loop? The Core Architecture Behind Autonomous AI Systems
에이전트 루프 단계(지각-추론-행동-관찰) 개요.
- Mastering AI agent observability: A comprehensive guide
루프 단계 단위 추적·관측 포인트 설계 관점.