Hermes Agent, OpenRouter 1위 등극; Lemonade로 로컬 AI 속도 향상

Nous Research의 Hermes Agent가 ‘Tenacity’ 업데이트 후 OpenRouter 일일 토큰 사용 1위를 기록했다. Lemonade는 vLLM ROCm을 도입해 기기 내 대형 언어 모델 실행 속도를 높였다.

기사에서 찾기

읽기 모드

한 줄 요약

오픈소스 에이전트가 실사용 단계로 이동하고 있다: Hermes Agent가 자기개선 루프로 OpenRouter 사용 1위를 차지했고, Lemonade는 기기 내 대형 언어 모델 성능을 높였다.

New Tools

Hermes Agent v0.13 “Tenacity”: OpenRouter 일일 사용 1위 등극

Hermes Agent는 작업을 실행한 뒤 스스로 성과를 분석해 재사용 가능한 스킬을 만들어 가는 오픈소스 AI 조수다. 프로젝트는 MIT 라이선스로 배포되며 2026년 5월 7일자 v0.13.0 ‘Tenacity’ 릴리스를 게시했다. ¹

Marktechpost에 따르면 OpenRouter의 일일 앱·에이전트 순위에서 Hermes는 224 billion의 일일 토큰으로 1위를 차지했고, OpenClaw는 186 billion으로 2위다. 경쟁은 철학 차이도 보여준다: Hermes는 실행–학습–개선 루프로 ‘깊이’를 추구하고, OpenClaw는 여러 채널을 한꺼번에 연결하는 중앙 게이트웨이로 ‘폭’을 추구한다. ²

‘Tenacity’ 릴리스는 하트비트·복구를 갖춘 칸반 기반 멀티에이전트 보드, 목표를 고정하는 /goal 명령, Checkpoints v2, 재시작 후 자동 복구, Google Chat 추가(지원 플랫폼 20개) 등을 포함한다. 또한 기본 비식별화와 역할 화이트리스트 강화 등 8건의 P0 보안 보완을 담아 안정성을 높였다. ²

이미 OpenClaw를 쓰는 팀을 위한 온보딩도 제공된다. 설정·메모리·스킬을 불러오는 ~/.openclaw 자동 감지, 미리보기 가능한 “hermes claw migrate” 명령, 에이전트 통신 프로토콜을 통한 병행 운영 등으로 전환 부담을 낮춘다. ²

Lemonade v10.4.0: 로컬 LLM 실행 속도·호환성 개선

Lemonade는 사용자가 보유한 그래픽 처리 장치(GPU)와 신경망 처리 장치(NPU)에서 최적화된 대형 언어 모델(LLM)을 제공해, 로컬 AI 앱을 찾고 실행하도록 돕는 도구다. ³

v10.4.0은 Linux 환경의 AMD Strix Halo 및 Strix Point 기기를 위한 실험적 백엔드로 vLLM ROCm을 통합했고, 문서 사이트도 대폭 개편했다. ³

Lemonade는 모델을 사용자의 기기에서 실행하도록 설계됐기 때문에, 이번 업데이트는 지원 하드웨어에서의 온디바이스 성능 향상과 로컬 워크로드 유지라는 프로젝트 목표(사용자 소유 GPU·NPU에서 최적화된 LLM 제공)에 부합한다. ³

나에게 주는 의미

Hermes의 부상은 학습을 통해 가치를 누적하는 에이전트가 실무에 유용함을 시사한다. 재사용 스킬과 계층적 메모리로 반복 업무의 재설정을 줄일 수 있으며, OpenRouter에서 224 billion의 일일 토큰 사용을 보인다. 주간 현황 취합, 콘텐츠 갱신처럼 안정된 프로세스부터 시범 적용하라. ²

‘Tenacity’의 칸반, /goal, 체크포인트는 비개발자도 통제권을 갖고 시범 운영을 시작하기에 적합하다. 한두 개 실제 업무 흐름을 선택해 시각화하고, 목표를 고정해 매주 다시 만들지 않아도 되는 환경을 구축할 수 있다. ²

보안은 초기부터 핵심 과제다. 에이전트 게이트웨이의 CVE 사례는 노출·오구성 위험이 공격 표면이 될 수 있음을 보여준다. 테스트 전용 워크스페이스에서 시작하고, 커넥터 권한을 최소화하며, 감사 기록을 남겨야 한다. ²

콘텐츠 처리나 조사 업무를 기기 내에서 처리해도 되는 경우, Lemonade는 지원 하드웨어에서 로컬 실행을 시도해 볼 경로를 제공한다. 사용자 보유 GPU·NPU에서 최적화된 LLM을 제공하려는 프로젝트 취지와 vLLM ROCm 백엔드 통합이 그 방향을 뒷받침한다. ³

지금 할 일

Hermes로 반복 업무 한 건 시범 적용: 프로젝트의 퀵스타트를 따라 로컬 대시보드를 띄우고, 익숙한 채널 하나만 연결해 /goal과 칸반 보드로 주간 리포트나 현황 취합을 실행해 본다.
루틴을 ‘스킬’로 구체화: 반복 작업의 5–7단계 절차를 글머리표로 적고 Hermes에 템플릿으로 제공해, 다음부터 재사용 가능한 스킬로 저장·호출되는지 확인한다.
OpenClaw 사용 중이면 마이그레이션 예행연습: “hermes claw migrate --dry-run”을 실행해 어떤 설정·메모리·키가 가져와지는지 미리 확인한 뒤 전환 여부를 판단한다.
Lemonade로 로컬 LLM 체감 테스트: 최신 릴리스를 설치하고 소형 공개 모델을 로드해, PDF 요약이나 메일 초안을 오프라인에서 수행하며 속도·반응성을 기존 클라우드 대비 측정한다.
에이전트 샌드박스 마련: 별도 워크스페이스나 테스트 계정을 만들고 커넥터 권한을 최소화(가능하면 읽기 전용)하며, 팀 초대 전 접근 범위를 문서화한다.

출처 3

[1] Github NousResearch/hermes-agent: The agent that grows with you [2] Marktechpost OpenClaw vs Hermes Agent: Why Nous Research’s Self-Improving Agent Now Leads OpenRouter’s Global Rankings [3] Github lemonade-sdk/lemonade: Lemonade helps users discover and run local AI apps by serving optimized LLMs right from their own GPUs and NPUs

도움이 되었나요?

0to1log Weekly

최신 AI 뉴스 모음집