Trilha 6 - Escala e Maestria

Mapa da trilha

6.1~30 min

🌳 Quando criar novos agentes

Decision tree, Kanban v0.13.0, multi-agente

6.2~30 min

📊 Dashboard, gateway, túnel

Web UI, SSH tunnel, Kanban view

6.3~35 min

🛠️ Troubleshooting completo

Telegram, Docker, timezone, contexto

6.4~25 min

🔁 Rotina de manutenção

Stale memory, rotação de tokens, filosofia

Conteúdo detalhado

6.1~30 min

🌳 Quando criar novos agentes

Não comece com 5 agentes. Comece com 1 e separe quando o critério justificar. Decision tree, padrões por vertical e o caminho pra Kanban multi-agente da v0.13.0.

O que é:

Começar com 1 agente único, sem multiplicar até existir motivo concreto. A maioria das pessoas que cria 3-4 agentes no primeiro mês acaba abandonando 2 deles.

Por que aprender:

Um agente só, bem treinado e usado, vale mais do que cinco vazios. Operar 1 agente sólido te ensina o ciclo de skills, memória e crons antes de fragmentar.

Conceitos-chave:

Heurística: só crie um segundo agente quando o primeiro já tiver pelo menos 5 skills usadas regularmente, 3 crons úteis e 1 mês de uso real.

O que é:

Quatro critérios concretos: (1) chaves de API diferentes; (2) memória que não pode misturar; (3) função/tom muito distinto; (4) escopo de risco diferente.

Por que aprender:

Sem critério, viram 5 agentes que fazem quase a mesma coisa. Com critério, cada agente tem responsabilidade clara e atualização independente.

Conceitos-chave:

Pessoal e financeiro misturam tom (informal vs sério), chaves (Telegram pessoal vs canal restrito) e risco (acesso à conta bancária). Justifica separar.

O que é:

Receita testada: pessoal (assistente do dia), marketing (tom de marca), financeiro (acesso restrito), suporte (FAQ + escalação), ops (audit + backup), conteúdo (newsletter, posts).

Por que aprender:

Você não precisa inventar a divisão. Esse é o recorte que sustenta operações pequenas e médias. Pode começar por 2 verticais e adicionar conforme uso.

Conceitos-chave:

Cada vertical = container Docker próprio + .env próprio + skills próprios. Soul.md muda o tom; memory.md muda os fatos; user.md muda quem é o dono.

O que é:

Modelo mental: VPS é o prédio (recurso físico, IP, banda), Docker container é a sala (isolamento, .env próprio), agente Hermes é o funcionário dentro daquela sala (skills, memória, soul).

Por que aprender:

Esse modelo evita confusão clássica: "por que minha chave do Telegram não funciona?" geralmente é porque você editou o prédio quando deveria editar a sala.

Conceitos-chave:

Múltiplos containers num único VPS é o padrão. Cada um expõe (ou não) sua porta. Backup do VPS protege todos os containers de uma vez.

O que é:

Skills, MEMORY.md, SOUL.md, USER.md — tudo Markdown versionado. Migrar conhecimento entre agentes é copiar arquivos, ajustar tom no soul e subir novo container.

Por que aprender:

Faz a multiplicação ser barata. Você cria o agente "marketing" reaproveitando 70% do "pessoal", muda só o soul e algumas skills específicas.

Conceitos-chave:

Mantenha um repositório GitHub com skills compartilhadas. Cada container faz git clone e usa só os subdiretórios que precisa.

O que é:

Recurso novo da v0.13.0 ("The Tenacity Release"): um perfil orquestrador cria um board Kanban durável, define tarefas, e múltiplos workers Hermes pegam, fazem handoff e fecham.

Por que aprender:

É o caminho de paralelismo real. Você descreve um trabalho grande, ele se quebra em cards, e seus agentes executam em paralelo. Útil pra pesquisa, geração de conteúdo, análise de dados.

Conceitos-chave:

Heartbeats mantêm workers honestos. Reclaim devolve tarefa de worker travado. Zombie detection mata processos pendurados. Hallucination gate impede commit de saída suspeita.

Ver Completo

6.2~30 min

📊 Dashboard, gateway, túnel, Kanban

Hermes tem uma web UI completa. Aprenda o que cabe nela, como abrir via SSH ou nginx, e quando o Telegram puro ainda é melhor caminho.

O que é:

A web UI inclui visualização de sessões, lista de canais ativos, crons (cron view), gerenciador de skills, plugins, configurações e — na v0.13.0 — Kanban view multi-agente.

Por que aprender:

Algumas tarefas ficam mais fáceis visuais: revisar últimas 50 sessões, ativar/desativar plugins, editar arquivos de config. Telegram é ótimo pro dia a dia, mas dashboard é melhor pra manutenção.

Conceitos-chave:

Dashboard é apenas leitura/edição do estado interno. Tudo o que ela mostra também está em arquivos de ~/.hermes/.

O que é:

A dashboard sobe por padrão em localhost:8080 dentro do VPS. Pra acessar do seu laptop: ssh -L 8080:localhost:8080 user@vps e abrir http://localhost:8080.

Por que aprender:

SSH tunnel evita expor a dashboard publicamente. Nginx + Cloudflare Tunnel é a alternativa quando você quer URL fixa com autenticação.

Conceitos-chave:

Nunca abrir a porta da dashboard direto na internet sem auth. Token de admin não é firewall. SSH key + tunnel é o padrão seguro.

O que é:

Skill bundled "abrir-dashboard": você pede no Telegram "abre minha dashboard" e ela executa o SSH tunnel local, espera a porta abrir e te entrega o link http://localhost:8080.

Por que aprender:

Reduz fricção. Em vez de decorar comando SSH, abrir terminal e digitar — você fala. Mantém o agente como porta única de operação.

Conceitos-chave:

A skill assume que sua chave SSH e o host estão configurados localmente. Não funciona se o agente está no VPS — só rodando localmente no seu Mac/Linux.

O que é:

Visual de board (To Do, In Progress, Done) que mostra cards de tarefas e qual worker pegou cada uma. Adicionado no v0.13.0 junto com o Kanban multi-agente.

Por que aprender:

Quando você roda 2-3 workers em paralelo, fica difícil acompanhar pelo Telegram. O Kanban view dá overview imediato: o que falta, o que travou, qual worker está zumbi.

Conceitos-chave:

Cards mostram heartbeat dos workers, contagem de retries e estado da hallucination gate. Tarefa marcada zombie volta automaticamente pro topo do board.

O que é:

A aba de plugins lista todos os plugins instalados, versão, status (ativo/desativado) e botões para atualizar, desativar ou remover. Inclui plugins oficiais (LCM, kanban) e da comunidade.

Por que aprender:

Manutenção visual evita errar comando no terminal. Atualizações ficam um clique em vez de pull + restart manual.

Conceitos-chave:

Atualização de plugin pode quebrar skill que dependia da versão antiga. Sempre olhe changelog antes de atualizar em produção.

O que é:

A maioria do uso diário cabe via Telegram: pedir tarefas, conferir crons, ler resumos, ajustar memória. Dashboard é para manutenção, não operação.

Por que aprender:

Quem se acostuma a abrir dashboard pra qualquer coisa perde a praticidade do agente "no bolso". O Telegram é o ponto único de contato.

Conceitos-chave:

Regra: se você consegue pedir em texto, peça via Telegram. Só vá pra dashboard quando precisar editar arquivos longos, ver gráfico ou triar dezenas de cards Kanban.

Ver Completo

6.3~35 min

🛠️ Troubleshooting completo

Os 6 problemas que aparecem em quase toda instalação Hermes — e o caminho de solução para cada um. Telegram, Docker, contexto, timezone e diagnóstico via terminal do container.

O que é:

Sintoma: você manda mensagem e não recebe nada. Sequência: hermes gateway status → ler ~/.hermes/logs/gateway.log → conferir TELEGRAM_TOKEN e TELEGRAM_HOME_CHANNEL no .env.

Por que aprender:

É o problema mais comum. Em 90% dos casos é token errado, home channel não configurado ou gateway parado. Saber a sequência economiza 30 minutos cada vez.

Conceitos-chave:

Em Docker, confirme também que o container tem acesso à internet (firewall/iptables). hermes gateway setup re-executa o wizard se algo ficou inconsistente.

O que é:

Sintoma: localhost:8080 não carrega no laptop. Em VPS sem IP público direto, é esperado — você precisa criar o túnel: ssh -L 8080:localhost:8080 user@vps.

Por que aprender:

Muita gente acha que está bugado quando na verdade só faltou o túnel. Confirmar que o processo Hermes está rodando na porta correta evita debug perdido.

Conceitos-chave:

Alternativa: nginx como reverse proxy com auth básica + HTTPS via Let's Encrypt. Bom quando múltiplas pessoas precisam acessar.

O que é:

Problema clássico de Docker: o .env certo fica em /root/.hermes/.env dentro do container. No host, monte: ~/.hermes:/root/.hermes.

Por que aprender:

Quem coloca chaves no .env da raiz do projeto sem volume montado vê o agente subir sem ler nada e fica caçando bug onde não há.

Conceitos-chave:

Verificar com docker exec -it hermes env | grep TELEGRAM. Logs com auto-redação ficam em ~/.hermes/logs/errors.log.

O que é:

Hermes comprime conversas longas automaticamente antes do limite do modelo. Comando /compress força. /usage mostra tokens. v0.13.0 mostra contagem de compressões na status bar.

Por que aprender:

Sintoma: agente "esquecendo" coisas no meio da sessão. Geralmente é compressão muito agressiva ou mal configurada. Trocar pelo plugin LCM elimina perda.

Conceitos-chave:

Use modelo barato pra compressão (google/gemini-2.5-flash via OpenRouter). Plugin LCM oferece compressão lossless sem chamada de LLM extra.

O que é:

Container Docker roda em UTC por padrão. Hermes precisa de timezone: "America/Sao_Paulo" no config.yaml ou TZ=America/Sao_Paulo nas env vars.

Por que aprender:

Sem timezone, cron pra "09:00" dispara às 09:00 UTC = 06:00 em Brasília. Você acorda com mensagem do agente 3 horas antes do esperado e não entende por quê.

Conceitos-chave:

Afeta: timestamps em logs, agendamento de cron, e a hora injetada no system prompt. Use string IANA padrão (America/Sao_Paulo, Europe/Lisbon, etc).

O que é:

Dentro do container: docker exec -it hermes bash e use o CLI hermes com subcomandos: gateway status, cron list, config get, doctor.

Por que aprender:

Quando o Telegram não responde, você precisa de uma porta de diagnóstico fora dele. Terminal do container é o "modo seguro" pra inspecionar tudo.

Conceitos-chave:

Logs com auto-redação de secrets ficam em ~/.hermes/logs/. Pode mandar pro suporte sem medo de vazar token.

Ver Completo

6.4~25 min

🔁 Rotina de manutenção contínua

A diferença entre quem usa Hermes 1 mês e quem usa por 1 ano: rotina simples, atualização honesta da memória, e a filosofia de que agente é colega que aprende — não ferramenta que termina.

O que é:

Três regras: (1) errou 2x → atualiza skill ou memória; (2) repetiu instrução → vira skill; (3) tom errado → ajusta soul. Aplique na hora, não acumule pra depois.

Por que aprender:

Sem regra, manutenção vira tarefa "quando der tempo" — e nunca dá. Com regra simples, vira reflexo: "isso virou problema duas vezes, agora salva".

Conceitos-chave:

Frase mágica: "isso aqui virou skill, salva." O agente cuida do resto. Você não precisa lembrar a sintaxe de SKILL.md.

O que é:

Mensalmente, peça: "leia sua memória", "leia seu soul", "liste skills ativas", "liste crons ativos". O próprio agente apresenta resumo e sugere podas.

Por que aprender:

É auditoria barata. Você vê em 5 minutos o que está desatualizado, o que está duplicado e o que ficou órfão. Sem isso, a memória vira lixão silencioso.

Conceitos-chave:

Coloque um cron mensal: "sugira poda da memória e me liste 3 skills sem uso recente". Você só aprova ou rejeita.

O que é:

Memory.md acumula fatos antigos: VPS antigo, projeto morto, preferência que mudou. O agente continua agindo conforme esses fatos e parece "estranho" ou "errado".

Por que aprender:

Antes de assumir bug do código, abra memory.md. 70% dos "comportamentos estranhos" do Hermes são fato desatualizado lá dentro.

Conceitos-chave:

Memória deve ser editada como diário, não como log. Quando algo muda na sua vida, peça: "atualiza memória: agora uso X em vez de Y".

O que é:

Protocolo de debug: 1) leia memory.md, 2) leia soul.md, 3) leia skill envolvida, 4) só então cheque logs e config. Erros frequentemente são instrução antiga, não bug.

Por que aprender:

Você economiza horas de debug em código quando o problema é texto. Hermes é 90% Markdown — começar pelo texto cobre a maioria dos casos.

Conceitos-chave:

Frase pra usar: "comportamento estranho em X. Audita memory, soul e skill relacionada antes de eu mexer no código."

O que é:

Cadência: rotação de tokens trimestral; review de skills mensal; auditoria de segurança semanal (cron skill "auditoria de segurança"). Tudo agendado, não manual.

Por que aprender:

Sem cadência, ninguém faz. Com cron, vira automático: o agente lembra você. É a diferença entre "tenho intenção de" e "está acontecendo".

Conceitos-chave:

Tokens vencidos no .env são causa frequente de gateway parado. Auditoria semanal pega ports abertas, processos novos e skills suspeitas.

O que é:

Hermes não é um app que você instala e está pronto. É um colega: precisa de onboarding, contexto, correção e crescimento. Quem trata como ferramenta estática nunca aproveita.

Por que aprender:

A diferença entre 1 mês e 1 ano de Hermes é exatamente esta. Quem mantém a relação viva tem agente cada vez mais útil. Quem trata como ferramenta abandona.

Conceitos-chave:

Mentalidade final: você é o tech lead, ele é o estagiário sênior. Você aprova, corrige e ensina. Ele executa, lembra e sugere. Cada mês, mais alinhamento.

Ver Completo

← Trilha 5: Comparações Voltar ao início do curso →