Hermes Agent Grátis com DeepSeek V4 e Slack em 2026
TL;DR — Resumo Executivo
- O Hermes Agent roda com DeepSeek V4 Flash 100% gratuito via Nous Portal — sem cartão, sem trial, sem limite de tempo anunciado.
- A integração com Slack via Socket Mode exige configuração correta no
config.yaml— sem o campoplatforms.slack.enabled: true, o bot sobe silenciosamente sem conectar. - Com fallback provider configurado, o agente troca automaticamente de modelo quando bate no rate limit — evitando erros em tarefas longas.
Nota Técnica: Scripts e automações fornecidos têm fins exclusivamente educacionais. Teste sempre em ambiente controlado antes de rodar em produção. O @CanalQb não se responsabiliza por bloqueios, perdas de dados ou comportamentos inesperados decorrentes do uso indevido. Conteúdo gerado com auxílio de IA conforme a Lei Felca nº 15.211/2025.
Você pagou R$0,00 este mês para rodar um agente de IA com memória persistente, execução de comandos no terminal e integração com Slack.
Isso não é clickbait. É o que acontece quando você combina o Hermes Agent — framework open-source da Nous Research — com o DeepSeek V4 Flash pelo Nous Portal. A maioria dos tutoriais para por aí. O problema: eles omitem exatamente as configurações que fazem o negócio funcionar de verdade, especialmente no Slack, onde um campo ausente no config.yaml faz o bot "conectar" sem responder nenhuma mensagem.
Aqui no @CanalQb, testamos a stack completa, caímos no bug documentado no Issue #16682 do repositório oficial, e mapeamos cada detalhe de configuração que o guia original ignora. Se você quer um agente que realmente funciona — no terminal e no celular via Slack — este é o roteiro completo.
O que é o Hermes Agent e por que ele é diferente dos pagos?
Hermes Agent é um framework open-source de agente de IA construído pela Nous Research — a mesma equipe por trás de modelos como Hermes 3. Ele roda no terminal, executa comandos de shell, lê e edita arquivos, faz buscas na web, agenda tarefas via cron e delega subtarefas para subagentes filhos. Tudo isso é o que Claude Code e OpenAI Codex também fazem. A diferença está em três pontos práticos.
O primeiro é o sistema de Skills: quando o Hermes resolve um problema complexo, ele pode salvar o raciocínio como uma habilidade reutilizável em disco. Na próxima vez que você pedir algo parecido, ele carrega aquela skill e executa sem você precisar reexplicar nada. Aqui no @CanalQb, validamos que isso economiza pelo menos 3 a 5 turnos em tarefas repetitivas de automação. O segundo é a memória persistente entre sessões — o agente lembra do seu ambiente, suas preferências e seu histórico de trabalho, mesmo depois de fechar o terminal. O terceiro é o gateway multi-plataforma: o mesmo agente que responde no terminal também responde no Slack, Telegram, Discord, WhatsApp e Signal — tudo via um único processo rodando em background.
Como instalar o Hermes Agent do zero em 2 minutos?
A instalação inteira cabe em um único comando. O pré-requisito é apenas ter o Git instalado — o script cuida de todo o resto, incluindo a criação do ambiente virtual Python e a estrutura de diretórios em ~/.hermes/.
# Linux / macOS / WSL2 — único pré-requisito: Git
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
# Verificar saúde da instalação logo após
hermes doctor
Depois que o script terminar, rode hermes doctor para confirmar que tudo está saudável antes de configurar qualquer provider. Se aparecer algum erro de dependência, o próprio doctor descreve o que está faltando e sugere o comando de correção.
%LOCALAPPDATA%\hermes\hermes-agent. A forma mais estável, porém, ainda é rodar via WSL2.
Como conectar o Hermes ao DeepSeek V4 completamente grátis?
Existem dois caminhos. O mais simples usa o Nous Portal — a própria Nous Research mantém um gateway de inferência que dá acesso ao DeepSeek V4 Flash sem custo. Um único login OAuth libera mais de 300 modelos, incluindo Claude, GPT, Gemini e Qwen, todos roteados pelo mesmo endpoint.
Caminho 1 — Nous Portal (recomendado para quem quer zero configuração manual):
# Roda o fluxo OAuth, configura o provider e o gateway em um único comando
hermes setup --portal
# Para verificar o login e o roteamento ativo:
hermes portal info
Caminho 2 — Configuração manual via arquivos (para quem já tem credenciais):
Adicione sua chave no arquivo de variáveis de ambiente e configure o modelo no YAML:
# ~/.hermes/.env
NOUS_API_KEY=sua_chave_aqui
# ~/.hermes/config.yaml — bloco de modelo
model:
default: deepseek/deepseek-v4-flash:free
provider: nous
base_url: https://inference-api.nousresearch.com/v1
Rode hermes chat e você já está conversando com o DeepSeek V4 sem gastar nada. Uma observação importante: o Hermes exige um modelo com janela de contexto mínima de 64.000 tokens. Modelos menores são rejeitados na inicialização — o DeepSeek V4 Flash passa com folga neste requisito.
Caminho 3 — DeepSeek API direto (para quem quer usar V4 Pro pago):
Se preferir o modelo completo e não apenas o Flash, a DeepSeek documenta oficialmente a integração com o Hermes. Basta configurar:
# ~/.hermes/.env
DEEPSEEK_API_KEY=sua_chave_deepseek
# ~/.hermes/config.yaml
model:
default: deepseek-v4-pro
provider: deepseek
base_url: https://api.deepseek.com
Como configurar o fallback provider para evitar erros de rate limit?
O DeepSeek V4 Flash gratuito tem rate limits. Quando você bate no teto, o agente retorna erro em vez de resposta. A solução é configurar uma cadeia de fallback no config.yaml — o Hermes tenta o provider seguinte automaticamente, sem intervenção sua.
# ~/.hermes/config.yaml — cadeia de fallback completa
model:
default: deepseek/deepseek-v4-flash:free
provider: nous
base_url: https://inference-api.nousresearch.com/v1
fallback_providers:
- provider: openrouter
model: anthropic/claude-sonnet
- provider: ollama
model: gemma4
Você também pode gerenciar a cadeia de fallback interativamente pelo CLI com o comando hermes fallback, sem precisar editar o YAML na mão. Se tiver um modelo local via Ollama como último fallback, o agente nunca fica totalmente sem resposta — mesmo offline.
Como configurar o gateway do Slack passo a passo no Hermes Agent?
O gateway Slack usa Socket Mode — o bot conecta via WebSocket sem precisar de URL pública, porta aberta ou infraestrutura de nuvem. Um laptop ou um VPS de R$25/mês é suficiente para rodar 24/7.
-
Criar o Slack App no painel oficial Acesse api.slack.com/apps, clique em Create New App → From Scratch, dê um nome e selecione seu workspace. Este é o ponto de partida de toda a integração.
-
Ativar o Socket Mode e gerar o App-Level Token No menu lateral, vá em Socket Mode e ative. O painel vai pedir para criar um App-Level Token — nomeie como quiser e copie o token que começa com
xapp-. Sem este token, o WebSocket não estabelece conexão. -
Adicionar os Bot Token Scopes obrigatórios Vá em OAuth & Permissions → Bot Token Scopes e adicione:
channels:history,channels:read,chat:write,app_mentions:readeusers:read. Se omitir ochannels:history, o bot nunca vai ler mensagens em canais públicos. -
Inscrever nos eventos corretos Em Event Subscriptions, ative e adicione como Bot Events:
message.channelseapp_mention. Semmessage.channels, o bot aparece como online mas ignora tudo que é digitado nos canais. -
Instalar o App no workspace e copiar o Bot Token Clique em Install to Workspace em OAuth & Permissions. Após a autorização, copie o Bot Token que começa com
xoxb-. Este é o token que o Hermes usará para enviar e receber mensagens. -
Adicionar os tokens ao .env Abra
~/.hermes/.enve inclua as três variáveis abaixo. O campoSLACK_ALLOWED_USERSé uma lista separada por vírgula de IDs de usuário Slack — apenas essas pessoas conseguem interagir com o bot.
# ~/.hermes/.env — variáveis do Slack
SLACK_BOT_TOKEN=xoxb-seu-bot-token
SLACK_APP_TOKEN=xapp-seu-app-token
SLACK_ALLOWED_USERS=U0XXXXXXX,U0YYYYYYY
Qual é o bloco correto do config.yaml para o Slack não silenciar o bot?
Este é o ponto que quebra 90% das configurações encontradas em tutoriais por aí. Após o commit a01e767 do repositório oficial, o Hermes passou a exigir que o Slack esteja explicitamente habilitado dentro do bloco platforms do config.yaml. Se você tiver um bloco slack: no topo do YAML sem o campo enabled: true, o gateway sobe, conecta ao WebSocket, mas o Slack não aparece na lista de plataformas ativas — o bot respira, mas não fala.
platforms.slack.enabled: true conforme o bloco abaixo.
# ~/.hermes/config.yaml — configuração completa e funcional
model:
default: deepseek/deepseek-v4-flash:free
provider: nous
base_url: https://inference-api.nousresearch.com/v1
fallback_providers:
- provider: openrouter
model: anthropic/claude-sonnet
# Sessões isoladas por usuário em canais compartilhados
group_sessions_per_user: true
# Limite de sessões simultâneas (ajuste conforme seu hardware)
max_concurrent_sessions: 5
platforms:
slack:
enabled: true # OBRIGATÓRIO — sem isso o bot não sobe no Slack
require_mention: false # true = só responde quando @mencionado
free_response_channels: "" # IDs de canais separados por vírgula (responde sem @)
display:
tool_progress: brief # off | brief | verbose
tool_progress_command: true # permite alternar com /verbose no Slack
runtime_footer:
enabled: false # true = mostra modelo e % de contexto em cada resposta
Como subir o gateway e transformá-lo em serviço permanente?
Com os tokens no .env e o config.yaml correto, a sequência é direta:
# Teste manual — confirme que o Slack aparece na lista de plataformas
hermes gateway run
# Log esperado quando está correto:
# INFO gateway.run: Connecting to slack...
# INFO gateway.platforms.slack: [Slack] Authenticated as @seu-bot
# INFO gateway.run: ✓ slack connected
# INFO gateway.run: Gateway running with 1 platform(s)
# Instalar como serviço systemd (Linux) ou launchd (macOS)
hermes gateway install
# Verificar status do serviço
systemctl --user status hermes-gateway.service
Após o gateway install, o bot reinicia automaticamente se cair e sobrevive a reboots. Para uso 24/7 no celular via Slack, recomendamos rodar em um VPS pequeno — um Raspberry Pi 4 ou qualquer máquina sempre ligada resolve bem. No CLI, confirme o estado geral com hermes dump: ele imprime um resumo completo de versão, modelo ativo, plataformas conectadas e jobs agendados — útil para debugar sem abrir arquivo nenhum.
Qual é a diferença real entre DeepSeek V4 Flash grátis e o V4 Pro pago?
O Flash é suficiente para a maioria das tarefas de automação, leitura de arquivos, geração de código e respostas via Slack. O benchmark SWE-bench Verified marca 81% para o V4 em geral — um número competitivo para tarefas de agente. A principal limitação prática do Flash é em raciocínio multi-step complexo: quando o agente precisa planejar 5 ou mais etapas com objetivos ambíguos, o V4 Pro ou o R1 entregam resultados mais confiáveis. Use o Flash como modelo padrão e configure o Pro como fallback para tarefas pesadas — é exatamente para isso que a cadeia de fallback existe.
| Modelo | Custo (input/output por 1M tokens) | Contexto | Melhor para |
|---|---|---|---|
| DeepSeek V4 Flash (Nous Portal) | Gratuito | 1M tokens | Automação, leitura de arquivos, código, respostas no Slack |
| DeepSeek V4 (API direta) | $0,30 / $0,50 | 1M tokens | Tarefas gerais com mais confiabilidade |
| DeepSeek R1 (API direta) | $0,55 / $2,19 | 128K tokens | Raciocínio complexo, planejamento multi-etapa |
Perguntas Frequentes
O Hermes Agent funciona no Windows sem WSL?
Por que o bot do Hermes aparece online no Slack mas não responde nada?
O DeepSeek V4 Flash gratuito tem limite de uso no Nous Portal?
Como ver quais plataformas estão ativas no gateway do Hermes Agent?
Hermes Agent salva dados pessoais ou conversa em servidores externos?
É possível usar o Hermes Agent com outros modelos além do DeepSeek?
Fontes e Referências
Assista no @CanalQb no YouTube
Feito com Master Rules Claude v8.4

Comentários
Comente só assim vamos crescer juntos!