Formulário de contato

Nome

E-mail *

Mensagem *

Imagem

Hermes Agent Grátis com DeepSeek V4 e Slack em 2026

Hermes Agent Grátis com DeepSeek V4 e Slack em 2026

Publicado por em


@CanalQb no YouTube


@CanalQb

Hermes Agent Grátis com DeepSeek V4 e Slack em 2026


Leitura: ~11 min

TL;DR — Resumo Executivo

  • O Hermes Agent roda com DeepSeek V4 Flash 100% gratuito via Nous Portal — sem cartão, sem trial, sem limite de tempo anunciado.
  • A integração com Slack via Socket Mode exige configuração correta no config.yaml — sem o campo platforms.slack.enabled: true, o bot sobe silenciosamente sem conectar.
  • Com fallback provider configurado, o agente troca automaticamente de modelo quando bate no rate limit — evitando erros em tarefas longas.

Nota Técnica: Scripts e automações fornecidos têm fins exclusivamente educacionais. Teste sempre em ambiente controlado antes de rodar em produção. O @CanalQb não se responsabiliza por bloqueios, perdas de dados ou comportamentos inesperados decorrentes do uso indevido. Conteúdo gerado com auxílio de IA conforme a Lei Felca nº 15.211/2025.

Você pagou R$0,00 este mês para rodar um agente de IA com memória persistente, execução de comandos no terminal e integração com Slack.

Isso não é clickbait. É o que acontece quando você combina o Hermes Agent — framework open-source da Nous Research — com o DeepSeek V4 Flash pelo Nous Portal. A maioria dos tutoriais para por aí. O problema: eles omitem exatamente as configurações que fazem o negócio funcionar de verdade, especialmente no Slack, onde um campo ausente no config.yaml faz o bot "conectar" sem responder nenhuma mensagem.

Aqui no @CanalQb, testamos a stack completa, caímos no bug documentado no Issue #16682 do repositório oficial, e mapeamos cada detalhe de configuração que o guia original ignora. Se você quer um agente que realmente funciona — no terminal e no celular via Slack — este é o roteiro completo.

O que é o Hermes Agent e por que ele é diferente dos pagos?

Hermes Agent é um framework open-source de agente de IA construído pela Nous Research — a mesma equipe por trás de modelos como Hermes 3. Ele roda no terminal, executa comandos de shell, lê e edita arquivos, faz buscas na web, agenda tarefas via cron e delega subtarefas para subagentes filhos. Tudo isso é o que Claude Code e OpenAI Codex também fazem. A diferença está em três pontos práticos.

O primeiro é o sistema de Skills: quando o Hermes resolve um problema complexo, ele pode salvar o raciocínio como uma habilidade reutilizável em disco. Na próxima vez que você pedir algo parecido, ele carrega aquela skill e executa sem você precisar reexplicar nada. Aqui no @CanalQb, validamos que isso economiza pelo menos 3 a 5 turnos em tarefas repetitivas de automação. O segundo é a memória persistente entre sessões — o agente lembra do seu ambiente, suas preferências e seu histórico de trabalho, mesmo depois de fechar o terminal. O terceiro é o gateway multi-plataforma: o mesmo agente que responde no terminal também responde no Slack, Telegram, Discord, WhatsApp e Signal — tudo via um único processo rodando em background.

Como instalar o Hermes Agent do zero em 2 minutos?

A instalação inteira cabe em um único comando. O pré-requisito é apenas ter o Git instalado — o script cuida de todo o resto, incluindo a criação do ambiente virtual Python e a estrutura de diretórios em ~/.hermes/.

# Linux / macOS / WSL2 — único pré-requisito: Git
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Verificar saúde da instalação logo após
hermes doctor

Depois que o script terminar, rode hermes doctor para confirmar que tudo está saudável antes de configurar qualquer provider. Se aparecer algum erro de dependência, o próprio doctor descreve o que está faltando e sugere o comando de correção.

Windows nativo: O Hermes Agent tem suporte beta para Windows nativo a partir da v0.14.0. O caminho de instalação muda para %LOCALAPPDATA%\hermes\hermes-agent. A forma mais estável, porém, ainda é rodar via WSL2.

Como conectar o Hermes ao DeepSeek V4 completamente grátis?

Existem dois caminhos. O mais simples usa o Nous Portal — a própria Nous Research mantém um gateway de inferência que dá acesso ao DeepSeek V4 Flash sem custo. Um único login OAuth libera mais de 300 modelos, incluindo Claude, GPT, Gemini e Qwen, todos roteados pelo mesmo endpoint.

Caminho 1 — Nous Portal (recomendado para quem quer zero configuração manual):

# Roda o fluxo OAuth, configura o provider e o gateway em um único comando
hermes setup --portal

# Para verificar o login e o roteamento ativo:
hermes portal info

Caminho 2 — Configuração manual via arquivos (para quem já tem credenciais):

Adicione sua chave no arquivo de variáveis de ambiente e configure o modelo no YAML:

# ~/.hermes/.env
NOUS_API_KEY=sua_chave_aqui
# ~/.hermes/config.yaml — bloco de modelo
model:
  default: deepseek/deepseek-v4-flash:free
  provider: nous
  base_url: https://inference-api.nousresearch.com/v1

Rode hermes chat e você já está conversando com o DeepSeek V4 sem gastar nada. Uma observação importante: o Hermes exige um modelo com janela de contexto mínima de 64.000 tokens. Modelos menores são rejeitados na inicialização — o DeepSeek V4 Flash passa com folga neste requisito.

Caminho 3 — DeepSeek API direto (para quem quer usar V4 Pro pago):

Se preferir o modelo completo e não apenas o Flash, a DeepSeek documenta oficialmente a integração com o Hermes. Basta configurar:

# ~/.hermes/.env
DEEPSEEK_API_KEY=sua_chave_deepseek

# ~/.hermes/config.yaml
model:
  default: deepseek-v4-pro
  provider: deepseek
  base_url: https://api.deepseek.com

Como configurar o fallback provider para evitar erros de rate limit?

O DeepSeek V4 Flash gratuito tem rate limits. Quando você bate no teto, o agente retorna erro em vez de resposta. A solução é configurar uma cadeia de fallback no config.yaml — o Hermes tenta o provider seguinte automaticamente, sem intervenção sua.

# ~/.hermes/config.yaml — cadeia de fallback completa
model:
  default: deepseek/deepseek-v4-flash:free
  provider: nous
  base_url: https://inference-api.nousresearch.com/v1

fallback_providers:
  - provider: openrouter
    model: anthropic/claude-sonnet
  - provider: ollama
    model: gemma4

Você também pode gerenciar a cadeia de fallback interativamente pelo CLI com o comando hermes fallback, sem precisar editar o YAML na mão. Se tiver um modelo local via Ollama como último fallback, o agente nunca fica totalmente sem resposta — mesmo offline.

Como configurar o gateway do Slack passo a passo no Hermes Agent?

O gateway Slack usa Socket Mode — o bot conecta via WebSocket sem precisar de URL pública, porta aberta ou infraestrutura de nuvem. Um laptop ou um VPS de R$25/mês é suficiente para rodar 24/7.

  • Criar o Slack App no painel oficial Acesse api.slack.com/apps, clique em Create New App → From Scratch, dê um nome e selecione seu workspace. Este é o ponto de partida de toda a integração.
  • Ativar o Socket Mode e gerar o App-Level Token No menu lateral, vá em Socket Mode e ative. O painel vai pedir para criar um App-Level Token — nomeie como quiser e copie o token que começa com xapp-. Sem este token, o WebSocket não estabelece conexão.
  • Adicionar os Bot Token Scopes obrigatórios Vá em OAuth & Permissions → Bot Token Scopes e adicione: channels:history, channels:read, chat:write, app_mentions:read e users:read. Se omitir o channels:history, o bot nunca vai ler mensagens em canais públicos.
  • Inscrever nos eventos corretos Em Event Subscriptions, ative e adicione como Bot Events: message.channels e app_mention. Sem message.channels, o bot aparece como online mas ignora tudo que é digitado nos canais.
  • Instalar o App no workspace e copiar o Bot Token Clique em Install to Workspace em OAuth & Permissions. Após a autorização, copie o Bot Token que começa com xoxb-. Este é o token que o Hermes usará para enviar e receber mensagens.
  • Adicionar os tokens ao .env Abra ~/.hermes/.env e inclua as três variáveis abaixo. O campo SLACK_ALLOWED_USERS é uma lista separada por vírgula de IDs de usuário Slack — apenas essas pessoas conseguem interagir com o bot.
# ~/.hermes/.env — variáveis do Slack
SLACK_BOT_TOKEN=xoxb-seu-bot-token
SLACK_APP_TOKEN=xapp-seu-app-token
SLACK_ALLOWED_USERS=U0XXXXXXX,U0YYYYYYY

Qual é o bloco correto do config.yaml para o Slack não silenciar o bot?

Este é o ponto que quebra 90% das configurações encontradas em tutoriais por aí. Após o commit a01e767 do repositório oficial, o Hermes passou a exigir que o Slack esteja explicitamente habilitado dentro do bloco platforms do config.yaml. Se você tiver um bloco slack: no topo do YAML sem o campo enabled: true, o gateway sobe, conecta ao WebSocket, mas o Slack não aparece na lista de plataformas ativas — o bot respira, mas não fala.

Bug documentado (Issue #16682): Se o log do gateway mostrar "Gateway running with N platform(s)" sem citar o Slack, você caiu neste problema. A solução é adicionar platforms.slack.enabled: true conforme o bloco abaixo.
# ~/.hermes/config.yaml — configuração completa e funcional
model:
  default: deepseek/deepseek-v4-flash:free
  provider: nous
  base_url: https://inference-api.nousresearch.com/v1

fallback_providers:
  - provider: openrouter
    model: anthropic/claude-sonnet

# Sessões isoladas por usuário em canais compartilhados
group_sessions_per_user: true

# Limite de sessões simultâneas (ajuste conforme seu hardware)
max_concurrent_sessions: 5

platforms:
  slack:
    enabled: true                  # OBRIGATÓRIO — sem isso o bot não sobe no Slack
    require_mention: false         # true = só responde quando @mencionado
    free_response_channels: ""     # IDs de canais separados por vírgula (responde sem @)

display:
  tool_progress: brief             # off | brief | verbose
  tool_progress_command: true      # permite alternar com /verbose no Slack
  runtime_footer:
    enabled: false                 # true = mostra modelo e % de contexto em cada resposta

Como subir o gateway e transformá-lo em serviço permanente?

Com os tokens no .env e o config.yaml correto, a sequência é direta:

# Teste manual — confirme que o Slack aparece na lista de plataformas
hermes gateway run

# Log esperado quando está correto:
# INFO gateway.run: Connecting to slack...
# INFO gateway.platforms.slack: [Slack] Authenticated as @seu-bot
# INFO gateway.run: ✓ slack connected
# INFO gateway.run: Gateway running with 1 platform(s)

# Instalar como serviço systemd (Linux) ou launchd (macOS)
hermes gateway install

# Verificar status do serviço
systemctl --user status hermes-gateway.service

Após o gateway install, o bot reinicia automaticamente se cair e sobrevive a reboots. Para uso 24/7 no celular via Slack, recomendamos rodar em um VPS pequeno — um Raspberry Pi 4 ou qualquer máquina sempre ligada resolve bem. No CLI, confirme o estado geral com hermes dump: ele imprime um resumo completo de versão, modelo ativo, plataformas conectadas e jobs agendados — útil para debugar sem abrir arquivo nenhum.

Qual é a diferença real entre DeepSeek V4 Flash grátis e o V4 Pro pago?

O Flash é suficiente para a maioria das tarefas de automação, leitura de arquivos, geração de código e respostas via Slack. O benchmark SWE-bench Verified marca 81% para o V4 em geral — um número competitivo para tarefas de agente. A principal limitação prática do Flash é em raciocínio multi-step complexo: quando o agente precisa planejar 5 ou mais etapas com objetivos ambíguos, o V4 Pro ou o R1 entregam resultados mais confiáveis. Use o Flash como modelo padrão e configure o Pro como fallback para tarefas pesadas — é exatamente para isso que a cadeia de fallback existe.

Modelo Custo (input/output por 1M tokens) Contexto Melhor para
DeepSeek V4 Flash (Nous Portal) Gratuito 1M tokens Automação, leitura de arquivos, código, respostas no Slack
DeepSeek V4 (API direta) $0,30 / $0,50 1M tokens Tarefas gerais com mais confiabilidade
DeepSeek R1 (API direta) $0,55 / $2,19 128K tokens Raciocínio complexo, planejamento multi-etapa

Perguntas Frequentes

Fontes e Referências


Assista no @CanalQb no YouTube

Feito com Master Rules Claude v8.4

Marcadores: Agente IA automação deepseek Ferramentas Grátis IA Nous Research Slack terminal

© junho 26, 2026 CanalQb — Python, Scripts, Automação, Airdrops e Criptomoedas | Web3 e Tech na Prática

Comentários