Linux Leve + IA Local no PC com 2 GB de RAM
Você tem um Pentium N3700 com 2 GB de RAM e quer rodar um Linux funcional e ainda assim brincar com inteligência artificial local — geração de texto, imagem e até análise visual? Parece loucura, mas é possível. Fiz isso, errei, ajustei e vou te mostrar exatamente o que funciona, onde você vai errar se não prestar atenção, e como evitar os problemas que eu tive.
O gargalo real não é o processador — é a RAM. Com a distro certa, SWAP configurado e os modelos corretos (no repositório certo, com o executável correto), dá para rodar modelos de texto e geração de imagem 100% offline. Este guia está baseado em testes reais no terminal do antiX.
Por que isso vale a pena tentar
100% offline, sem coleta de dados
Tudo roda localmente. Nenhuma prompt sua sai do computador. Perfeito para quem quer usar IA sem depender de nuvem ou pagar por API.
Sem mensalidade, sem limite de uso
Depois de instalar, você usa à vontade. O modelo fica no seu disco. Sem conta obrigatória, sem token, sem plano premium.
Entenda como LLMs realmente funcionam
Quando você vê a RAM enchendo linha por linha enquanto o modelo carrega, você entende na prática o que "quantização" e "parâmetros" significam. Nenhum tutorial teórico ensina isso tão bem.
Dê vida nova ao hardware antigo
O N3700 foi lançado em 2015. Em vez de descartá-lo, ele vira um servidor de IA doméstico funcional — lento, mas funcional. Isso tem valor real.
Texto e imagem no mesmo hardware
Com configuração correta você roda dois tipos de IA: LLM de texto via Ollama (TinyLlama, SmolLM) e geração de imagem via stable-diffusion.cpp (SD 1.5 quantizado).
Você decide qual modelo usar
Não fica preso em um produto fechado. Hoje é TinyLlama, amanhã você troca por Gemma ou SmolLM2 sem reinstalar nada. O Ollama gerencia tudo com um único comando.
Como o setup todo funciona
Instalar o antiX Linux como base do sistema
O antiX consome apenas ~200 MB de RAM em repouso. Com Ubuntu ou Mint, você já perde 1 GB ou mais antes de abrir qualquer coisa. Essa diferença é o que decide se o modelo de IA vai carregar ou não.
Criar SWAP de 8 GB e configurar o sistema
Com apenas 2 GB físicos, você precisa de SWAP para evitar que o sistema mate o processo quando a memória encher. O SWAP atua como RAM extra no disco — mais lento, mas impede travamentos completos.
Instalar cada ferramenta e baixar os modelos corretos
Ollama para texto (TinyLlama ou SmolLM), stable-diffusion.cpp compilado com OpenBLAS para imagem, usando o modelo SD 1.5 Q4_0 do repositório correto no Hugging Face. Cada detalhe importa — repositório errado dá 404, executável errado dá "arquivo não encontrado".
Para quem é este guia
🖥️ Donos de netbooks e mini-PCs antigos com Intel Atom, Celeron ou Pentium N3xxx/N4xxx que querem usar IA sem comprar hardware novo.
🎓 Estudantes e entusiastas de Linux que querem entender como LLMs funcionam na prática, sem gastar nada com servidor ou API paga.
🔧 Técnicos e recicladores de hardware que querem mostrar que um PC velho ainda tem utilidade real em 2025 com IA local funcionando.
🚀 Curiosos que já tentaram instalar IA e travaram o PC — este guia explica por que travou, qual repositório usar e qual executável chamar.
Parte 1 — Escolhendo a distro certa
Antes de qualquer instalação, preciso ser direto: a escolha do Linux é mais importante do que a escolha do modelo de IA. Testei o Ubuntu 24.04 no N3700 — ele abre, usa 1,1 GB de RAM em repouso, e você mal consegue abrir o terminal já está no limite. Com o antiX, são 200 MB. Essa diferença de 900 MB é o que decide se o TinyLlama vai carregar ou não.
| Distro | Base | Ambiente | RAM em repouso | Melhor para IA? |
|---|---|---|---|---|
| antiX 23 | Debian Stable | IceWM / Fluxbox | ~200 MB ✅ | Sim — melhor escolha |
| Lubuntu 24.04 | Ubuntu | LXQt | ~450 MB | Funciona com limitações |
| Linux Lite 7 | Ubuntu | Xfce | ~550 MB | Apertado demais |
| Zorin OS Lite | Ubuntu | Xfce | ~600 MB | Não recomendado |
| Puppy Linux | Variada | JWM | ~100 MB | Sim, mas setup muito complexo |
A recomendação deste guia é o antiX 23 (64-bit). É baseado no Debian Stable, tem suporte longo, drivers excelentes para Intel e o repositório completo do Debian disponível. O Puppy funciona com ainda menos memória, mas instalar Ollama e compiladores C++ nele é bem mais trabalhoso.
Parte 2 — Instalando o antiX Linux passo a passo
2.1 — Baixando a ISO
Acesse o site oficial do antiX e baixe a versão full 64-bit. Evite a versão "base" para este guia porque ela não inclui gerenciador de pacotes gráfico, o que complica para iniciantes.
Arquivo típico: antiX-23.1_x64-full.iso — cerca de 1,5 GB.
2.2 — Criando o pendrive bootável
Use o Ventoy ou o Balena Etcher. O Ventoy é o mais prático porque você copia a ISO direto no pendrive sem apagar outros arquivos. O Etcher é mais simples se for sua primeira vez.
- Baixe o Etcher em etcher.balena.io
- Abra e clique em "Flash from file"
- Selecione a ISO do antiX
- Escolha o pendrive (mínimo 4 GB) em "Select target"
- Clique em "Flash!" e aguarde (~5 minutos)
2.3 — Configurando a BIOS
Ligue o computador e pressione repetidamente a tecla de boot (geralmente F2, F12, Del ou Esc). Procure "Boot Order" e coloque o USB em primeiro lugar. Salve com F10.
2.4 — Processo de instalação
- O antiX inicia em modo Live — você pode testar antes de instalar
- Clique duas vezes no ícone "Install antiX"
- Escolha o idioma Português do Brasil
- Partição: selecione "Guided — use entire disk" para uso único, ou "Manual" para dual boot
- Defina usuário e senha
- Aguarde a cópia (10 a 20 minutos)
- Reinicie quando solicitado e retire o pendrive
2.5 — Atualizando o sistema
Abra o terminal (Ctrl+Alt+T) e execute:
Aguarde finalizar antes de continuar. Pode demorar de 5 a 15 minutos na primeira vez.
Parte 3 — Criando o SWAP de 8 GB (obrigatório para IA)
Com 2 GB de RAM física, sem SWAP o processo de IA simplesmente morre quando a memória enche. O SWAP usa espaço do disco como RAM extra — mais lento, mas impede que o sistema encerre o processo na hora errada.
Passo 1 — Verificar se existe SWAP ativo:
Se a linha "Swap" mostrar 0B, siga os passos abaixo.
Passo 2 — Criar arquivo de SWAP de 8 GB:
Passo 3 — Definir permissões corretas:
Passo 4 — Formatar como área de SWAP:
Passo 5 — Ativar imediatamente:
Passo 6 — Tornar permanente após reinicialização:
Passo 7 — Confirmar que funcionou:
A linha "Swap" deve mostrar 8,0G.
Passo extra — Ajustar swappiness (recomendado):
Por padrão o Linux começa a usar SWAP com 40% da RAM ocupada. Para IA, é melhor usar a RAM ao máximo antes de recorrer ao disco:
Parte 4 — Instalando o Ollama e rodando modelos de texto
O Ollama é a ferramenta mais simples para rodar LLMs localmente no Linux. Ele funciona como um gerenciador: instala uma vez e você baixa ou troca modelos com um único comando. Para o N3700 com 2 GB de RAM, o modelo mais indicado é o TinyLlama 1.1B — ele ocupa cerca de 600 a 800 MB na versão quantizada em 4 bits.
4.1 — Instalando dependências
4.2 — Instalando o Ollama
O Ollama tem um script de instalação oficial que funciona direto no terminal:
O script baixa o binário (~50 MB), instala no sistema e configura o serviço automaticamente. Aguarde finalizar.
4.3 — Verificando a instalação
Deve retornar algo como ollama version 0.x.x. Se retornou, a instalação foi bem-sucedida.
4.4 — Baixando e rodando o TinyLlama
Na primeira execução, o Ollama baixa o modelo (~600 MB). Depois do download, ele abre o chat no terminal automaticamente. Você pode digitar qualquer pergunta — o TinyLlama tem melhor desempenho em inglês, mas responde em português.
smollm:135m e ele entrar em loop gerando texto repetitivo — é um comportamento conhecido desse modelo específico. Não é erro do Ollama nem do seu sistema. Simplesmente pressione Ctrl+C para interromper e use o TinyLlama ou SmolLM2 no lugar.
4.5 — Outros modelos leves para testar
Para sair do chat, pressione Ctrl+D ou digite /bye.
4.6 — Gerenciando modelos instalados
Parte 5 — Instalando o stable-diffusion.cpp para geração de imagens
O stable-diffusion.cpp é uma implementação do Stable Diffusion em C++, otimizada para rodar em CPU sem GPU. É a mesma ideia do llama.cpp — pega um modelo pesado e consegue rodar em hardware modesto usando quantização e otimizações de baixo nível.
Sendo honesto: uma imagem de 256×256 pixels leva de 15 a 40 minutos no N3700. Mas funciona — testei até o final, a imagem saiu. A paciência é o único requisito extra.
./bin/sd-cli, não em ./sd nem ./sd-cli direto na raiz do build. Acertar esses dois pontos evita os erros mais comuns.
5.1 — Instalando dependências de compilação
5.2 — Clonando o repositório
5.3 — Compilando com suporte a OpenBLAS
O OpenBLAS é uma biblioteca de álgebra linear otimizada para CPUs Intel. Usá-la melhora a velocidade de geração. A compilação usa todos os núcleos do N3700 e leva de 10 a 20 minutos:
Você verá muitas linhas de compilação passando — é normal. Aguarde o prompt voltar.
Confirmando onde ficou o executável:
O resultado deve mostrar ./bin/sd-cli e ./bin/sd-server. O que você vai usar é o ./bin/sd-cli.
bash: ./sd: Arquivo ou diretório inexistente — isso acontece porque o executável não se chama sd nem fica na raiz do build. Sempre use ./bin/sd-cli dentro da pasta build/.
5.4 — Criando a pasta de modelos
5.5 — Baixando o modelo SD 1.5 Q4_0 (repositório correto)
Use o repositório second-state/stable-diffusion-v1-5-GGUF — ele existe e tem os arquivos Q4_0 e Q4_1 disponíveis. O token do Hugging Face é necessário para o download:
hf_Cszei... é um exemplo dos testes. Você precisa gerar o seu próprio em huggingface.co/settings/tokens após criar uma conta gratuita.
404 Not Found, o repositório ou arquivo no link está errado. Nunca use o repositório leejet/stable-diffusion-v1-5-gguf para download direto — ele retorna 404. Use sempre o second-state/stable-diffusion-v1-5-GGUF como mostrado acima.
5.6 — Gerando sua primeira imagem
Com a compilação pronta e o modelo baixado, entre na pasta build e execute:
Parâmetros explicados:
--model— caminho completo para o arquivo .gguf baixado--prompt— descrição do que você quer gerar (em inglês funciona melhor)--negative-prompt— o que você NÃO quer na imagem--height / --width— dimensões. Em 256×256 é muito mais rápido que 512×512--steps— iterações de refinamento. Menos steps = mais rápido, qualidade menor--seed— número fixo para reproduzir o mesmo resultado--output— onde salvar a imagem gerada
./bin/sd-cli --model ~/sd-models/stable-diffusion-v1-5-pruned-emaonly-Q4_0.gguf --prompt "a robot reading a book" --height 128 --width 128 --steps 8 --seed 42 --output ~/imagem_rapida.png
5.7 — Monitorando RAM durante a geração
Abra outro terminal enquanto a geração roda e execute:
Você vai ver a RAM enchendo conforme o modelo carrega, depois estabilizar durante a geração. Se o SWAP começar a ser usado, a geração fica mais lenta — mas não para.
5.8 — Tabela de modelos disponíveis no repositório
| Modelo | Tamanho disco | RAM estimada | Qualidade | Recomendado? |
|---|---|---|---|---|
| Q4_0 | ~1,5 GB | ~850 MB | Boa | ✅ Sim — começar aqui |
| Q4_1 | ~1,6 GB | ~900 MB | Boa+ | ✅ Segunda opção |
| Q5_0 | ~1,7 GB | ~1,0 GB | Muito boa | ⚠️ Apertado com 2 GB RAM |
| Q8_0 | ~2,1 GB | ~1,4 GB | Excelente | ❌ Não recomendado aqui |
ℹ️ Nota Técnica: Scripts e comandos fornecidos são para fins educacionais. Teste sempre em ambiente seguro. O autor não se responsabiliza por danos, perda de dados durante particionamento, ou qualquer uso indevido das ferramentas descritas.
Recursos e ferramentas oficiais
antixlinux.com/download
ollama.com
github.com/leejet/stable-diffusion.cpp
HF — second-state SD 1.5
etcher.balena.io
huggingface.co/settings/tokens
#Linux #IA #InteligênciaArtificial #PCFraco #LLM #StableDiffusion #antiX #Ollama #HuggingFace
@CanalQb

Comentários
Comente só assim vamos crescer juntos!