Formulário de contato

Nome

E-mail *

Mensagem *

Imagem

Linux Leve + IA Local no PC com 2 GB de RAM

Linux Leve + IA Local no PC com 2 GB de RAM

Publicado por em


@CanalQb no YouTube


@CanalQb

Linux Leve + IA Local no PC com 2 GB de RAM


Você tem um Pentium N3700 com 2 GB de RAM e quer rodar um Linux funcional e ainda assim brincar com inteligência artificial local — geração de texto, imagem e até análise visual? Parece loucura, mas é possível. Fiz isso, errei, ajustei e vou te mostrar exatamente o que funciona, onde você vai errar se não prestar atenção, e como evitar os problemas que eu tive.

O gargalo real não é o processador — é a RAM. Com a distro certa, SWAP configurado e os modelos corretos (no repositório certo, com o executável correto), dá para rodar modelos de texto e geração de imagem 100% offline. Este guia está baseado em testes reais no terminal do antiX.


Por que isso vale a pena tentar

Privacidade

100% offline, sem coleta de dados

Tudo roda localmente. Nenhuma prompt sua sai do computador. Perfeito para quem quer usar IA sem depender de nuvem ou pagar por API.

Custo zero

Sem mensalidade, sem limite de uso

Depois de instalar, você usa à vontade. O modelo fica no seu disco. Sem conta obrigatória, sem token, sem plano premium.

Aprendizado

Entenda como LLMs realmente funcionam

Quando você vê a RAM enchendo linha por linha enquanto o modelo carrega, você entende na prática o que "quantização" e "parâmetros" significam. Nenhum tutorial teórico ensina isso tão bem.

Reaproveitamento

Dê vida nova ao hardware antigo

O N3700 foi lançado em 2015. Em vez de descartá-lo, ele vira um servidor de IA doméstico funcional — lento, mas funcional. Isso tem valor real.

Versatilidade

Texto e imagem no mesmo hardware

Com configuração correta você roda dois tipos de IA: LLM de texto via Ollama (TinyLlama, SmolLM) e geração de imagem via stable-diffusion.cpp (SD 1.5 quantizado).

Controle total

Você decide qual modelo usar

Não fica preso em um produto fechado. Hoje é TinyLlama, amanhã você troca por Gemma ou SmolLM2 sem reinstalar nada. O Ollama gerencia tudo com um único comando.


Como o setup todo funciona

Instalar o antiX Linux como base do sistema

O antiX consome apenas ~200 MB de RAM em repouso. Com Ubuntu ou Mint, você já perde 1 GB ou mais antes de abrir qualquer coisa. Essa diferença é o que decide se o modelo de IA vai carregar ou não.

Criar SWAP de 8 GB e configurar o sistema

Com apenas 2 GB físicos, você precisa de SWAP para evitar que o sistema mate o processo quando a memória encher. O SWAP atua como RAM extra no disco — mais lento, mas impede travamentos completos.

Instalar cada ferramenta e baixar os modelos corretos

Ollama para texto (TinyLlama ou SmolLM), stable-diffusion.cpp compilado com OpenBLAS para imagem, usando o modelo SD 1.5 Q4_0 do repositório correto no Hugging Face. Cada detalhe importa — repositório errado dá 404, executável errado dá "arquivo não encontrado".


Para quem é este guia

🖥️ Donos de netbooks e mini-PCs antigos com Intel Atom, Celeron ou Pentium N3xxx/N4xxx que querem usar IA sem comprar hardware novo.

🎓 Estudantes e entusiastas de Linux que querem entender como LLMs funcionam na prática, sem gastar nada com servidor ou API paga.

🔧 Técnicos e recicladores de hardware que querem mostrar que um PC velho ainda tem utilidade real em 2025 com IA local funcionando.

🚀 Curiosos que já tentaram instalar IA e travaram o PC — este guia explica por que travou, qual repositório usar e qual executável chamar.


Parte 1 — Escolhendo a distro certa

Antes de qualquer instalação, preciso ser direto: a escolha do Linux é mais importante do que a escolha do modelo de IA. Testei o Ubuntu 24.04 no N3700 — ele abre, usa 1,1 GB de RAM em repouso, e você mal consegue abrir o terminal já está no limite. Com o antiX, são 200 MB. Essa diferença de 900 MB é o que decide se o TinyLlama vai carregar ou não.

Distro Base Ambiente RAM em repouso Melhor para IA?
antiX 23 Debian Stable IceWM / Fluxbox ~200 MB ✅ Sim — melhor escolha
Lubuntu 24.04 Ubuntu LXQt ~450 MB Funciona com limitações
Linux Lite 7 Ubuntu Xfce ~550 MB Apertado demais
Zorin OS Lite Ubuntu Xfce ~600 MB Não recomendado
Puppy Linux Variada JWM ~100 MB Sim, mas setup muito complexo

A recomendação deste guia é o antiX 23 (64-bit). É baseado no Debian Stable, tem suporte longo, drivers excelentes para Intel e o repositório completo do Debian disponível. O Puppy funciona com ainda menos memória, mas instalar Ollama e compiladores C++ nele é bem mais trabalhoso.

Parte 2 — Instalando o antiX Linux passo a passo

2.1 — Baixando a ISO

Acesse o site oficial do antiX e baixe a versão full 64-bit. Evite a versão "base" para este guia porque ela não inclui gerenciador de pacotes gráfico, o que complica para iniciantes.

https://antixlinux.com/download/

Arquivo típico: antiX-23.1_x64-full.iso — cerca de 1,5 GB.

2.2 — Criando o pendrive bootável

Use o Ventoy ou o Balena Etcher. O Ventoy é o mais prático porque você copia a ISO direto no pendrive sem apagar outros arquivos. O Etcher é mais simples se for sua primeira vez.

  1. Baixe o Etcher em etcher.balena.io
  2. Abra e clique em "Flash from file"
  3. Selecione a ISO do antiX
  4. Escolha o pendrive (mínimo 4 GB) em "Select target"
  5. Clique em "Flash!" e aguarde (~5 minutos)

2.3 — Configurando a BIOS

Ligue o computador e pressione repetidamente a tecla de boot (geralmente F2, F12, Del ou Esc). Procure "Boot Order" e coloque o USB em primeiro lugar. Salve com F10.

⚠️ Atenção: Em máquinas com UEFI (a maioria depois de 2014), pode ser necessário desativar o Secure Boot nas configurações de segurança da BIOS para o antiX iniciar.

2.4 — Processo de instalação

  1. O antiX inicia em modo Live — você pode testar antes de instalar
  2. Clique duas vezes no ícone "Install antiX"
  3. Escolha o idioma Português do Brasil
  4. Partição: selecione "Guided — use entire disk" para uso único, ou "Manual" para dual boot
  5. Defina usuário e senha
  6. Aguarde a cópia (10 a 20 minutos)
  7. Reinicie quando solicitado e retire o pendrive

2.5 — Atualizando o sistema

Abra o terminal (Ctrl+Alt+T) e execute:

sudo apt update && sudo apt upgrade -y

Aguarde finalizar antes de continuar. Pode demorar de 5 a 15 minutos na primeira vez.

Parte 3 — Criando o SWAP de 8 GB (obrigatório para IA)

Com 2 GB de RAM física, sem SWAP o processo de IA simplesmente morre quando a memória enche. O SWAP usa espaço do disco como RAM extra — mais lento, mas impede que o sistema encerre o processo na hora errada.

Passo 1 — Verificar se existe SWAP ativo:

free -h

Se a linha "Swap" mostrar 0B, siga os passos abaixo.

Passo 2 — Criar arquivo de SWAP de 8 GB:

sudo fallocate -l 8G /swapfile

Passo 3 — Definir permissões corretas:

sudo chmod 600 /swapfile

Passo 4 — Formatar como área de SWAP:

sudo mkswap /swapfile

Passo 5 — Ativar imediatamente:

sudo swapon /swapfile

Passo 6 — Tornar permanente após reinicialização:

echo '/swapfile none swap sw 0 0' | sudo tee -a /etc/fstab

Passo 7 — Confirmar que funcionou:

free -h

A linha "Swap" deve mostrar 8,0G.

Passo extra — Ajustar swappiness (recomendado):

Por padrão o Linux começa a usar SWAP com 40% da RAM ocupada. Para IA, é melhor usar a RAM ao máximo antes de recorrer ao disco:

echo 'vm.swappiness=10' | sudo tee -a /etc/sysctl.conf sudo sysctl -p

Parte 4 — Instalando o Ollama e rodando modelos de texto

O Ollama é a ferramenta mais simples para rodar LLMs localmente no Linux. Ele funciona como um gerenciador: instala uma vez e você baixa ou troca modelos com um único comando. Para o N3700 com 2 GB de RAM, o modelo mais indicado é o TinyLlama 1.1B — ele ocupa cerca de 600 a 800 MB na versão quantizada em 4 bits.

4.1 — Instalando dependências

sudo apt install -y curl wget git build-essential zstd

4.2 — Instalando o Ollama

O Ollama tem um script de instalação oficial que funciona direto no terminal:

curl -fsSL https://ollama.com/install.sh | sh

O script baixa o binário (~50 MB), instala no sistema e configura o serviço automaticamente. Aguarde finalizar.

4.3 — Verificando a instalação

ollama --version

Deve retornar algo como ollama version 0.x.x. Se retornou, a instalação foi bem-sucedida.

4.4 — Baixando e rodando o TinyLlama

ollama run tinyllama

Na primeira execução, o Ollama baixa o modelo (~600 MB). Depois do download, ele abre o chat no terminal automaticamente. Você pode digitar qualquer pergunta — o TinyLlama tem melhor desempenho em inglês, mas responde em português.

⚠️ Expectativa de velocidade: No N3700 sem GPU dedicada, o TinyLlama gera em torno de 1 a 3 tokens por segundo. Uma resposta de 100 palavras leva de 1 a 3 minutos. Isso é completamente normal para um processador de 6W TDP rodando um LLM.
⚠️ SmolLM em loop: Se você testar o smollm:135m e ele entrar em loop gerando texto repetitivo — é um comportamento conhecido desse modelo específico. Não é erro do Ollama nem do seu sistema. Simplesmente pressione Ctrl+C para interromper e use o TinyLlama ou SmolLM2 no lugar.

4.5 — Outros modelos leves para testar

ollama run smollm2:1.7b # SmolLM2 1.7B — bom custo-benefício neste hardware ollama run gemma3:1b # Gemma 3 1B do Google — requer ~900MB de RAM livre ollama run smollm:360m # SmolLM 360M — mais leve, respostas básicas

Para sair do chat, pressione Ctrl+D ou digite /bye.

4.6 — Gerenciando modelos instalados

ollama list # lista modelos instalados e tamanho ollama rm tinyllama # remove um modelo para liberar espaço no disco

Parte 5 — Instalando o stable-diffusion.cpp para geração de imagens

O stable-diffusion.cpp é uma implementação do Stable Diffusion em C++, otimizada para rodar em CPU sem GPU. É a mesma ideia do llama.cpp — pega um modelo pesado e consegue rodar em hardware modesto usando quantização e otimizações de baixo nível.

Sendo honesto: uma imagem de 256×256 pixels leva de 15 a 40 minutos no N3700. Mas funciona — testei até o final, a imagem saiu. A paciência é o único requisito extra.

⚠️ Atenção antes de começar: Este guia usa o repositório second-state/stable-diffusion-v1-5-GGUF no Hugging Face — não o repositório "leejet", que retorna 404 atualmente. O executável compilado fica em ./bin/sd-cli, não em ./sd nem ./sd-cli direto na raiz do build. Acertar esses dois pontos evita os erros mais comuns.

5.1 — Instalando dependências de compilação

sudo apt install -y cmake libopenblas-dev libgomp1 git build-essential

5.2 — Clonando o repositório

cd ~ git clone --recursive https://github.com/leejet/stable-diffusion.cpp cd stable-diffusion.cpp

5.3 — Compilando com suporte a OpenBLAS

O OpenBLAS é uma biblioteca de álgebra linear otimizada para CPUs Intel. Usá-la melhora a velocidade de geração. A compilação usa todos os núcleos do N3700 e leva de 10 a 20 minutos:

mkdir build && cd build cmake .. -DGGML_OPENBLAS=ON -DCMAKE_BUILD_TYPE=Release cmake --build . --config Release -j$(nproc)

Você verá muitas linhas de compilação passando — é normal. Aguarde o prompt voltar.

Confirmando onde ficou o executável:

find . -type f -executable | grep bin

O resultado deve mostrar ./bin/sd-cli e ./bin/sd-server. O que você vai usar é o ./bin/sd-cli.

❌ Erro comum: bash: ./sd: Arquivo ou diretório inexistente — isso acontece porque o executável não se chama sd nem fica na raiz do build. Sempre use ./bin/sd-cli dentro da pasta build/.

5.4 — Criando a pasta de modelos

mkdir -p ~/sd-models

5.5 — Baixando o modelo SD 1.5 Q4_0 (repositório correto)

Use o repositório second-state/stable-diffusion-v1-5-GGUF — ele existe e tem os arquivos Q4_0 e Q4_1 disponíveis. O token do Hugging Face é necessário para o download:

# Modelo Q4_0 — menor uso de memória (~1,5 GB no disco, carrega ~850MB na RAM) wget --header="Authorization: Bearer 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" \ "https://huggingface.co/second-state/stable-diffusion-v1-5-GGUF/resolve/main/stable-diffusion-v1-5-pruned-emaonly-Q4_0.gguf" \ -O ~/sd-models/stable-diffusion-v1-5-pruned-emaonly-Q4_0.gguf
# Modelo Q4_1 — levemente maior, qualidade marginalmente melhor wget --header="Authorization: Bearer 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" \ "https://huggingface.co/second-state/stable-diffusion-v1-5-GGUF/resolve/main/stable-diffusion-v1-5-pruned-emaonly-Q4_1.gguf" \ -O ~/sd-models/stable-diffusion-v1-5-pruned-emaonly-Q4_1.gguf
⚠️ Troque o token: O token hf_Cszei... é um exemplo dos testes. Você precisa gerar o seu próprio em huggingface.co/settings/tokens após criar uma conta gratuita.
❌ Erro 404 no download: Se aparecer 404 Not Found, o repositório ou arquivo no link está errado. Nunca use o repositório leejet/stable-diffusion-v1-5-gguf para download direto — ele retorna 404. Use sempre o second-state/stable-diffusion-v1-5-GGUF como mostrado acima.

5.6 — Gerando sua primeira imagem

Com a compilação pronta e o modelo baixado, entre na pasta build e execute:

cd ~/stable-diffusion.cpp/build ./bin/sd-cli \ --model ~/sd-models/stable-diffusion-v1-5-pruned-emaonly-Q4_0.gguf \ --prompt "a simple landscape with mountains and a river, digital art" \ --negative-prompt "blurry, low quality, ugly" \ --height 256 \ --width 256 \ --steps 20 \ --seed 42 \ --output ~/imagem_gerada.png

Parâmetros explicados:

  • --model — caminho completo para o arquivo .gguf baixado
  • --prompt — descrição do que você quer gerar (em inglês funciona melhor)
  • --negative-prompt — o que você NÃO quer na imagem
  • --height / --width — dimensões. Em 256×256 é muito mais rápido que 512×512
  • --steps — iterações de refinamento. Menos steps = mais rápido, qualidade menor
  • --seed — número fixo para reproduzir o mesmo resultado
  • --output — onde salvar a imagem gerada
✅ Versão ultra-rápida para CPU lenta: Se quiser resultado mais rápido sacrificando qualidade, use 128×128 e apenas 8 steps:
./bin/sd-cli --model ~/sd-models/stable-diffusion-v1-5-pruned-emaonly-Q4_0.gguf --prompt "a robot reading a book" --height 128 --width 128 --steps 8 --seed 42 --output ~/imagem_rapida.png

5.7 — Monitorando RAM durante a geração

Abra outro terminal enquanto a geração roda e execute:

watch -n 2 free -h

Você vai ver a RAM enchendo conforme o modelo carrega, depois estabilizar durante a geração. Se o SWAP começar a ser usado, a geração fica mais lenta — mas não para.

5.8 — Tabela de modelos disponíveis no repositório

Modelo Tamanho disco RAM estimada Qualidade Recomendado?
Q4_0 ~1,5 GB ~850 MB Boa Sim — começar aqui
Q4_1 ~1,6 GB ~900 MB Boa+ ✅ Segunda opção
Q5_0 ~1,7 GB ~1,0 GB Muito boa ⚠️ Apertado com 2 GB RAM
Q8_0 ~2,1 GB ~1,4 GB Excelente ❌ Não recomendado aqui

ℹ️ Nota Técnica: Scripts e comandos fornecidos são para fins educacionais. Teste sempre em ambiente seguro. O autor não se responsabiliza por danos, perda de dados durante particionamento, ou qualquer uso indevido das ferramentas descritas.

Recursos e ferramentas oficiais

🐧 antiX Linux
antixlinux.com/download
🤖 Ollama
ollama.com
🖼️ stable-diffusion.cpp
github.com/leejet/stable-diffusion.cpp
📦 Modelo SD 1.5 GGUF (second-state)
HF — second-state SD 1.5
💾 Balena Etcher
etcher.balena.io
🔑 Hugging Face — Tokens
huggingface.co/settings/tokens
▶ Ver tutoriais no @CanalQb    📚 Mais tutoriais no blog

#Linux #IA #InteligênciaArtificial #PCFraco #LLM #StableDiffusion #antiX #Ollama #HuggingFace
@CanalQb


Marcadores: Blogger Cripto IA Python Script Sistemas Tutorial

© março 26, 2026 CanalQb — Python, Scripts, Automação, Airdrops e Criptomoedas | Web3 e Tech na Prática

Comentários