⚡ Beta pública · CLI local-first · funciona com qualquer LLM · benchmarks reais

Dobre seus tokens
em Claude.

O Simplicio gasta até 90% menos tokens por tarefa — então o mesmo plano de IA rende muito mais. Roda na sua máquina: comprime o contexto, lembra o que já foi decidido e edita arquivos sem gastar o modelo. Funciona com qualquer LLM: Claude, GPT 5.5, Gemini, Kimi K2.6, Qwen 3.7 Max, DeepSeek. A economia aparece em cada mensagem.

Até 90% menos tokens. No mínimo, o dobro de IA pelo mesmo preço.

$ curl -fsSL simpleti.com.br/simplicio/install.sh | sh
// benchmarks medidos, não prometidos

Os números, em gráfico.

Bateria de 6 tarefas de código, mesmo modelo nos três agentes, hardware real. Cada barra é dado medido, rastreável até a evidência.

mais IA pelo mesmo preço (até 90% menos tokens por tarefa)
52×
menos tokens que o OpenClaw na mesma tarefa
87.5%
menos tokens de prefill (KV cache neural)
95.1%
HumanEval com o loop iterar-até-passar
⏱ Tempo total — 6 tarefas (menor é melhor)
Simplicio43,6 s
Hermes71,0 s
OpenClaw117,1 s
1,6× mais rápido que Hermes · 2,7× que OpenClaw
🪙 Tokens pagos — 6 tarefas (menor é melhor)
Simplicio2.493
OpenClaw130.022
52× menos tokens · ~US$ 0,0004 contra ~US$ 0,02
📦 Tamanho do binário (menor é melhor)
Simplicio3,4 MB
Hermes130 MB
OpenClaw345 MB
Binário único em Rust, zero dependências
🎯 Acerto em código (HumanEval — maior é melhor)
Simplicio + loop95,1%
Modelo direto91,5%
Local, US$ 056,1%
O loop empurra o modelo pra frente · 56% rodando 100% local, sem pagar token

Fonte: bateria de agentes 2026-06-05, mesmo modelo (DeepSeek V4 Flash) nos três · 423 testes verdes · cache neural acessado em 177 ns. Hermes não expõe contagem de tokens; custo real desconhecido (não zero).

// o que ele faz

Uma CLI. Tudo incluído.

chat → ação

Conversa e executa

Entende o pedido e age, com confirmação antes de mudar algo.

memória

Nunca esquece

Memória permanente que reduz o que você reenvia ao modelo.

edição

Escrita zero-token

Aplica a mudança decidida sem gastar o modelo escrevendo o arquivo.

segurança

Portão + evidência

Toda ação passa por um portão de risco e fica num lacre verificável.

voz · vídeo · web

Multimodal

Fala, escuta, navega na web e cria vídeo de ponta a ponta.

15 LLMs · 9 clientes

Funciona com tudo

Claude, GPT, Gemini, Qwen, DeepSeek e mais; via MCP em 9 editores.

// documentação · comandos principais

Os comandos que economizam.

simplicio runtime mapMapa comprimido do repo — em vez de despejar arquivos no modelo.
simplicio memory "<consulta>"Recupera o que já foi decidido, sem re-explicar à LLM.
simplicio edit '{…}'Edição mecânica de arquivo — zero token do modelo.
simplicio chat "<tarefa>"Chat que age: interpreta e executa, com a economia no fim.
simplicio gate classifyClassifica o risco de uma ação antes de mutar.
simplicio deliverSó declara "entregue" quando roda e passa nos critérios.
simplicio savingsRelatório de tokens economizados — por interação e por mês.
simplicio mcp registerVira ferramenta nativa em 9 editores (Claude, Cursor, Codex…).
// sempre ativo · a LLM sempre respeita

Instala e a IA usa sozinha.

O instalador ativa o Simplicio como skill + hook no seu agente. Toda sessão começa em "modo Simplicio": a IA orienta pelo runtime e corta tokens automaticamente, sem você pedir.

1 · install

Um comando

Baixa o binário e ativa a integração (skill + hook) de uma vez.

2 · skill

Vira regra padrão

A skill fica instalada; toda tarefa passa pelo runtime antes de gastar a LLM.

3 · hook

Sempre on

Um hook injeta o modo Simplicio no começo de cada sessão. A IA respeita e economiza.

// beta pública gratuita · depois US$ 10/mês

Beta pública: use grátis hoje.

Durante a beta pública, instale e use tudo sem pagar. Quando a beta terminar, são US$ 10/mês por tudo. Cancele quando quiser.

Beta pública

Simplicio

US$ 10/mês

Grátis durante a beta pública · depois US$ 10/mês · cancele quando quiser

  • O dobro de IA pelo mesmo preço (até 90% menos tokens)
  • A CLI inteira — nada bloqueado
  • Funciona com Claude, GPT, Gemini, Qwen, DeepSeek…
  • Chat, código, voz, vídeo, navegador, memória
  • Relatório de economia por interação e por mês
  • Cancele quando quiser