HERO · VARIANTE A
HORSE LABS · ENGENHARIA DE IA
HL-CORE-2026-001
-23.5505 / -46.6333
EDIÇÃO PRIMORDIAL
— ENGENHARIA DE INTELIGÊNCIA ARTIFICIAL

Controle total dos seus LLMs.
Sem surpresas na fatura.

Gateway self-hosted que bloqueia gastos excessivos em tempo real e garante governança por cliente — sem lock-in de provedor ou de plataforma.


SISTEMA
ENGENHARIA DE INTELIGÊNCIA ARTIFICIAL
FREQUÊNCIA
432 HZ — PULSO ATIVO
MERCADO 2026
O CAMPO FICOU ABERTO

O campo ficou aberto.

Adquirida · Mai/2026

Portkey

Portkey foi adquirida pela Palo Alto Networks em maio de 2026. Integrada ao Prisma AIRS. Roadmap agora é de segurança enterprise.

Maintenance · Mar/2026

Helicone

Helicone foi adquirida pela Mintlify em março de 2026. Em maintenance mode — sem novas features. Só patches de segurança.

Independente · Ativo

Horse Labs

Roadmap próprio. Self-hosted. Sem big vendor decidindo o que vai ou não vai ter. Somos a alternativa para quem não quer lock-in de plataforma de governança.

01  O PROBLEMA DE MERCADO
FONTE: DEPENDÊNCIA × EXPOSIÇÃO
0%
DAS EMPRESAS TÊM SUA OPERAÇÃO DE IA ACOPLADA A UM ÚNICO PROVEDOR

Não é falta de tecnologia.
É falta de saída.

Claude Code, Codex, Copilot. Qualquer empresa contrata em cinco minutos. O problema aparece depois: seu time se adapta ao workflow da ferramenta, os processos se constroem em volta dela — e sem perceber, sua operação pertence ao provedor.

IA sem governança não escala o negócio — escala o risco.

RISCO 01 · CUSTO IMPREVISÍVEL

O provedor depreca o modelo barato. Você migra pro caro sem escolha. Sem aviso. Sem negociação.

RISCO 02 · CONSUMO DESCONTROLADO

Seus colaboradores usam os tokens da empresa para tarefas que não têm nada a ver com o negócio. Você descobre na fatura.

RISCO 03 · INDISPONIBILIDADE EM CASCATA

Se o provedor cai, sua operação para junto. Não há fallback. Não há continuidade.

RISCO 04 · ZERO GOVERNANÇA

Quem usou. O quê. Quanto custou. Para qual projeto. Ninguém consegue responder.

RISCO 05 · CUSTO NÃO OTIMIZADO

Claude Opus rodando chatbot de FAQ. Você paga 20× mais do que precisaria.

02  O QUE MUDA COM A HORSE LABS
A TESE · DOIS ÂNGULOS

IA é infraestrutura volátil — não domínio de negócio.

Nosso trabalho é manter essa volatilidade longe da sua operação. Construímos a camada que separa os provedores de LLM do seu dia a dia — você troca de modelo, otimiza custo e governa o consumo sem reescrever nada.

DA DEPENDÊNCIA AO CONTROLE — A MESMA OPERAÇÃO, DOIS MUNDOS
STACK · SEM HORSE LABSACOPLADO · EXPOSTO
SEU TIMECLAUDE CODEhard lock-in · provedor único
·preço: o provedor decide
·queda: a operação para
·modelo: sem escolha
·consumo: invisível
·governança: ninguém
STACK · COM HORSE LABSDESACOPLADO · CONTROLADO
SEU TIMELLM GATEWAYroteamento livreClaudeGPTGemini
preço: você decide
queda: troca de modelo sozinho
modelo: o melhor por tarefa
consumo: rastreado por operação
governança: você, em tempo real
→ ÂNGULO 01

AI as InfrastructurePara quem vai construir sobre IA de forma séria.

A base técnica que desacopla sua operação dos provedores — provisionada na sua casa, sob o seu domínio, pronta para escalar.

  • Gateway que abstrai os provedores de LLM
  • Provisionamento com Ansible + Terraform
  • On-premise ou em VPC sua — AWS · Azure · GCP
  • Isolamento por tenant e observabilidade nativa
→ ÂNGULO 02

AI as a ServicePara quem quer contratar um resultado pronto.

Você não precisa entender a tecnologia. Entregamos o resultado operando — relatório, automação ou agente — com a métrica acordada desde o início.

  • Resultado entregue, não ferramenta
  • Métrica definida antes de começar
  • Custo de IA medido por operação
  • Operação contínua acompanhada por dados
— DIFERENCIAL DE PRODUTO

Governance-first, não observability-first.

Ferramentas de observabilidade de LLM focam em analisar o que aconteceu. A Horse Labs foca em controlar o que pode acontecer: budgets por time, permissões por operação, bloqueio antes do estouro.

A diferença é a mesma entre câmera de segurança e controle de acesso.
03  COMO FUNCIONA
A ARQUITETURA COMO ARGUMENTO DE CONFIANÇA

Estrutura é o que separa resultado de improviso.

Provedores de LLM intercambiáveis

Troque de provedor sem tocar na operação.

Custo de IA monitorado por operação

Teto de orçamento por cliente. Custo visível por operação.

Ambiente isolado por tenant

Dados de cada cliente isolados por padrão.

Pronto para escalar sem retrabalho

Escala sem reescrever nada.

STACK · HL-COREFLUXO EM TEMPO REAL
CLOUDFLARE TUNNELborda · entrada seguraAPI GATEWAYroteamento · auth · tenantLLM GATEWAYbudget por tenant · custo/opMCP SERVERSconectores · ferramentasAGENTEatendimentoAGENTEvendasAGENTErelatórios

Quem entende, vê e confia. Quem não entende, passa e não perde o fio. O diagrama acima é a estrutura real — a mesma que sustenta cada entrega abaixo.

04  O PRODUTO · LLM GATEWAY
UMA CAMADA · TODO O CONTROLE

O LLM Gateway é o produto. Tudo passa por ele.

— MODELO CERTO PARA CADA TAREFA

Opus para o dev. Haiku para o chatbot. Gemini para os documentos.

Você configura qual modelo atende cada atividade — pelo que cada um faz de melhor — e o gateway roteia. O custo deixa de ser premium por padrão.

— RESILIÊNCIA

Provedor caiu? Outro modelo assume.

Sem ponto único de falha. Se um provedor fica indisponível, o gateway redireciona para outro e a operação não para.

— GOVERNANÇA

Teto de orçamento por tenant, rastro por pessoa.

Cada centro de custo tem limite. Cada consumo tem dono. O TCC da faculdade não entra mais na conta da empresa.

— COST CENTERS

Cost Centers por time ou cliente.

Cada time, squad ou cliente opera com budget próprio, modelo permitido e rate limit independente. Estouro de budget bloqueia automaticamente. Admin vê tudo; dev vê só o que é seu.

● MULTITENANT / CENTRO DE CUSTOEXEMPLO · AGÊNCIA
AGENTES · POOL COMPARTILHADOcopy · mídia · relatório · seoLLM InfraStructure Layerroteamento + budgetCliente Aprojeto grandemodelo · opusbudget · alto78%Cliente Bprojeto pequenomodelo · haikubudget · enxuto44%Cliente Cprojeto pequenomodelo · sonnetbudget · médio60%

Os mesmos agentes servem três clientes. Orçamentos, modelos e centros de custo separados — de acordo com o contrato de cada um. Tudo controlado por multitenant.

05  CONECTIVIDADE OPERACIONAL
A OPERAÇÃO NA PALMA DA MÃO

Sua operação inteira cabe numa conversa de WhatsApp.

Sem dashboard que ninguém abre. Você pergunta no canal que já usa e recebe, em tempo real, qualquer relatório da saúde da própria empresa.

06  SEGURANÇA & GOVERNANÇA
SECOPS · RBAC · VAULT

A infraestrutura também é onde a IA fica segura.

Tratar IA como infraestrutura abre uma camada que provedor nenhum entrega: credenciais que nunca tocam o modelo, acesso restrito por time e papel, e políticas de segurança aplicadas em tempo real.

D-01 · VAULT + RBACCREDENCIAIS + ACESSO
— CREDENCIAIS BLINDADAS

Vault + RBAC

Credenciais nunca expostas nos agentes. Cada time acessa só o que precisa — e o agente de relatórios cruza os dois, com permissão explícita.

D-02 · n8n + PERMISSÕESRELATÓRIO POR ROLE
— DADO CERTO, PESSOA CERTA

Permissão por relatório

O atendimento não consegue pedir o relatório financeiro. A diretoria não precisa pedir — ele chega sozinho. Controle granular sobre cada dado que a IA entrega.

D-03 · GATEWAY SecOpsAMEAÇA INTERCEPTADA
— POLÍTICA EM TEMPO REAL

SecOps no gateway

Credencial digitada no prompt é bloqueada antes de chegar ao modelo — e o gestor recebe o alerta no WhatsApp na hora. A janela de reação existe porque a infra cria ela.

07  O QUE ENTREGAMOS
04 FRENTES · MESMA INFRAESTRUTURA

O problema primeiro. A solução depois.

C-01

Relatórios com a sua marca, no WhatsApp

Seus dados viram relatório pronto — com a sua identidade visual — entregue onde o cliente já está. Sem PDF perdido, sem dashboard que ninguém abre.

ENTREGA · RECORRENTE · AUTOMÁTICA
C-02

Automação de processos operacionais

Tarefas repetitivas que consomem o time saem do manual e passam a rodar sozinhas — com registro de cada passo e ponto de controle humano onde importa.

OPERAÇÃO · MENOS RETRABALHO
C-03

Agentes conversacionais para atendimento e vendas

Atendimento que qualifica, responde e vende — 24/7, com o tom da sua empresa. Não é chatbot de árvore: é agente que entende contexto e age.

ATENDIMENTO · VENDAS · 24/7
C-04

Implementação de infraestrutura de IA

Montamos a base completa: isolada, monitorada e pronta para escalar. Você passa a ter capacidade de IA de empresa grande — operando sob o seu domínio.

FUNDAÇÃO · ISOLADA · ESCALÁVEL
08  PARA QUEM
04 PERFIS · 01 ESTRUTURA

Se você se reconhece aqui, a Horse Labs foi construída para você.

PERFIL 01

Times de engenharia

Com 5 a 50 devs usando AI ativamente. Você aprovou o orçamento de AI, mas não sabe quem gasta o quê. A Horse Labs dá visibilidade e controle por time, por projeto, por operação.

PERFIL 02

Líderes técnicos

CTOs e VPs de Engineering que precisam responder ao financeiro: quanto gastamos com AI esse mês, e por quê. Sem depender de planilha ou billing direto do OpenAI.

PERFIL 03

Empresas com AI em produção

Que já passaram da fase de experimento e precisam de governança real: rate limits, audit trail, bloqueio automático, deploy self-hosted. Sem lock-in de plataforma de big vendor.

PERFIL 04

Agências e consultorias que vendem IA para clientes

Você entrega projetos de IA para múltiplos clientes e precisa separar o custo de cada um — tanto para cobrar certo quanto para não misturar dados entre contas. A Horse Labs entrega multitenant real: orçamento, modelo e rastro de consumo por cliente, desde o primeiro deploy.

09  CENÁRIOS ILUSTRATIVOS
A MECÂNICA · NÃO O MARKETING

Como o problema vira solução, na prática.

Cenários ilustrativos — a mecânica de cada situação, não casos reais. Quando houver resultado de cliente, ele entra aqui com número e contexto.

Agência de marketing

Mesmos agentes, três clientes

O PROBLEMAUm único provedor, uma única conta. Impossível separar o que cada cliente consumiu — ou cobrar o custo certo de cada contrato.
A INFRA RESOLVEMultitenant no gateway: orçamento, modelo e centro de custo por cliente. O custo de cada projeto fica visível no WhatsApp.
PME de serviços

Atendimento sem pagar premium

O PROBLEMAChatbot de FAQ rodando no modelo mais caro, consumo sem teto e nenhuma visão de quem gasta o quê.
A INFRA RESOLVEO gateway roteia o atendimento para um modelo leve, aplica teto de orçamento e devolve governança por pessoa.
Startup · time de produto

Construir sem ficar refém

O PROBLEMAProduto acoplado às features proprietárias de um provedor — qualquer mudança de preço ou modelo respinga direto na operação.
A INFRA RESOLVEInfra provisionada na VPC da startup com Ansible e Terraform. Trocar de modelo vira configuração, não migração.
10  COMO É TRABALHAR COM A HORSE LABS
04 PASSOS · SEM SURPRESA

Do diagnóstico à operação contínua.

PASSO 01

Diagnóstico

Entendemos a operação atual: onde o tempo vaza, o que pode ser medido e onde a IA gera impacto real.

PASSO 02

Proposta

Escopo e métricas definidos antes de começar. Você sabe o que será entregue e como será medido.

PASSO 03

Implementação

Construímos e integramos sobre a infraestrutura isolada, monitorada e pronta para escalar.

PASSO 04

Operação contínua

Não sumimos depois de entregar. Operamos com dados, ajustamos e mantemos o resultado vivo.

11 PERGUNTAS FREQUENTES
DÚVIDAS DIRETAS

O que perguntam antes de começar.

O que é o LLM Gateway da Horse Labs?

É a camada de infraestrutura entre a sua operação e os provedores de LLM. Ela roteia cada tarefa para o melhor modelo — Claude, GPT, Gemini ou um modelo local —, aplica teto de orçamento por cliente e registra o custo de cada operação.

Como a Horse Labs evita o lock-in de provedor de IA?

Sua operação fala com o gateway, não diretamente com o provedor. Trocar de modelo vira configuração, não migração — se um provedor sobe o preço ou fica indisponível, outro assume sem reescrever nada.

A infraestrutura roda na minha empresa?

Sim. Provisionamos on-premise ou na sua VPC — AWS, Azure ou GCP — com Ansible e Terraform, isolada por tenant e sob o seu domínio.

Como funciona o controle de custo por cliente?

O modelo é multitenant: cada cliente ou centro de custo tem orçamento, modelo e rastro de consumo separados. Você acompanha o custo por operação — inclusive pelo WhatsApp.

Preciso entender de tecnologia para contratar?

Não. No modelo AI as a Service entregamos o resultado pronto — relatório, automação ou agente — com a métrica acordada antes de começar. Você contrata o resultado, não a ferramenta.

Qual a diferença entre a Horse Labs e o Portkey ou Helicone?

Portkey foi adquirida pela Palo Alto Networks em maio de 2026 e integrada ao Prisma AIRS — produto de segurança enterprise, com roadmap fora do controle da equipe original. Helicone foi adquirida pela Mintlify e está em maintenance mode desde março de 2026. A Horse Labs é independente, com roadmap próprio e foco em governança organizacional — não apenas observabilidade. Além disso: logging ilimitado sem cobrança por volume de registros, e self-hosted como cidadão de primeira classe, não como afterthought enterprise.

A Horse Labs é uma plataforma ou uma consultoria?

Os dois, em estágios: entregamos a implementação da infraestrutura (serviço) e operamos a plataforma que a governa continuamente (produto). O cliente contrata a implementação uma vez e usa a plataforma indefinidamente. Para quem já tem time técnico: é possível implementar internamente usando nossa documentação e usar só a camada de governança como SaaS.

— WHITEPAPER · EDIÇÃO EXECUTIVA

A camada operacional da inteligência.

Por que a empresa que vence não será a dona do melhor modelo — e sim a capaz de trocar de modelo sem parar a operação. Três estágios de maturidade, da desgovernança à infraestrutura governada.

  • Os oito sintomas de uma operação de IA descoberta.
  • Por que centralizar num único fornecedor é falsa governança.
  • A arquitetura-alvo: o LLM Gateway como camada operacional única.
PARA CTOs · ARQUITETOS · LÍDERES DE TRANSFORMAÇÃO
PDF · 13 páginas · Edição Executiva
— UMA CONVERSA, NÃO UMA APRESENTAÇÃO

Sem apresentação longa.
Uma conversa de 30 minutos.

O suficiente para entender se faz sentido — e, se não fizer, você sai com clareza do que precisa.

Wellington Nascimento
Wellington Nascimento
FUNDADOR · HORSE LABS