DLP (Data Loss Prevention)
Conjunto de controles que impede dado sensível de sair do perímetro. Em IA, significa inspecionar cada prompt antes do provedor e mascarar ou bloquear CPF, cartão, credenciais e PII.
Por que importa
DLP — Data Loss Prevention, ou prevenção de perda de dados — é a disciplina de impedir que informação sensível atravesse a fronteira da organização. No contexto de IA, essa fronteira é o prompt: tudo que o usuário digita e manda para o modelo sai da sua operação rumo a um provedor externo. Sem DLP nesse ponto, um CPF colado para o modelo conferir, uma chave de API dentro de um trecho de código ou o segredo de um cliente embutido no contexto viram tokens enviados para fora — e muitas vezes registrados em logs que ninguém revisa.
O que torna o DLP em IA específico é que o vazamento acontece pelo uso normal, não por um ataque. Ninguém está burlando uma proteção; é que não há proteção nenhuma entre o que se digita e o modelo que recebe. E o dado que saiu não volta. Por isso o controle precisa estar no caminho da chamada, não num manual de boas práticas.
Como funciona
Um DLP de IA inspeciona o conteúdo antes de a chamada chegar ao provedor — pré-call, na camada do gateway. A detecção tem duas frentes complementares. A primeira é determinística: padrões conhecidos — chaves de API, segredos, formatos de documento — reconhecidos por regex executada sob o Google RE2, que é imune a ReDoS e por isso roda com segurança em cada requisição. A segunda é de NLP, com o Microsoft Presidio, que reconhece o que não tem formato fixo, como nome de pessoa. Juntas, cobrem tanto o segredo de padrão rígido quanto a PII que só se identifica pelo contexto.
Ao registrar um achado, há duas respostas: mascarar o trecho — substituindo o dado sensível e deixando a chamada seguir sem ele — ou bloquear a requisição por inteiro. A escolha é de política, definida por organização, com três modos: Off (a verificação não roda), Monitor (o achado é registrado mas a chamada segue, para medir exposição antes de endurecer) e Block (o dado sensível impede o envio). Assim a organização calibra o rigor ao próprio risco sem trocar de ferramenta.
Como a Horse Labs trata
Na Horse Labs, cada chamada passa por um guardrail SecOps no gateway antes de chegar ao provedor — o ponto único onde PII e segredos são detectados antes do envio. O guardrail combina a detecção determinística (regex sob RE2) com a camada NLP do Presidio, e aplica a política por organização nos modos Off, Monitor ou Block. Resolvido pré-call, o dado sensível não está mais presente quando o restante da cadeia registra a requisição: o que não foi enviado não pode ser logado.
Erros comuns
O erro mais frequente é tratar DLP como revisão manual de prompt: pedir que cada desenvolvedor lembre de limpar o conteúdo antes de enviar. Isso não escala e não é confiável — depende de todo mundo lembrar, sempre, em todo código, e um único esquecimento já expõe o dado. O segundo erro é deixar o DLP falhar aberto: se o detector fica indisponível e a chamada passa mesmo assim, a proteção some justamente no instante em que seria necessária. Um DLP de verdade é fail-closed e roda num ponto único, não na disciplina de cada pessoa.