IBGIA - Instituto Brasileiro de Governança em Inteligência Artificial
WP-2026-008

IA e Privacidade por Design: Obrigações, Metodologias e Casos de Uso no Contexto Brasileiro

André Nakamura, Thiago AlmeidaMarço 2026IBGIA Working Paper Series

WP-2026-008 — IA e Privacidade por Design: Obrigações, Metodologias e Casos de Uso no Contexto Brasileiro

Autores: André Nakamura, Thiago Almeida Data: Março de 2026 Classificação: Working Paper DOI (preprint): IBGIA-WP-2026-008


Resumo Executivo

A integração entre Inteligência Artificial e proteção de dados pessoais representa um dos principais desafios regulatórios da atualidade. No Brasil, a Lei Geral de Proteção de Dados (LGPD) e o PL 2338/2023 (Marco Legal da IA) estabelecem obrigações complementares que demandam uma abordagem unificada de privacy by design (privacidade por design) e privacy by default (privacidade como padrão).

Este Working Paper analisa as intersecções normativas entre LGPD e o futuro Marco Legal da IA, mapeia metodologias internacionais de Privacy Impact Assessment (PIA) aplicadas a sistemas de IA, e propõe um framework adaptado à realidade jurídica e tecnológica brasileira. O objetivo é subsidiar organizações públicas e privadas na implementação de sistemas de IA que respeitem, por design, os direitos de proteção de dados dos cidadãos.

Palavras-chave: privacidade por design, LGPD, PL 2338/2023, avaliação de impacto, proteção de dados


1. Introdução

O desenvolvimento acelerado de sistemas de Inteligência Artificial levanta questões profundas sobre privacidade e proteção de dados. Algoritmos de machine learning processam volumes massivos de dados pessoais; sistemas de reconhecimento facial operam em espaços públicos; motores de recomendação perfilam comportamentos com granularidade sem precedentes.

No Brasil, este cenário é regulado por dois marcos normativos em interação:

  • LGPD (Lei 13.709/2018): Estabelece os princípios, bases legais e direitos dos titulares no tratamento de dados pessoais
  • PL 2338/2023: Define obrigações específicas para sistemas de IA, incluindo avaliações de impacto, transparência e supervisão humana

A convergência dessas normas cria um campo de obrigações sobrepostas — e oportunidades para uma abordagem integrada — que este Working Paper busca mapear.

1.1 O Conceito de Privacy by Design

Desenvolvido pela Dr.ª Ann Cavoukian nos anos 1990 e posteriormente incorporado ao GDPR europeu (Artigo 25), o privacy by design estabelece que a proteção de dados deve ser incorporada ao design de sistemas desde o início, e não acrescentada como camada posterior.

Os sete princípios fundadores são:

  1. Proativo, não reativo — prevenir antes de remediar
  2. Privacidade como padrão — configurações mais protetoras por default
  3. Incorporada ao design — não bolseada
  4. Funcionalidade plena — não zero-sum
  5. Segurança ponta a ponta — proteção durante todo o ciclo de vida
  6. Visibilidade e transparência — abertura
  7. Respeito pela privacidade do usuário — centrado no usuário

2. Marco Normativo: LGPD e Marco Legal da IA

2.1 Obrigações da LGPD Relevantes para Sistemas de IA

Bases legais para treinamento de modelos:

| Base Legal | Aplicação em IA | Limitações | |------------|-----------------|------------| | Legítimo interesse | Melhoria de serviços | Necessidade de balancing test | | Consentimento | Personalização | Revogabilidade complexa | | Execução de contrato | IA em serviços contratados | Escopo restrito | | Obrigação legal | IA em compliance | Limitado a requisito legal | | Interesse público | IA governamental | Requer finalidade pública real |

Direitos dos titulares com impacto em IA:

  • Art. 20 LGPD: Direito de revisão de decisões automatizadas — o controlador deve fornecer "informações claras e adequadas" sobre critérios e procedimentos utilizados
  • Art. 18: Direito de acesso, correção, anonimização, portabilidade e eliminação
  • Art. 37: Dever de manutenção de Relatório de Impacto (RIPD) para tratamentos de alto risco

2.2 Obrigações do PL 2338/2023 Complementares

O PL 2338/2023 estabelece obrigações adicionais que se somam à LGPD:

Avaliação de Impacto Algorítmico (AIA):

  • Obrigatória para sistemas de alto risco
  • Deve mapear riscos a direitos fundamentais (incluindo privacidade)
  • Exige documentação técnica acessível

Transparência ativa:

  • Direito de saber quando se interage com IA
  • Direito de explicação sobre decisões automatizadas
  • Obrigações de rotulagem de conteúdo gerado por IA

Governança interna:

  • Políticas de uso responsável de IA
  • Responsável pela governança de IA (RGA) — análogo ao DPO da LGPD

3. Lacunas e Tensões Regulatórias

3.1 A Tensão Fundamentação-Privacidade em Modelos Generativos

Os modelos de IA generativa apresentam tensões específicas com a LGPD:

Memorização de dados de treinamento: Estudos demonstram que LLMs podem "vazar" informações pessoais presentes em seus dados de treinamento quando específicamente solicitados (Carlini et al., 2021). Isso cria obrigações de:

  • Avaliação sistemática de presença de dados pessoais no corpus
  • Técnicas de differential privacy no treinamento
  • Mecanismos de unlearning (desaprendizado) mediante solicitação de titular

Base legal para mineração de texto e dados (TDM):

  • A LGPD não possui isenção explícita para TDM em treinamento de IA
  • O PL 2338/2023, em versão atual, não resolve a questão do legítimo interesse para treinamento
  • Contrasta com o DSA/DMA europeu que cria isenção parcial para TDM

3.2 O Problema dos Dados Inferenciais

Sistemas de IA frequentemente inferem dados sensíveis a partir de dados aparentemente neutros:

  • Predição de orientação sexual a partir de imagens faciais
  • Inferência de condição de saúde a partir de padrões de compra
  • Dedução de convicções políticas a partir de histórico de navegação

A LGPD trata dados inferenciais de modo ambíguo: se o dado de entrada não é sensível mas o output é, qual regime se aplica? O Art. 5º define "dado sensível" pelo conteúdo original, não pela inferência — lacuna que o Marco Legal da IA deveria preencher.

3.3 Retenção vs. Utilidade do Modelo

A minimização de dados (princípio LGPD) entra em conflito com a necessidade de dados para performance de modelos. Soluções técnicas emergentes:

  • Federated Learning: Treina modelos sem centralizar dados
  • Synthetic data generation: Usa dados sintéticos estatisticamente equivalentes
  • Differential privacy: Adiciona ruído matemático para preservar privacidade

4. Framework PbD-IA: Privacidade por Design para Sistemas de IA

4.1 As Cinco Camadas do Framework

Camada 1 — Dados: Minimização na coleta; anonimização/pseudonimização; controle de retenção

Camada 2 — Modelo: Técnicas de privacy-preserving ML; documentação de corpus; auditoria de memorização

Camada 3 — Sistema: Controles de acesso; logs de uso; mecanismos de explicabilidade

Camada 4 — Processo: RIPD integrado à AIA; ciclo de revisão periódica; gestão de incidentes de IA

Camada 5 — Governança: DPO + RGA integrados; políticas unificadas LGPD+IA; canal de direitos dos titulares

4.2 Matriz de Análise PbD-IA

| Fase do Ciclo de Vida | Obrigações LGPD | Obrigações PL 2338 | Controle PbD-IA | |----------------------|-----------------|---------------------|-----------------| | Concepção | Levantamento de bases legais | Classificação de risco | Design Privacy Canvas | | Coleta | Transparência, consentimento | Documentação técnica | Data minimization audit | | Treinamento | RIPD se alto risco | AIA se alto risco | Privacy-preserving ML | | Implantação | Política de retenção | Supervisão humana | Explainability layer | | Operação | Atendimento a direitos | Monitoramento de viés | Ongoing audit protocol | | Descontinuação | Eliminação de dados | Documentação de riscos | Data lifecycle closure |

4.3 O Relatório Unificado RIPD-AIA

O IBGIA propõe um instrumento único que atende simultaneamente às exigências de Relatório de Impacto à Proteção de Dados (LGPD) e de Avaliação de Impacto Algorítmico (PL 2338/2023):

Seção 1 — Descrição do sistema (LGPD + IA)

  • Finalidade e bases legais
  • Dados processados e fontes
  • Algoritmos e arquitetura (em linguagem acessível)
  • Fluxo de dados e operadores envolvidos

Seção 2 — Análise de risco (LGPD)

  • Identificação de riscos à privacidade
  • Medidas técnicas e organizacionais
  • Residual risk assessment

Seção 3 — Avaliação de impacto algorítmico (PL 2338)

  • Riscos a direitos fundamentais
  • Análise de viés e discriminação
  • Mecanismos de contestação

Seção 4 — Plano de mitigação e revisão

  • Ações corretivas com prazo
  • Calendário de revisão
  • Responsáveis (DPO/RGA)

5. Casos de Uso

5.1 IA em Concessão de Crédito

Contexto: Sistema de scoring automatizado para aprovação de crédito (alto risco)

Obrigações LGPD:

  • Art. 20: Direito de revisão + informação sobre critérios
  • Bases legais: execução de contrato + legítimo interesse (com balancing test)
  • RIPD obrigatório

Obrigações PL 2338:

  • AIA obrigatória
  • Supervisão humana em decisões de negação
  • Transparência sobre variáveis utilizadas

Controles PbD-IA:

  • Minimizar variáveis a preditores com validação empírica
  • Excluir variáveis proxy de características sensíveis
  • Implementar explicabilidade via SHAP/LIME
  • Canal de contestação com revisão humana em até 72h

5.2 IA em Processo Seletivo de RH

Contexto: Triagem automatizada de currículos e análise de entrevistas em vídeo

Principais riscos:

  • Discriminação algorítmica por gênero, raça, idade
  • Inferência de dados sensíveis (estado de saúde, gravidez, convicções)
  • Viés de confirmação (modelo treinado em histórico discriminatório)

Framework de conformidade:

  1. Auditoria de viés antes do deployment
  2. RIPD + AIA conjuntos
  3. Supervisão humana em todas as etapas de exclusão
  4. Informação clara ao candidato sobre uso de IA
  5. Canal de questionamento com resposta em 15 dias úteis

5.3 Chatbot de Atendimento ao Cidadão (Setor Público)

Contexto: Prefeitura implanta chatbot com LLM para atendimento a serviços públicos

Peculiaridades do setor público:

  • LGPD se aplica a entes públicos
  • Base legal principal: cumprimento de obrigação legal + execução de políticas públicas
  • Dados podem incluir saúde, renda, composição familiar

Controles específicos:

  • Não armazenar dados além do necessário para a sessão
  • Identificação obrigatória como sistema de IA (Art. 8 PL 2338)
  • Transferência para atendente humano disponível a qualquer momento
  • Audit trail de todas as interações por 5 anos (Lei de Acesso à Informação)

6. Recomendações

Para Organizações

  1. Integrar DPO e responsável por IA — criar função unificada ou protocolo formal de colaboração
  2. Adotar o RIPD-AIA unificado para todos os sistemas de IA de alto risco
  3. Implementar Privacy Canvas na fase de concepção de novos sistemas
  4. Realizar auditoria anual de modelos em produção para verificação de memorização e viés
  5. Treinar equipes de desenvolvimento em privacy-preserving ML (federated learning, differential privacy)

Para o Regulador (ANPD)

  1. Emitir orientação sobre TDM: Esclarecer quais bases legais permitem mineração de texto para treinamento de IA
  2. Harmonizar RIPD e AIA: Desenvolver template único aceito por ANPD e futuro regulador de IA
  3. Fiscalização coordenada: Estabelecer protocolo com futuro órgão regulador de IA para inspeções conjuntas
  4. Guia de dados inferenciais: Esclarecer regime aplicável a dados sensíveis inferidos por IA

Para o Legislador

  1. Incluir isenção TDM no Marco Legal da IA: Definir condições para treinamento legítimo sem consentimento individual
  2. Definir "dado inferido sensível": Regulamentar tratamento de outputs sensíveis de modelos mesmo com inputs não-sensíveis
  3. Prever direito ao unlearning: Mecanismo para eliminação de influência de dados específicos em modelos treinados

7. Conclusões

A intersecção entre IA e privacidade não é um problema a ser resolvido no futuro — é uma realidade regulatória presente. Organizações que operam sistemas de IA no Brasil já estão sujeitas às obrigações da LGPD e, quando o Marco Legal da IA for aprovado, estarão sujeitas à camada adicional de obrigações algorítmicas.

A abordagem privacy by design para IA não é apenas uma exigência de conformidade — é uma vantagem competitiva e de confiança. Sistemas que respeitam privacidade por design geram menos riscos regulatórios, maior confiança do usuário e arquiteturas mais robustas.

O framework PbD-IA proposto neste Working Paper oferece um roteiro prático para organizações que buscam integrar as obrigações da LGPD e do futuro Marco Legal da IA em um programa coerente de governança de dados e algoritmos.


Referências Principais

  • ANPD. Guia de Boas Práticas LGPD para Inteligência Artificial. 2024.
  • Cavoukian, A. Privacy by Design: The 7 Foundational Principles. Information and Privacy Commissioner of Ontario, 2009.
  • Carlini, N. et al. Extracting Training Data from Large Language Models. USENIX Security, 2021.
  • European Data Protection Board. Guidelines 05/2020 on Consent under Regulation 2016/679. 2020.
  • ICO (UK). Explaining Decisions Made with AI. 2020.
  • INAI (México). Guía para el Tratamiento de Datos Personales mediante IA. 2023.
  • Senado Federal. PL 2338/2023 — Estabelece normas gerais de caráter nacional para o desenvolvimento, implementação e uso responsável da inteligência artificial no Brasil. 2023.

© 2026 Instituto Brasileiro de Governança em IA (IBGIA). Distribuição livre para fins educacionais e de pesquisa.

CompartilharLinkedInWhatsApp