WP-2026-008 — IA e Privacidade por Design: Obrigações, Metodologias e Casos de Uso no Contexto Brasileiro
Autores: André Nakamura, Thiago Almeida Data: Março de 2026 Classificação: Working Paper DOI (preprint): IBGIA-WP-2026-008
Resumo Executivo
A integração entre Inteligência Artificial e proteção de dados pessoais representa um dos principais desafios regulatórios da atualidade. No Brasil, a Lei Geral de Proteção de Dados (LGPD) e o PL 2338/2023 (Marco Legal da IA) estabelecem obrigações complementares que demandam uma abordagem unificada de privacy by design (privacidade por design) e privacy by default (privacidade como padrão).
Este Working Paper analisa as intersecções normativas entre LGPD e o futuro Marco Legal da IA, mapeia metodologias internacionais de Privacy Impact Assessment (PIA) aplicadas a sistemas de IA, e propõe um framework adaptado à realidade jurídica e tecnológica brasileira. O objetivo é subsidiar organizações públicas e privadas na implementação de sistemas de IA que respeitem, por design, os direitos de proteção de dados dos cidadãos.
Palavras-chave: privacidade por design, LGPD, PL 2338/2023, avaliação de impacto, proteção de dados
1. Introdução
O desenvolvimento acelerado de sistemas de Inteligência Artificial levanta questões profundas sobre privacidade e proteção de dados. Algoritmos de machine learning processam volumes massivos de dados pessoais; sistemas de reconhecimento facial operam em espaços públicos; motores de recomendação perfilam comportamentos com granularidade sem precedentes.
No Brasil, este cenário é regulado por dois marcos normativos em interação:
- LGPD (Lei 13.709/2018): Estabelece os princípios, bases legais e direitos dos titulares no tratamento de dados pessoais
- PL 2338/2023: Define obrigações específicas para sistemas de IA, incluindo avaliações de impacto, transparência e supervisão humana
A convergência dessas normas cria um campo de obrigações sobrepostas — e oportunidades para uma abordagem integrada — que este Working Paper busca mapear.
1.1 O Conceito de Privacy by Design
Desenvolvido pela Dr.ª Ann Cavoukian nos anos 1990 e posteriormente incorporado ao GDPR europeu (Artigo 25), o privacy by design estabelece que a proteção de dados deve ser incorporada ao design de sistemas desde o início, e não acrescentada como camada posterior.
Os sete princípios fundadores são:
- Proativo, não reativo — prevenir antes de remediar
- Privacidade como padrão — configurações mais protetoras por default
- Incorporada ao design — não bolseada
- Funcionalidade plena — não zero-sum
- Segurança ponta a ponta — proteção durante todo o ciclo de vida
- Visibilidade e transparência — abertura
- Respeito pela privacidade do usuário — centrado no usuário
2. Marco Normativo: LGPD e Marco Legal da IA
2.1 Obrigações da LGPD Relevantes para Sistemas de IA
Bases legais para treinamento de modelos:
| Base Legal | Aplicação em IA | Limitações | |------------|-----------------|------------| | Legítimo interesse | Melhoria de serviços | Necessidade de balancing test | | Consentimento | Personalização | Revogabilidade complexa | | Execução de contrato | IA em serviços contratados | Escopo restrito | | Obrigação legal | IA em compliance | Limitado a requisito legal | | Interesse público | IA governamental | Requer finalidade pública real |
Direitos dos titulares com impacto em IA:
- Art. 20 LGPD: Direito de revisão de decisões automatizadas — o controlador deve fornecer "informações claras e adequadas" sobre critérios e procedimentos utilizados
- Art. 18: Direito de acesso, correção, anonimização, portabilidade e eliminação
- Art. 37: Dever de manutenção de Relatório de Impacto (RIPD) para tratamentos de alto risco
2.2 Obrigações do PL 2338/2023 Complementares
O PL 2338/2023 estabelece obrigações adicionais que se somam à LGPD:
Avaliação de Impacto Algorítmico (AIA):
- Obrigatória para sistemas de alto risco
- Deve mapear riscos a direitos fundamentais (incluindo privacidade)
- Exige documentação técnica acessível
Transparência ativa:
- Direito de saber quando se interage com IA
- Direito de explicação sobre decisões automatizadas
- Obrigações de rotulagem de conteúdo gerado por IA
Governança interna:
- Políticas de uso responsável de IA
- Responsável pela governança de IA (RGA) — análogo ao DPO da LGPD
3. Lacunas e Tensões Regulatórias
3.1 A Tensão Fundamentação-Privacidade em Modelos Generativos
Os modelos de IA generativa apresentam tensões específicas com a LGPD:
Memorização de dados de treinamento: Estudos demonstram que LLMs podem "vazar" informações pessoais presentes em seus dados de treinamento quando específicamente solicitados (Carlini et al., 2021). Isso cria obrigações de:
- Avaliação sistemática de presença de dados pessoais no corpus
- Técnicas de differential privacy no treinamento
- Mecanismos de unlearning (desaprendizado) mediante solicitação de titular
Base legal para mineração de texto e dados (TDM):
- A LGPD não possui isenção explícita para TDM em treinamento de IA
- O PL 2338/2023, em versão atual, não resolve a questão do legítimo interesse para treinamento
- Contrasta com o DSA/DMA europeu que cria isenção parcial para TDM
3.2 O Problema dos Dados Inferenciais
Sistemas de IA frequentemente inferem dados sensíveis a partir de dados aparentemente neutros:
- Predição de orientação sexual a partir de imagens faciais
- Inferência de condição de saúde a partir de padrões de compra
- Dedução de convicções políticas a partir de histórico de navegação
A LGPD trata dados inferenciais de modo ambíguo: se o dado de entrada não é sensível mas o output é, qual regime se aplica? O Art. 5º define "dado sensível" pelo conteúdo original, não pela inferência — lacuna que o Marco Legal da IA deveria preencher.
3.3 Retenção vs. Utilidade do Modelo
A minimização de dados (princípio LGPD) entra em conflito com a necessidade de dados para performance de modelos. Soluções técnicas emergentes:
- Federated Learning: Treina modelos sem centralizar dados
- Synthetic data generation: Usa dados sintéticos estatisticamente equivalentes
- Differential privacy: Adiciona ruído matemático para preservar privacidade
4. Framework PbD-IA: Privacidade por Design para Sistemas de IA
4.1 As Cinco Camadas do Framework
Camada 1 — Dados: Minimização na coleta; anonimização/pseudonimização; controle de retenção
Camada 2 — Modelo: Técnicas de privacy-preserving ML; documentação de corpus; auditoria de memorização
Camada 3 — Sistema: Controles de acesso; logs de uso; mecanismos de explicabilidade
Camada 4 — Processo: RIPD integrado à AIA; ciclo de revisão periódica; gestão de incidentes de IA
Camada 5 — Governança: DPO + RGA integrados; políticas unificadas LGPD+IA; canal de direitos dos titulares
4.2 Matriz de Análise PbD-IA
| Fase do Ciclo de Vida | Obrigações LGPD | Obrigações PL 2338 | Controle PbD-IA | |----------------------|-----------------|---------------------|-----------------| | Concepção | Levantamento de bases legais | Classificação de risco | Design Privacy Canvas | | Coleta | Transparência, consentimento | Documentação técnica | Data minimization audit | | Treinamento | RIPD se alto risco | AIA se alto risco | Privacy-preserving ML | | Implantação | Política de retenção | Supervisão humana | Explainability layer | | Operação | Atendimento a direitos | Monitoramento de viés | Ongoing audit protocol | | Descontinuação | Eliminação de dados | Documentação de riscos | Data lifecycle closure |
4.3 O Relatório Unificado RIPD-AIA
O IBGIA propõe um instrumento único que atende simultaneamente às exigências de Relatório de Impacto à Proteção de Dados (LGPD) e de Avaliação de Impacto Algorítmico (PL 2338/2023):
Seção 1 — Descrição do sistema (LGPD + IA)
- Finalidade e bases legais
- Dados processados e fontes
- Algoritmos e arquitetura (em linguagem acessível)
- Fluxo de dados e operadores envolvidos
Seção 2 — Análise de risco (LGPD)
- Identificação de riscos à privacidade
- Medidas técnicas e organizacionais
- Residual risk assessment
Seção 3 — Avaliação de impacto algorítmico (PL 2338)
- Riscos a direitos fundamentais
- Análise de viés e discriminação
- Mecanismos de contestação
Seção 4 — Plano de mitigação e revisão
- Ações corretivas com prazo
- Calendário de revisão
- Responsáveis (DPO/RGA)
5. Casos de Uso
5.1 IA em Concessão de Crédito
Contexto: Sistema de scoring automatizado para aprovação de crédito (alto risco)
Obrigações LGPD:
- Art. 20: Direito de revisão + informação sobre critérios
- Bases legais: execução de contrato + legítimo interesse (com balancing test)
- RIPD obrigatório
Obrigações PL 2338:
- AIA obrigatória
- Supervisão humana em decisões de negação
- Transparência sobre variáveis utilizadas
Controles PbD-IA:
- Minimizar variáveis a preditores com validação empírica
- Excluir variáveis proxy de características sensíveis
- Implementar explicabilidade via SHAP/LIME
- Canal de contestação com revisão humana em até 72h
5.2 IA em Processo Seletivo de RH
Contexto: Triagem automatizada de currículos e análise de entrevistas em vídeo
Principais riscos:
- Discriminação algorítmica por gênero, raça, idade
- Inferência de dados sensíveis (estado de saúde, gravidez, convicções)
- Viés de confirmação (modelo treinado em histórico discriminatório)
Framework de conformidade:
- Auditoria de viés antes do deployment
- RIPD + AIA conjuntos
- Supervisão humana em todas as etapas de exclusão
- Informação clara ao candidato sobre uso de IA
- Canal de questionamento com resposta em 15 dias úteis
5.3 Chatbot de Atendimento ao Cidadão (Setor Público)
Contexto: Prefeitura implanta chatbot com LLM para atendimento a serviços públicos
Peculiaridades do setor público:
- LGPD se aplica a entes públicos
- Base legal principal: cumprimento de obrigação legal + execução de políticas públicas
- Dados podem incluir saúde, renda, composição familiar
Controles específicos:
- Não armazenar dados além do necessário para a sessão
- Identificação obrigatória como sistema de IA (Art. 8 PL 2338)
- Transferência para atendente humano disponível a qualquer momento
- Audit trail de todas as interações por 5 anos (Lei de Acesso à Informação)
6. Recomendações
Para Organizações
- Integrar DPO e responsável por IA — criar função unificada ou protocolo formal de colaboração
- Adotar o RIPD-AIA unificado para todos os sistemas de IA de alto risco
- Implementar Privacy Canvas na fase de concepção de novos sistemas
- Realizar auditoria anual de modelos em produção para verificação de memorização e viés
- Treinar equipes de desenvolvimento em privacy-preserving ML (federated learning, differential privacy)
Para o Regulador (ANPD)
- Emitir orientação sobre TDM: Esclarecer quais bases legais permitem mineração de texto para treinamento de IA
- Harmonizar RIPD e AIA: Desenvolver template único aceito por ANPD e futuro regulador de IA
- Fiscalização coordenada: Estabelecer protocolo com futuro órgão regulador de IA para inspeções conjuntas
- Guia de dados inferenciais: Esclarecer regime aplicável a dados sensíveis inferidos por IA
Para o Legislador
- Incluir isenção TDM no Marco Legal da IA: Definir condições para treinamento legítimo sem consentimento individual
- Definir "dado inferido sensível": Regulamentar tratamento de outputs sensíveis de modelos mesmo com inputs não-sensíveis
- Prever direito ao unlearning: Mecanismo para eliminação de influência de dados específicos em modelos treinados
7. Conclusões
A intersecção entre IA e privacidade não é um problema a ser resolvido no futuro — é uma realidade regulatória presente. Organizações que operam sistemas de IA no Brasil já estão sujeitas às obrigações da LGPD e, quando o Marco Legal da IA for aprovado, estarão sujeitas à camada adicional de obrigações algorítmicas.
A abordagem privacy by design para IA não é apenas uma exigência de conformidade — é uma vantagem competitiva e de confiança. Sistemas que respeitam privacidade por design geram menos riscos regulatórios, maior confiança do usuário e arquiteturas mais robustas.
O framework PbD-IA proposto neste Working Paper oferece um roteiro prático para organizações que buscam integrar as obrigações da LGPD e do futuro Marco Legal da IA em um programa coerente de governança de dados e algoritmos.
Referências Principais
- ANPD. Guia de Boas Práticas LGPD para Inteligência Artificial. 2024.
- Cavoukian, A. Privacy by Design: The 7 Foundational Principles. Information and Privacy Commissioner of Ontario, 2009.
- Carlini, N. et al. Extracting Training Data from Large Language Models. USENIX Security, 2021.
- European Data Protection Board. Guidelines 05/2020 on Consent under Regulation 2016/679. 2020.
- ICO (UK). Explaining Decisions Made with AI. 2020.
- INAI (México). Guía para el Tratamiento de Datos Personales mediante IA. 2023.
- Senado Federal. PL 2338/2023 — Estabelece normas gerais de caráter nacional para o desenvolvimento, implementação e uso responsável da inteligência artificial no Brasil. 2023.
© 2026 Instituto Brasileiro de Governança em IA (IBGIA). Distribuição livre para fins educacionais e de pesquisa.