WP-2026-008 — IA e Privacidade por Design: Obrigações, Metodologias e Casos de Uso no Contexto Brasileiro

Autores: Equipe IBGIA Data: Março de 2026 Classificação: Análise Técnica

Resumo Executivo

A integração entre Inteligência Artificial e proteção de dados pessoais representa um dos principais desafios regulatórios da atualidade. No Brasil, a Lei Geral de Proteção de Dados (LGPD) e o PL 2338/2023 (Marco Legal da IA) estabelecem obrigações complementares que demandam uma abordagem unificada de privacy by design (privacidade por design) e privacy by default (privacidade como padrão).

Esta análise técnica analisa as intersecções normativas entre LGPD e o futuro Marco Legal da IA, mapeia metodologias internacionais de Privacy Impact Assessment (PIA) aplicadas a sistemas de IA, e propõe um framework adaptado à realidade jurídica e tecnológica brasileira. O objetivo é subsidiar organizações públicas e privadas na implementação de sistemas de IA que respeitem, por design, os direitos de proteção de dados dos cidadãos.

Palavras-chave: privacidade por design, LGPD, PL 2338/2023, avaliação de impacto, proteção de dados

1. Introdução

O desenvolvimento acelerado de sistemas de Inteligência Artificial levanta questões profundas sobre privacidade e proteção de dados. Algoritmos de machine learning processam volumes massivos de dados pessoais; sistemas de reconhecimento facial operam em espaços públicos; motores de recomendação perfilam comportamentos com granularidade sem precedentes.

No Brasil, este cenário é regulado por dois marcos normativos em interação:

LGPD (Lei 13.709/2018): Estabelece os princípios, bases legais e direitos dos titulares no tratamento de dados pessoais
PL 2338/2023: Define obrigações específicas para sistemas de IA, incluindo avaliações de impacto, transparência e supervisão humana

A convergência dessas normas cria um campo de obrigações sobrepostas — e oportunidades para uma abordagem integrada — que esta análise técnica busca mapear.

1.1 O Conceito de Privacy by Design

Desenvolvido pela Dr.ª Ann Cavoukian nos anos 1990 e posteriormente incorporado ao GDPR europeu (Artigo 25), o privacy by design estabelece que a proteção de dados deve ser incorporada ao design de sistemas desde o início, e não acrescentada como camada posterior.

Os sete princípios fundadores são:

Proativo, não reativo — prevenir antes de remediar
Privacidade como padrão — configurações mais protetoras por default
Incorporada ao design — não bolseada
Funcionalidade plena — não zero-sum
Segurança ponta a ponta — proteção durante todo o ciclo de vida
Visibilidade e transparência — abertura
Respeito pela privacidade do usuário — centrado no usuário

2. Marco Normativo: LGPD e Marco Legal da IA

2.1 Obrigações da LGPD Relevantes para Sistemas de IA

Bases legais para treinamento de modelos:

| Base Legal | Aplicação em IA | Limitações | |------------|-----------------|------------| | Legítimo interesse | Melhoria de serviços | Necessidade de balancing test | | Consentimento | Personalização | Revogabilidade complexa | | Execução de contrato | IA em serviços contratados | Escopo restrito | | Obrigação legal | IA em compliance | Limitado a requisito legal | | Interesse público | IA governamental | Requer finalidade pública real |

Direitos dos titulares com impacto em IA:

Art. 20 LGPD: Direito de revisão de decisões automatizadas — o controlador deve fornecer "informações claras e adequadas" sobre critérios e procedimentos utilizados
Art. 18: Direito de acesso, correção, anonimização, portabilidade e eliminação
Art. 37: Dever de manutenção de Relatório de Impacto (RIPD) para tratamentos de alto risco

2.2 Obrigações do PL 2338/2023 Complementares

O PL 2338/2023 estabelece obrigações adicionais que se somam à LGPD:

Avaliação de Impacto Algorítmico (AIA):

Obrigatória para sistemas de alto risco
Deve mapear riscos a direitos fundamentais (incluindo privacidade)
Exige documentação técnica acessível

Transparência ativa:

Direito de saber quando se interage com IA
Direito de explicação sobre decisões automatizadas
Obrigações de rotulagem de conteúdo gerado por IA

Governança interna:

Políticas de uso responsável de IA
Responsável pela governança de IA (RGA) — análogo ao DPO da LGPD

3. Lacunas e Tensões Regulatórias

3.1 A Tensão Fundamentação-Privacidade em Modelos Generativos

Os modelos de IA generativa apresentam tensões específicas com a LGPD:

Memorização de dados de treinamento: Estudos demonstram que LLMs podem "vazar" informações pessoais presentes em seus dados de treinamento quando específicamente solicitados (Carlini et al., 2021). Isso cria obrigações de:

Avaliação sistemática de presença de dados pessoais no corpus
Técnicas de differential privacy no treinamento
Mecanismos de unlearning (desaprendizado) mediante solicitação de titular

Base legal para mineração de texto e dados (TDM):

A LGPD não possui isenção explícita para TDM em treinamento de IA
O PL 2338/2023, em versão atual, não resolve a questão do legítimo interesse para treinamento
Contrasta com o DSA/DMA europeu que cria isenção parcial para TDM

3.2 O Problema dos Dados Inferenciais

Sistemas de IA frequentemente inferem dados sensíveis a partir de dados aparentemente neutros:

Predição de orientação sexual a partir de imagens faciais
Inferência de condição de saúde a partir de padrões de compra
Dedução de convicções políticas a partir de histórico de navegação

A LGPD trata dados inferenciais de modo ambíguo: se o dado de entrada não é sensível mas o output é, qual regime se aplica? O Art. 5º define "dado sensível" pelo conteúdo original, não pela inferência — lacuna que o Marco Legal da IA deveria preencher.

3.3 Retenção vs. Utilidade do Modelo

A minimização de dados (princípio LGPD) entra em conflito com a necessidade de dados para performance de modelos. Soluções técnicas emergentes:

Federated Learning: Treina modelos sem centralizar dados
Synthetic data generation: Usa dados sintéticos estatisticamente equivalentes
Differential privacy: Adiciona ruído matemático para preservar privacidade

4. Framework PbD-IA: Privacidade por Design para Sistemas de IA

4.1 As Cinco Camadas do Framework

Camada 1 — Dados: Minimização na coleta; anonimização/pseudonimização; controle de retenção

Camada 2 — Modelo: Técnicas de privacy-preserving ML; documentação de corpus; auditoria de memorização

Camada 3 — Sistema: Controles de acesso; logs de uso; mecanismos de explicabilidade

Camada 4 — Processo: RIPD integrado à AIA; ciclo de revisão periódica; gestão de incidentes de IA

Camada 5 — Governança: DPO + RGA integrados; políticas unificadas LGPD+IA; canal de direitos dos titulares

4.2 Matriz de Análise PbD-IA

| Fase do Ciclo de Vida | Obrigações LGPD | Obrigações PL 2338 | Controle PbD-IA | |----------------------|-----------------|---------------------|-----------------| | Concepção | Levantamento de bases legais | Classificação de risco | Design Privacy Canvas | | Coleta | Transparência, consentimento | Documentação técnica | Data minimization audit | | Treinamento | RIPD se alto risco | AIA se alto risco | Privacy-preserving ML | | Implantação | Política de retenção | Supervisão humana | Explainability layer | | Operação | Atendimento a direitos | Monitoramento de viés | Ongoing audit protocol | | Descontinuação | Eliminação de dados | Documentação de riscos | Data lifecycle closure |

4.3 O Relatório Unificado RIPD-AIA

O IBGIA propõe um instrumento único que atende simultaneamente às exigências de Relatório de Impacto à Proteção de Dados (LGPD) e de Avaliação de Impacto Algorítmico (PL 2338/2023):

Seção 1 — Descrição do sistema (LGPD + IA)

Finalidade e bases legais
Dados processados e fontes
Algoritmos e arquitetura (em linguagem acessível)
Fluxo de dados e operadores envolvidos

Seção 2 — Análise de risco (LGPD)

Identificação de riscos à privacidade
Medidas técnicas e organizacionais
Residual risk assessment

Seção 3 — Avaliação de impacto algorítmico (PL 2338)

Riscos a direitos fundamentais
Análise de viés e discriminação
Mecanismos de contestação

Seção 4 — Plano de mitigação e revisão

Ações corretivas com prazo
Calendário de revisão
Responsáveis (DPO/RGA)

5. Casos de Uso

5.1 IA em Concessão de Crédito

Contexto: Sistema de scoring automatizado para aprovação de crédito (alto risco)

Obrigações LGPD:

Art. 20: Direito de revisão + informação sobre critérios
Bases legais: execução de contrato + legítimo interesse (com balancing test)
RIPD obrigatório

Obrigações PL 2338:

AIA obrigatória
Supervisão humana em decisões de negação
Transparência sobre variáveis utilizadas

Controles PbD-IA:

Minimizar variáveis a preditores com validação empírica
Excluir variáveis proxy de características sensíveis
Implementar explicabilidade via SHAP/LIME
Canal de contestação com revisão humana em até 72h

5.2 IA em Processo Seletivo de RH

Contexto: Triagem automatizada de currículos e análise de entrevistas em vídeo

Principais riscos:

Discriminação algorítmica por gênero, raça, idade
Inferência de dados sensíveis (estado de saúde, gravidez, convicções)
Viés de confirmação (modelo treinado em histórico discriminatório)

Framework de conformidade:

Auditoria de viés antes do deployment
RIPD + AIA conjuntos
Supervisão humana em todas as etapas de exclusão
Informação clara ao candidato sobre uso de IA
Canal de questionamento com resposta em 15 dias úteis

5.3 Chatbot de Atendimento ao Cidadão (Setor Público)

Contexto: Prefeitura implanta chatbot com LLM para atendimento a serviços públicos

Peculiaridades do setor público:

LGPD se aplica a entes públicos
Base legal principal: cumprimento de obrigação legal + execução de políticas públicas
Dados podem incluir saúde, renda, composição familiar

Controles específicos:

Não armazenar dados além do necessário para a sessão
Identificação obrigatória como sistema de IA (Art. 8 PL 2338)
Transferência para atendente humano disponível a qualquer momento
Audit trail de todas as interações por 5 anos (Lei de Acesso à Informação)

6. Recomendações

Para Organizações

Integrar DPO e responsável por IA — criar função unificada ou protocolo formal de colaboração
Adotar o RIPD-AIA unificado para todos os sistemas de IA de alto risco
Implementar Privacy Canvas na fase de concepção de novos sistemas
Realizar auditoria anual de modelos em produção para verificação de memorização e viés
Treinar equipes de desenvolvimento em privacy-preserving ML (federated learning, differential privacy)

Para o Regulador (ANPD)

Emitir orientação sobre TDM: Esclarecer quais bases legais permitem mineração de texto para treinamento de IA
Harmonizar RIPD e AIA: Desenvolver template único aceito por ANPD e futuro regulador de IA
Fiscalização coordenada: Estabelecer protocolo com futuro órgão regulador de IA para inspeções conjuntas
Guia de dados inferenciais: Esclarecer regime aplicável a dados sensíveis inferidos por IA

Para o Legislador

Incluir isenção TDM no Marco Legal da IA: Definir condições para treinamento legítimo sem consentimento individual
Definir "dado inferido sensível": Regulamentar tratamento de outputs sensíveis de modelos mesmo com inputs não-sensíveis
Prever direito ao unlearning: Mecanismo para eliminação de influência de dados específicos em modelos treinados

7. Conclusões

A intersecção entre IA e privacidade não é um problema a ser resolvido no futuro — é uma realidade regulatória presente. Organizações que operam sistemas de IA no Brasil já estão sujeitas às obrigações da LGPD e, quando o Marco Legal da IA for aprovado, estarão sujeitas à camada adicional de obrigações algorítmicas.

A abordagem privacy by design para IA não é apenas uma exigência de conformidade — é uma vantagem competitiva e de confiança. Sistemas que respeitam privacidade por design geram menos riscos regulatórios, maior confiança do usuário e arquiteturas mais robustas.

O framework PbD-IA proposto nesta análise técnica oferece um roteiro prático para organizações que buscam integrar as obrigações da LGPD e do futuro Marco Legal da IA em um programa coerente de governança de dados e algoritmos.

Referências Principais

ANPD. Guia de Boas Práticas LGPD para Inteligência Artificial. 2024.
Cavoukian, A. Privacy by Design: The 7 Foundational Principles. Information and Privacy Commissioner of Ontario, 2009.
Carlini, N. et al. Extracting Training Data from Large Language Models. USENIX Security, 2021.
European Data Protection Board. Guidelines 05/2020 on Consent under Regulation 2016/679. 2020.
ICO (UK). Explaining Decisions Made with AI. 2020.
INAI (México). Guía para el Tratamiento de Datos Personales mediante IA. 2023.
Senado Federal. PL 2338/2023 — Estabelece normas gerais de caráter nacional para o desenvolvimento, implementação e uso responsável da inteligência artificial no Brasil. 2023.

IA e Privacidade por Design: Obrigações, Metodologias e Casos de Uso no Contexto Brasileiro