Reglab – centro de estratégia & regulação

Mapeamento Global de Leis de Direitos Autorais e Exceções para Mineração de Dados

Um mapeamento realizado pelo Reglab analisou as legislações de direitos autorais em 50 países e mostrou como as diferenças nas regras podem favorecer nações desenvolvidas na corrida da Inteligência Artificial (IA).

Países desenvolvidos adotam normas mais flexíveis

Em países como Estados Unidos, Japão e membros da União Europeia, as normas permitem o uso de obras protegidas em análises automatizadas de larga escala, inclusive para fins comerciais. Esse modelo tem acelerado avanços em IA e ampliado a competitividade tecnológica.

Brasil e América Latina entre os mais restritivos

O Brasil e grande parte da América Latina aparecem entre os sistemas mais restritivos. A ausência de regras claras sobre mineração de textos e dados gera insegurança jurídica e pode limitar tanto empresas quanto instituições de pesquisa.

Consequências de legislações mais fechadas

O levantamento destaca que legislações menos restritivas impulsionaram a inovação em IA nos últimos anos. Já em países com regras mais fechadas, o risco é de isolamento tecnológico e perda de competitividade.

Projeto de Lei 2.338/2023 em análise no Brasil

No Brasil, o Projeto de Lei 2.338/2023, em análise na Câmara, prevê exceções apenas para usos institucionais. Para fins comerciais, mesmo quando ligados à pesquisa, o projeto impõe um modelo de remuneração complexo e pouco viável, o que pode frear iniciativas nacionais em inteligência artificial.

Nota de atualização (outubro, 2025): o estudo foi atualizado nas páginas 7 e 8 para corrigir a classificação da Austrália, que constava como “alta permissividade”, corrigida para “média permissividade”, de acordo com os parâmetros de classificação definidos no estudo. Esta correção não altera as demais conclusões do mapeamento.

Citar

RIBEIRO, N.; GARROTE, M. Mapeamento Global de Leis de Direitos Autorais e Exceções para Mineração de Dados. Contexto Reglab. n. 1. Reglab, 2025
Ribeiro, N., & Garrote, M. (2025). Mapeamento global de leis de direitos autorais e exceções para mineração de dados. Contexto Reglab, (1). Reglab.
Ribeiro, N., and M. Garrote. Mapeamento global de leis de direitos autorais e exceções para mineração de dados. Contexto Reglab, no. 1. Reglab, 2025.

Autores

  • Marina Garrote
  • Natália Ribeiro

Tags

Mapeamento Global de Leis de Direitos Autorais e Exceções para Mineração de Dados

Agosto de 2025

Sobre o Reglab

O Reglab é um think tank especializado em pesquisa e consultoria que auxilia empresas, associações e formuladores de políticas no planejamento orientado por dados e análises de impacto. Focamos na tomada de decisões responsáveis e estratégicas, desvendando os desafios regulatórios do setor de mídia e tecnologia.

Sobre a Série Contexto

A série Contexto do Reglab apresenta resumos concisos que sintetizam tópicos específicos ou tendências emergentes. São elaborados para apresentar informações de forma clara e acessível, incorporando elementos visuais como gráficos, tabelas e infográficos, combinando rigor analítico com praticidade

expediente

Autoras: Natália Góis Ribeiro e Marina Gonçalves Garrote

Pesquisadoras: Natália Góis Ribeiro Elaboração Cartográfica: Amanda Silva Almeida Diagramação Final: Eliza Natsuko Shiroma

Citação sugerida: RIBEIRO, N.; GARROTE, M. Mapeamento Global de Leis de Direitos Autoraise Exceções para Mineração de Dados. Contexto Reglab. n. 1. Reglab, 2025.

Este estudo faz parte do Observatório de Direitos Autorais e Tecnologia. O Observatório é uma iniciativa do Reglab e parceiros, dedicada a promover estudos e relatórios sobre o tema, visando fortalecer o debate sobre o assunto com clareza e evidências.

  • Mineração de textos e dados (TDM, em inglês), também conhecido como computational analysis”, é uma técnica usada para extrair padrões a partir de grandes volumes de conteúdo, uma prática importante para treinamento de modelos de IA e pesquisa científica.
  • Esse estudo mapeou legislações autorais de 50 países, com foco nas exceções legais aplicáveis ao TDM, para identificar como diferentes jurisdições tratam a relação entre mineração de dados e direitos autorais
  • O cenário internacional é heterogêneo. Não há padrão global quanto às exceções de direitos autorais aplicáveis a TDM, com variações significativas entre países.
O acesso desigual ao TDM e a natureza global da rede podem ampliar assimetrias globais em IA. Países
de alta renda concentram as leis mais permissivas, enquanto outros países ainda mantêm regimes restritivos.
  • A lei brasileira apresenta incertezas sobre a legalidade do TDM em obras protegidas, o que pode gerar insegurança jurídica para usos técnicos, científicos e comerciais.
  • A adoção de exceções expressas a TDM no Brasil, longe de significar alinhamento automático a modelos externos, pode constituir uma estratégia de fortalecimento da soberania tecnológica.

introdução

Em meio à corrida global para impulsionar o desenvolvimento da Inteligência Artificial (IA), países têm adotado respostas diferentes sobre o que pode, e o que não pode, ser usado para treinar esses sistemas.

Técnicas de extração e análise de dados em larga escala, como mineração de textos e dados (text and data mining), são essenciais para o avanço da IA. Mas seu enquadramento jurídico ainda é incerto, especialmente diante de regras de direitos autorais pensadas para outro tempo.

Enquanto alguns países flexibilizaram, em suas leis de direitos autorais, exceções para usos computacionais, outros têm interpretações rígidas. O Brasil começou a discutir esse tema no Congresso com o PL 2338/2023, que

possui previsões específicas sobre o tema em sua redação atual. Para entender os riscos e possibilidades da regulação da IA no Brasil em matéria de direito autoral, é importante conhecer como diferentes países estão lidando com o tema. Este resumo, como parte da série Contexto do Reglab, busca traduzir evidências comparadas sobre exceções legais em regimes autorais em linguagem visual e acessível, oferecendo um ponto de partida para odebate regulatório brasileiro

Reconhecemos que o tema envolve tensões legítimas, e é a partir disso que buscamos contribuir para o debate com novas perspectivas.

A regulação pode tanto proteger criadores e criadoras, reduzindo barreiras de acesso ao conhecimento, como perpetuar assimetrias econômicas, tornando o uso pleno da IA um

privilégio de poucos

o que é text & data mining?

Etapas envolvidas na Mineração de Dados

O treinamento de modelos de IA envolve etapas complexas, desde a coleta e curadoria de dados até o ajuste de parâmetros e avaliação de desempenho, utilizando diferentes técnicas para analisar grandes volumes de informação. Entre elas, o text and data mining (TDM) se destaca como uma dessas ferramentas, voltada para análise automatizada de conteúdos em larga escala

Trata-se de uma técnica anterior ao boom da IA generativa, usada em diversos campos para identificar padrões, tendências e

Coleta de dados Reunidos a partir de diferentes fontes

Pré-processamento Preparação e transformação dos dados

correlações em grandes volumes de dados

O TDM é uma técnica utilizada amplamente por diferentes setores e para funções diversas. Durante a pandemia de COVID-19, o TDM foi essencial para acelerar descobertas científicas, permitindo a análise automatizada de milhares de artigos médicos. Governos e organizações públicas também usam TDM para detectar desinformação e discurso de ódio em redes sociais, apoiar o desenho de políticas públicas e acompanhar mudanças climáticas. No setor privado, a técnica é aplicada em sistemas de busca, tradução automática, reconhecimento de voz, e até no jornalismo investigativo, ajudando a cruzar grandes volumes de documentos para identificar padrões e inconsistências.

Organização dos dados

Acesso rápido e armazenamento de

dados para busca e mineração

Mineração Inferência algorítmica e extração de informações

Análise

Análise do usuário e navegação

e afinal, TDM é compatível com leis de direitos autorais?

Depende. Por isso que, com esse trabalho, buscamosentender quais legislações já preveem possíveis exceçõesde direitos autorais para treinamento de IA.

qualquer técnica de análise automática destinada àanálise de textos e dados em formato digital, a fimde produzir informações, tais como padrões,

Partimos do artigo “Legal Reform to Enhance Global Text and Data Mining Research”, de 2022, para identificar se e como países preveem, em suas leis, exceções que autorizam o uso de obras protegidas para TDM, seja em contextos científicos, institucionais ou comerciais.

Sabemos que nem todo uso de TDM é para treinamento de IA, e nem todo treinamento de IA depende apenas de TDM. Contudo, nossa pesquisa revelou que, em diferentes países, adotou-se uma definição legal ampla de TDM que também pode incluir o uso para treinamento de IA.

Por conta disso, e na ausência de uma definição brasileira, utilizamos a da Diretiva 790/2019 da EU como referência metodológica, que define Text and Data Mining como:

tendências e correlações, entre outros” (UE, 2019).

Em seguida, analisamos as leis de direitos autorais disponíveis no repositório da WIPO, complementando com dados secundários, quando necessário. Nossa amostra incluiu 50 países, que foram classificados em três níveis de permissividade (alta, média, baixa):

Altapermissividade: Esta categoria inclui países que, cumulativamente: (i) autorizam expressamente o TDM; (ii) não restringem o perfil do usuário; e (iii) permitem uso comercial dos resultados. Inclui também países de common law, como os EUA, onde a doutrina do fair use tem sido interpretada por tribunais como permissiva à prática em diversos casos analisados até esta data.

Média permissividade: Essa categoria inclui países com legislações que: (i) limitam exceções de TDM a grupos específicos (ex. universidades, bibliotecas), e/ou (ii) restringem permissões apenas a usos não comerciais.

Baixapermissividade: Jurisdições cujas legislações não preveem exceçõesexpressas à prática de TDM

Alta permissividade: Alemanha, Áustria, Bélgica, Croácia, Dinamarca, Eslovênia, Espanha, Estados Unidos, Estônia, Finlândia, França, Holanda, Irlanda, Japão, Luxemburgo, Malta, Portugal, República Checa, Singapura, Suécia.

Média permissividade: Austrália, Canadá, China, Coreia do Sul, Emirados Árabes Unidos, Equador, Filipinas, Indonésia, Malásia, México, Nigéria, Nova Zelândia, Reino Unido,Suíça.

Baixapermissividade: África do Sul, Arábia Saudita, Argentina, Bangladesh, Brasil, Cazaquistão, Chile, Egito, Índia, Irã, Marrocos, Paquistão, Rússia, Tailândia,Turquia, Vietnã.

deep dive

Nos Estados Unidos, a doutrina do fair use tem até agora permitido práticas de mineração de dados. Em casos anteriores ao boom da internet generativa, tribunais norte-americanos geralmente autorizaram o TDM, inclusive comercial, quando os usos são lícitos, transformativos e não prejudicam o mercado original. Casos como Authors Guild v. Google (2011), Hathitrust (2014) e Fox v. TVEyes (2014) ilustram essa interpretação favorável.No entanto, esse entendimento tem sido questionado em ações recentes levadas a julgamento, como por exemplo, The New York Times v. OpenAI (2023) e Authors v. Anthropic (2025), que discutem os limites da prática de TDM no treinamento de sistemas de IA generativa. O U.S. Copyright Office, em relatório publicado em 2025, reforça que ainda não há resposta definitiva sobre a aplicação dessa doutrina nesses casos, destacando que a análise deve ser feita caso a caso, com base nos quatro fatores do fair use.

Desde 2018, a lei japonesa permite que obras protegidas sejam utilizadas sem autorização prévia, inclusive para fins comerciais, desde que o uso seja voltado à análise de informações e não à reprodução criativa da obra em si. Essa exceção autoriza, na prática, as técnicas de TDM, sem necessidade de licenciamento ou pagamento aos titulares dos direitos.Recentemente, a Agência de Assuntos Culturais do governo reforçou que, na interpretação desse órgão, a utilização de obras protegidas por direitos autorais para o treinamento de IA é, em princípio, permitida sem autorização prévia do titular.

A União Europeia conta com a Diretiva 7G0/201G, que introduz exceções específicas para TDM, tanto para fins de pesquisa científica quanto para fins gerais, inclusive comerciais. Por se tratar de uma diretiva, existe uma dependência de transposição para cada Lei nacional, o que, na prática, permite variações entre os países em como diretiva pode ser implementada.

A UE também conta com uma lei sobre IA: o AI Act. Embora o texto da lei não trate diretamente da questão de direitos autorais, o Recital 105, que fornece orientação interpretativa, reforça que, em relação à mineração de dados, devem ser respeitadas as regras da Diretiva, incluindo o mecanismo de opt-out, que permite aos titulares de direitos autorais proibirem o uso de suas obras para esse fim.

Em Singapura, a legislação de direitos autorais autoriza explicitamente a cópia e o uso de conteúdos com acesso legal para fins de análise computacional, incluindo a identificação de padrões por meio de software. O uso comercial também é permitido no país.

Embora não haja uma exceção legal específica para a prática de TDM, a legislação sulcoreana permite a utilização de obras protegidas para fins de educação, pesquisa, citação, uso pessoal e em bibliotecas, desde que o uso esteja dentro de limites razoáveis e não cause prejuízo aos titulares de direitos.

O Reino Unido reconhece a prática de TDM como exceção à proteção de direitos autorais desde 2014, permitindo que indivíduos realizem cópias para fins de análise computacional, desde que sem finalidade comercial.Em junho deste ano, o país aprovou o Data (Use and Access) Act. Em uma de suas seções, a lei exige que o governo elabore relatórios avaliando os impactos econômicos e jurídicos de diferentes modelos regulatórios, como a viabilidade de regimes de exceção com possibilidade de opt-out pelos titulares e a adoção de mecanismos de transparência sobre os dados utilizados no treinamento dos modelos.

Em 2021 foi proposto um projeto de lei criando uma exceção ampla e específica para TDM, mas a proposta ainda está em discussão.

A China demonstra média permissividade para práticas de mineração de dados. A Lei de Direitos Autorais, reformada em 2020, permite uma série exceções para fins de ensino, pesquisa científica sem fins lucrativos, preservação por bibliotecas e acessibilidade, mas sem mencionar expressamente práticas de TDM.

O Equador é o único país da América do Sul cuja legislação de direitos autorais menciona expressamente a prática de TDM, autorizando a “mineração de textos” no âmbito de bibliotecas e arquivos. Porém, o alcance da exceção é limitado, aplicando-se apenas ao uso institucional, como em bibliotecas e arquivos, e está condicionada à boa-fé dos usuários e ao respeito aos “usos honrados”, que avalia fatores como finalidade, extensão do uso e impacto no mercado da obra.

A legislação da Nigéria não menciona expressamente a mineração de dados, mas traz o conceito de fair dealing, que permite o uso de obras protegidas sem autorização prévia do titular, desde que respeitadas determinadas condições, como uso razoável, proporcional e sem causar prejuízo injustificado ao mercado da obra original. As exceções se aplicam tanto a usuários institucionais quanto ao público em geral.

A África do Sul possui regras mais restritivas sobre uso de obras protegidas por direitos autorais. A legislação em vigor permite alguns usos chamados de “fair dealing”, que autorizam somente o uso de trechos de obras para estudo pessoal, ensino ou reportagem, desde que não prejudiquem o mercado da obra.

A Índia adota um regime de fair dealing, com exceções aos direitos autorais restritas a usos não comerciais,como estudo, pesquisa e jornalismo, não prevendo exceção específica para TDM.O país busca desenvolver um marco mais amplo de governança de IA. Em 2025, foi criado um Grupo Multissetorial para formular um arcabouço regulatório, a partir da publicação de um relatório com recomendações voltadas à construção de um ecossistema responsável, submetido à consulta pública. O documento dedica seção sobre direitos autorais, levantando questões normativas e sugere a necessidade de orientações mais claras sobre o uso de dados protegidos no contexto da IA.

e no Brasil?

O Brasil, assim como a maioria dos países da América Latina, se destaca por possuir uma legislação autoral mais restritiva.A Lei de Direitos Autorais (Lei nº 9.610/98) não foi atualizada para contemplar práticas de TDM, nem contempla exceções amplas. Ainda que haja discussões legítimas sobre o alcance dos direitos previstos na lei, há um cenário de insegurança jurídica.

O Projeto de Lei 2.338/23, atualmente em discussão na Câmara, propõe uma exceção limitada para a prática de mineração de textos e dados, permitindo essa atividade apenas quando realizada com finalidade de pesquisa e desenvolvimento de sistemas de IA, e exclusivamente por instituições científicas, educacionais, museus, arquivos e bibliotecas.

Nessas hipóteses, o uso de conteúdos protegidos pode ser realizado sem autorização prévia dos titulares, desde que não haja restrição expressa dos direitos autorais (opt-out). O texto do PL também possibilita que os titulares de direitos reclamem retroativamente contra a utilização de suas obras, inclusive após o treinamento do sistema. Fora dessas situações, o titular de direitos autorais poderia proibir o uso de suas obras para fins de mineração de dados. O PL também estabelece que agentes de IA que utilizarem conteúdos protegidos em processos de mineração, treinamento e desenvolvimento devem remunerar os titulares dessas obras.

para saber mais sobre os limites e consequências da proposta do PL 2338/23, acesse o nosso estudo sobre o tema!

acesse o nosso estudo aqui

análise e comentários

a visão das autoras

O mapa revela um cenário fragmentado: não há convergência regulatória sobre exceções de direitos autorais para mineração de dados, o que afeta a segurança jurídica para pesquisa e treinamento de IA. Contudo, é preciso atenção à distribuição geográfica: de modo geral, regimes mais permissivos concentram-se em países desenvolvidos, enquanto legislações restritivas prevalecem em economias do Sul Global.

A ausência de exceções pode impactar a produção acadêmica e a capacidade de inovação local, aumentando o abismo entre os países. Além disso, o caráter transfronteiriço da internet permite que empresas desloquem atividades de treinamento de IA para jurisdições mais abertas, reduzindo o alcance prático de legislações nacionais restritivas.

Embora parte da resistência às exceções possa vir de setores dependentes da exploração de direitos de propriedade intelectual (e.g. setor editorial), a experiência da UE e dos EUA mostra que exceções bem desenhadas podem coexistir com modelos comerciais sustentáveis – incluindo oportunidades para licenciamento de bases de dados (modelo opt-out).

Por fim, a preocupação com a soberania tecnológica e com o domínio de grandes empresas de tecnologia é legítima, mas restringir exceções de TDM pode produzir o efeito oposto ao pretendido. Exceções bem estruturadas podem viabilizar o desenvolvimento local de sistemas de IA e a criação de alternativas competitivas, inclusive por pequenos desenvolvedores, universidades e centros de pesquisa. É por isso que a discussão sobre direitos autorais pode avançar sem abrir mão de outros debates legítimos, como proteção de dados, moderação de conteúdo e defesa da concorrência.

direcionamento para futuros estudos

A série Contexto compreende estudos resumidos, não-exaustivos, com o objetivo de gerar debate e incentivar

futuras pesquisas, que podem adotar diferentes abordagens para complementar este trabalho:

mapeamento exaustivo de países, incluindo análise de projetos de lei em andamento;

avaliação de custo e benefício social, agrupando diferentes stakeholders e medindo externalidades;

análise econômica dos efeitos de diferentes alternativas regulatórias, incluindo os ganhos ou perdas reais de detentores de direitos autorais em cada cenário;

simulação de cenários futuros, utilizando técnicas como jogos, Delphi ou Shell para estimar consequências sociais de diferentes decisões regulatórias.

Anexo de metodologia Reglab

FORMATO: ESTUDO CONTEXTO

Título do trabalho Mapeamento Global de Leis de Direitos Autorais e Exceções para Mineração de Dados
Pergunta de pesquisa Como as legislações de direitos autorais ao redor do mundo tratam atualmente as exceções
que permitem a prática de mineração de textos e dados?
Resumo de metodologia O estudo é uma síntese de pesquisa, de caráter exploratório, comparativo e não-exaustivo.
A coleta de dados utilizou técnica de análise documental, baseada em
Flynn et al. (2022), com tratamento de dados a partir de análise de conteúdo
de matriz dedutiva.
Coleta de dados Análise documental de legislações a partir do repositório da
World Intellectual Property Organization (WIPO).
A amostra totalizou 50 países, sendo (i) 30 com maior número de usuários de internet
(Statista, 2025) e (ii) 20 selecionados por amostragem intencional,
com base em diversidade jurídica, protagonismo em inovação tecnológica
e menções explícitas à prática de TDM.
Análise de dados A partir de análise de conteúdo, as informações foram sistematizadas em planilha,
com códigos padronizados (ex. tipo de exceção autoral, base legal, etc).
Com base nesses códigos iniciais, os países foram classificados em três níveis
de permissividade, definidos de forma dedutiva (alta, média e baixa).
A classificação foi visualmente representada em um mapa-múndi usando o
Sistema de Informações Geográficas (SIGs) Quantum GIS (QGIS) 3.40.4
para operacionalização.
Procedimentos de Redução de Vieses
  • triangulação de métodos:
    em complemento à pesquisa na base da WIPO, foram conduzidas pesquisas
    exploratórias livres, em site de busca e ferramentas de IA,
    para buscar referências adicionais, como decisões judiciais
    e literatura acadêmica, para confirmar as categorizações.
    Eventuais ressalvas às classificações foram feitas na seção
    dep. div.
  • dupla validação e validação cruzada:
    ao menos dois pesquisadores revisaram os dados e categorizações realizadas.
    Agradecemos a pesquisadora Isabella Cristina Pereira,
    que gentilmente disponibilizou dados de sua pesquisa em andamento
    para validação cruzada, garantindo sua verificação por meio de
    um segundo método de análise alternativo.
Outras limitações metodológicas
  • Dependência de Fontes de Acesso Aberto:
    o estudo baseou-se em bancos de dados públicos, portais de notícias,
    jornais e revistas acadêmicas de acesso aberto.
    Essa dependência pode limitar a abrangência da análise.
  • Caráter Não-Exaustivo:
    a série Contexto compreende análises concisas de natureza exploratória,
    sujeitas a delimitações metodológicas quanto ao escopo e duração da investigação.
  • Período da Coleta:
    o estudo considerou apenas dados disponíveis até 25 de julho de 2025.
Uso de software Suite MS Office, ChatGPT, Perplexity, WIPO Lex, The Eckert IV.
Diretrizes éticas
  • Financiamento da Pesquisa.
    Esse estudo integra o Observatório de Direitos Autorais e Tecnologia,
    uma iniciativa do Reglab que conta com os seguintes patrocinadores:
    AWS, Google, Meta, Microsoft e Youtube.
    O RegLab manteve total controle editorial e autonomia na definição
    do escopo, dos objetivos e da metodologia aplicada.
    Os autores são integralmente responsáveis pelo conteúdo
    e pelas análises desenvolvidas neste trabalho.
  • Uso de Dados Públicos e Documentais.
    A pesquisa utilizou exclusivamente fontes públicas e documentais,
    como legislações nacionais disponíveis no repositório da WIPO
    e documentos oficiais de países.
    Não houve coleta de dados pessoais nem entrevistas com indivíduos.