
A Meta, empresa responsável por plataformas como Instagram, Facebook e WhatsApp, enfrenta denúncias por utilizar milhões de livros e artigos acadêmicos sem autorização.
Os arquivos teriam sido usados para treinar sua inteligência artificial generativa, a LLaMA 3.
Documentos internos revelados pela revista norte-americana The Atlantic apontam que o conteúdo foi extraído da plataforma pirateada Library Genesis (LibGen), com o conhecimento da própria liderança da empresa, incluindo o CEO Mark Zuckerberg. As informações são do O Globo.
Segundo a publicação, a base de dados utilizada pela Meta inclui cerca de 7,5 milhões de livros e mais de 80 milhões de artigos científicos, sem qualquer compensação financeira a autores e editoras.
Entre as obras identificadas, estão títulos de escritores como Jorge Luis Borges, Julio Cortázar e Kazuo Ishiguro, em diversos idiomas.
O que é inteligência artificial generativa?
A inteligência artificial generativa é um tipo de tecnologia capaz de criar novos conteúdos com base em grandes volumes de dados. Esses sistemas podem produzir textos, imagens, músicas, vídeos e até códigos de programação.
O diferencial da IA generativa está na capacidade de "imitar" padrões humanos de criação, a partir do que aprendeu com materiais disponíveis na internet, como livros, artigos, vídeos e outros tipos de informação.
Entre as aplicações mais conhecidas desse tipo de IA estão os chatbots, como o ChatGPT, da OpenAI, o próprio LLaMA 3, da Meta, e ferramentas como o DALL-E, que gera imagens. A sigla "Llama" vem de "Large Language Model Meta AI".
Legislação europeia
A revelação gerou reação no meio editorial europeu, especialmente após a aprovação da Lei de Inteligência Artificial da União Europeia, em 2024.
Pioneira no mundo, a norma exige que os sistemas de IA respeitem os direitos autorais e tornem público o material utilizado em seus treinamentos. A partir de 2026, autores e editoras poderão proibir expressamente o uso de suas obras nesses sistemas.
Na última semana, três entidades representativas da França — incluindo a União Nacional de Editores e a União Nacional de Autores e Compositores — anunciaram que vão processar a Meta por "uso massivo de obras protegidas sem autorização".
A Sociedade de Gente de Letras também confirmou que vai ingressar com ação judicial. Todas exigem a eliminação imediata dos dados utilizados de forma ilegal.
Segundo Vincent Montagne, presidente da União Nacional de Editores, a Meta “violou frontalmente os direitos autorais” ao utilizar obras sem qualquer tipo de permissão.
Já os autores alertam para a proliferação de "livros falsos", gerados por IA, que concorrem diretamente com obras reais no mercado editorial.
Protestos
A repercussão das denúncias também mobilizou autores britânicos. Na última quinta-feira (3), um grupo de escritores protestou em frente às sedes da Meta em Londres.
Nomes como o Nobel Kazuo Ishiguro, Tom Stoppard e Sarah Waters assinaram uma carta aberta dirigida à secretária de Cultura do Reino Unido, Lisa Nandy.
Em petição, que já foi assinada por mais de 19 mil pessoas, os autores afirmam que “a coleta de obras para treinamento de IA é ilegal no Reino Unido”, mas que gigantes da tecnologia atuam no país sem sofrer investigação adequada.
O grupo cobra que o governo britânico tome providências urgentes para evitar o que classificam como um “impacto catastrófico e irreversível” para a classe artística.
Compensação
Durante a Feira do Livro de Londres, que ocorreu em março, representantes da indústria editorial dos Estados Unidos e do Reino Unido destacaram a urgência de regulamentar o uso de obras protegidas em sistemas de IA.
Maria A. Pallante, presidente da Associação de Editores Americanos (AAP), declarou que as empresas de tecnologia devem pagar pelos conteúdos que utilizam, "assim como pagam pela eletricidade que consomem".