O New York Times processa a OpenAI e a Microsoft por violação de direitos autorais.

O New York Times processa a OpenAI e a Microsoft por supostamente treinarem modelos de IA com material protegido por direitos autorais do Times

O New York Times (NYT), o prestigioso jornal conhecido por seu jornalismo premiado, tomou medidas legais contra a OpenAI e seu investidor, a Microsoft. O Times alega que essas empresas violaram leis de direitos autorais ao utilizar milhões de artigos do NYT para treinar seus modelos de IA generativa, incluindo o ChatGPT popular da OpenAI e o Copilot da Microsoft, sem obter consentimento.

Em seu processo judicial, movido na Corte Federal de Distrito de Manhattan, o Times exige que tanto os modelos de IA quanto os dados de treinamento que contenham material não autorizado sejam destruídos. Além disso, o Times busca “bilhões de dólares em danos estatutários e reais” pelo uso ilegal de seu valioso conteúdo.

O Times enfatiza a importância do jornalismo independente e alerta que, se as organizações de notícias não puderem proteger seu trabalho, haverá uma grande perda para a sociedade. A queixa afirma que as ações da OpenAI e da Microsoft prejudicam o jornalismo e dificultam a produção de notícias esclarecedoras.

Em resposta ao processo judicial, um porta-voz da OpenAI afirmou que eles respeitam os direitos dos criadores de conteúdo e têm mantido conversas produtivas com o New York Times. A OpenAI espera encontrar uma solução mutuamente benéfica, assim como já fizeram com outros veículos de comunicação.

Os modelos de IA generativa aprendem analisando exemplos e criando novo conteúdo, como ensaios, código, e-mails e artigos. Empresas como a OpenAI coletam grandes quantidades de dados da web, alguns dos quais podem estar sujeitos a restrições de direitos autorais. Enquanto os vendedores argumentam que a doutrina do uso justo protege suas práticas de web scraping, proprietários de direitos autorais, incluindo organizações de notícias, discordam.

Esse conflito entre vendedores e proprietários de direitos autorais resultou em diversas batalhas legais. Por exemplo, a atriz Sarah Silverman e vários romancistas famosos acusaram a Meta, empresa-mãe da OpenAI, de usar seus trabalhos sem permissão. Além disso, programadores entraram com um processo contra a Microsoft, OpenAI e o GitHub, alegando que o Copilot foi desenvolvido usando seu código protegido.

O processo do New York Times representa um caso notável na contínua disputa legal entre fornecedores de IA generativa e proprietários de direitos autorais. O processo lança luz sobre o potencial dano causado à reputação da marca do Times pelos modelos de IA gerando informações falsas ou inventadas. A queixa destaca casos em que o Bing Chat da Microsoft (agora Copilot) forneceu informações incorretas supostamente provenientes do Times.

O processo também levanta preocupações sobre esses modelos de IA competindo com os editores de notícias ao fornecer informações exclusivas sem exigir uma assinatura. Essa prática diminui as oportunidades de receita, uma vez que o conteúdo gerado pela IA não possui citação, monetização e links afiliados usados pelo Times para gerar comissões.

Os modelos de IA generativa às vezes reproduzem dados de treinamento, essencialmente reproduzindo conteúdo literalmente. Em um caso, a OpenAI inadvertidamente permitiu que os usuários do ChatGPT ignorassem os paywalls e acessassem conteúdo de notícias restrito.

O New York Times acusa a OpenAI e a Microsoft de explorar seu investimento em jornalismo sem fornecer qualquer compensação. A queixa sugere que essas empresas estão construindo concorrentes aos publishers de notícias, efetivamente roubando audiência e prejudicando o negócio do Times.

Essa disputa reflete uma questão mais ampla que os publishers enfrentam com empresas como o Google. Recentemente, os publishers entraram com um processo contra o Google, alegando que seus experimentos de IA, como o chatbot Bard e a experiência generativa de busca, desviam tráfego e receita de anúncios dos publishers por meio de práticas anticompetitivas. Um estudo realizado pela The Atlantic constatou que os mecanismos de busca alimentados por IA poderiam responder às consultas dos usuários sem exigir que eles acessem os sites dos publishers, potencialmente diminuindo o tráfego em até 40%.

Embora os publishers tenham preocupações legítimas, o resultado desses processos ainda é incerto. Heather Meeker, especialista em propriedade intelectual, comparou o ato de induzir modelos de IA generativa a copiar conteúdo a usar um processador de texto para recortar e colar. Meeker acredita que a maioria dos processos como esse pode falhar porque, no fim das contas, é responsabilidade do usuário se eles fizerem intencionalmente o modelo de IA copiar conteúdo protegido.

Em vez de se envolver em batalhas legais, alguns veículos de comunicação optaram por colaborar com fornecedores de IA generativa por meio de acordos de licenciamento. Por exemplo, a Associated Press e a Axel Springer negociaram acordos com a OpenAI.

O New York Times tentou chegar a um acordo de licenciamento com a Microsoft e a OpenAI em abril. Infelizmente, as negociações não resultaram no resultado desejado, levando ao processo atual.

Vale ressaltar que esse processo serve como um alerta, destacando a necessidade de diretrizes claras e regulamentações quanto ao uso de conteúdo protegido por direitos autorais no treinamento de modelos de IA. Equilibrar os benefícios da IA generativa com a proteção da propriedade intelectual apresenta desafios significativos e requer colaboração entre fornecedores, criadores e legisladores.

Perguntas e Respostas

P: Por que o New York Times está processando especificamente a OpenAI e a Microsoft? R: O New York Times alega que a OpenAI e a Microsoft utilizaram milhões de artigos do NYT sem permissão para treinar seus modelos de IA generativa, causando potencial dano à marca e à receita do Times.

P: O que são modelos de IA gerativos e como eles aprendem? R: Modelos de IA gerativos aprendem analisando exemplos e criando novo conteúdo. Esses modelos, como o ChatGPT da OpenAI e o Copilot da Microsoft, podem gerar ensaios, código, e-mails e artigos, emulando padrões a partir de dados de treinamento diversos.

P: O que é a doutrina de uso justo e como ela se relaciona com este processo? R: A doutrina de uso justo fornece uma defesa legal que permite o uso limitado de material protegido por direitos autorais sem permissão. No entanto, sua interpretação varia, levando a desacordos entre os fornecedores de IA gerativa e os detentores dos direitos autorais sobre o que se qualifica como uso justo.

P: Como os modelos de IA gerativos regurgitam os dados de treinamento e por que isso é preocupante? R: Os modelos de IA gerativos às vezes produzem conteúdo que replica ou se assemelha de perto aos seus dados de treinamento, reproduzindo frases ou sentenças textualmente. Essa regurgitação pode ser problemática quando leva à disseminação de informações falsas ou imprecisas.

P: Que impacto esse processo pode ter no negócio de assinaturas de notícias? R: Se modelos de IA como ChatGPT e Copilot gerarem informações que normalmente só estão acessíveis por meio de uma assinatura, isso poderá minar a proposta de valor das assinaturas de notícias. Os clientes podem passar a depender do conteúdo gerado por IA, o que potencialmente levará a uma diminuição nas assinaturas e na receita dos editores de notícias.

P: Como outros editores estão lidando com o uso de modelos de IA sem permissão? R: Alguns editores, como a Associated Press e a Axel Springer, optaram por colaborar com fornecedores de IA gerativa por meio de acordos de licenciamento. Essa abordagem permite que os editores protejam seu conteúdo ao mesmo tempo em que se beneficiam da tecnologia de IA.

Para concluir, o processo movido pelo The New York Times contra a OpenAI e a Microsoft chama a atenção para as questões complexas que envolvem o uso de material protegido por direitos autorais no treinamento de modelos de IA gerativos. O desfecho desse caso terá implicações tanto para os criadores de conteúdo quanto para os fornecedores de IA, destacando a necessidade de diretrizes mais claras e cooperação nesse campo em constante evolução. À medida que as batalhas legais continuam, é essencial encontrar um equilíbrio entre fomentar a inovação e respeitar a propriedade intelectual.

🔗 Links Relevantes: – OpenAIMicrosoftThe New York TimesParceria da Associated Press com a OpenAIAcordo de Licenciamento da Axel SpringerEstudo do The Atlantic sobre o Impacto da IA