Getty Images mergulha no mundo da IA generativa

Getty Images explora IA generativa

No início deste ano, o provedor de serviços de fotos de banco de imagens Getty Images processou a Stability AI por supostamente usar de forma indevida mais de 12 milhões de fotos da Getty no treinamento da ferramenta de geração de fotos por IA da Stability, chamada Stable Diffusion.

Agora, a Getty Images está lançando sua própria ferramenta de geração de fotos por IA, que estará disponível para seus clientes comerciais. E está trazendo o grande cão para fazê-lo: a Nvidia.

Chamada simplesmente de Generative AI pela Getty Images, a ferramenta é protegida por pagamento no site da Getty.com. Ela também estará disponível por meio de uma API, para que os clientes da Getty possam integrá-la a outros aplicativos. Ela é projetada estritamente para uso comercial; um editor de fotos ou um profissional de marketing pode precisar encontrar uma imagem genérica de um tênis ou um smartphone, por exemplo, e, em vez de usar uma imagem de banco de imagens comum, eles podem usar a ferramenta para gerar algo novo. (A Getty disse que não espera que organizações de notícias a usem.)

A ferramenta de IA da Getty é treinada exclusivamente com imagens da Getty Images – centenas de milhões delas – e utiliza a arquitetura do modelo da Nvidia, chamado Edify. O CEO da Getty Images, Craig Peters, diz que, devido à parceria da empresa com a Nvidia, “tínhamos praticamente unidades de processamento gráfico ilimitadas, o que é algo que quase ninguém tem hoje em dia. Pudemos realizar inúmeras rodadas de treinamento com a Nvidia e sua equipe para fazer as coisas corretamente.”

A experiência do usuário dentro do Generative AI da Getty Images.

Cortesia da Getty

Peters diz que a Getty não está pagando pelo acesso à tecnologia da Nvidia, nem a Nvidia está pagando à Getty pelo seu conteúdo. “Somos parceiros. Apenas parceiros.”

Ao lançar essa ferramenta, a Getty está competindo com a concorrente Shutterstock, que se associou à OpenAI para permitir que esta treine seus modelos Dall-E nas imagens da Shutterstock; assim como a Adobe, que recentemente incorporou seu mecanismo de IA generativa, chamado Firefly, no Photoshop. O Adobe Firefly é treinado em “centenas de milhões de imagens de alta resolução do Adobe Stock, conteúdo com licença aberta e conteúdo de domínio público cujo direito autoral expirou”, segundo o site da Adobe.

A entrada da Getty no campo da IA fotográfica levanta questões éticas sobre o treinamento de modelos de IA com imagens de fotógrafos ao longo de mais de duas décadas e como as empresas explorando esse modelo de negócio acabarão pagando a esses fotógrafos.

Em relação às licenças, Peters insiste que o gerador de fotos por IA da Getty é diferente de outras ferramentas de imagem por IA, porque a Getty obteve os direitos legais das fotos que estão sendo usadas para treinar os modelos. “É comercialmente limpo e isso nos dá a capacidade de apoiá-lo 100%”, diz ele. “Portanto, se você quiser usar a IA generativa para ser mais criativo e explorar limites diferentes, a Getty Images é a única opção que oferece total indenização.” Isso significa que, se um cliente baixar e usar uma imagem da Getty gerada por IA e um colaborador da Getty apontar que ela se parece muito com sua obra de arte original, a Getty promete ao cliente que eles estão cobertos pelos acordos de licenciamento isentos de royalties da Getty.

A Getty também afirmou em um comunicado à imprensa que os clientes que usarem a ferramenta terão o direito de uso perpétuo, mundial e não exclusivo das imagens e que novo conteúdo gerado por IA não será adicionado às bibliotecas de conteúdo existentes da Getty para que outros possam usá-lo.

Peters diz que os fotógrafos contribuintes serão compensados pela inclusão de seu conteúdo no conjunto de treinamento da IA. Os clientes pagarão uma taxa de assinatura, com base na quantidade de “chamadas generativas” que eles fizerem – ou seja, na quantidade de fotos que desejam gerar – e os fotógrafos receberão uma parte desse valor. “Pagamos cerca de 30 centavos de dólar para cada dólar que geramos, então isso será consistente”, diz Peters.

O que não está claro, não apenas para a Getty Images, mas para os geradores de fotos por IA em geral, é exatamente quais fotos (entre milhões ou bilhões) no conjunto de treinamento receberiam crédito por uma imagem recém-gerada. Essas questões desafiam a perspectiva de uma compensação justa.

Ao ser questionado sobre como a Getty identificaria o conjunto de colaboradores para cada imagem gerada, Peters diz: “[Nós] não fazemos isso. Existem tecnologias por aí que afirmam fazer isso, mas não conseguem. Faremos uma alocação com base em duas dimensões: A quantidade de conteúdo que você contribuiu para o conjunto de treinamento e o desempenho desse conteúdo ao longo do tempo.”

“Acho que somos fundamentalmente diferentes de 90% das outras ferramentas [de fotos por IA] por aí, onde elas basicamente apenas roubam o conteúdo e seguem em frente”, acrescenta Peters.

Para a Getty, esse ponto é fundamental no mundo controverso e emergente dos direitos autorais de IA generativa. A IA generativa, que se baseia em modelos de linguagem de aprendizado profundo que se tornam cada vez melhores na previsão de texto ao longo do tempo, funciona absorvendo grandes quantidades de dados compartilhados online. Como apontado pelo Tech Policy Press, muitas dessas tecnologias borraram a linha entre a coleta de dados para treinar modelos de IA e a comercialização de trabalhos recém-criados.

“A Wikipedia é a base de modelos de linguagem grandes; o Wikimedia Commons e sites como o Flickr Commons são dominantes nos dados de treinamento para sistemas de geração de imagens”, escreve o pesquisador e artista Eryk Salvaggio. “No entanto, esses sistemas ignoram os requisitos sobre como o material pode ser compartilhado. Eles não atribuem os autores ou fontes, violando a cláusula de compartilhamento igual.”

Neste verão, a comediante Sarah Silverman e dois autores, Richard Kadrey e Christopher Golden, processaram a Meta e a OpenAI em um tribunal federal de São Francisco devido à forma como essas empresas supostamente usaram materiais com direitos autorais – essencialmente raspando a internet – para treinar seus modelos de IA. Em seguida, na semana passada, o The New York Times informou que a Authors Guild e mais de uma dúzia de autores, incluindo John Grisham, Jonathan Franzen, Jodi Picoult e George Saunders, processaram a OpenAI por treinar seu chatbot com base em seus livros e produzir “obras derivadas” que são semelhantes ao seu trabalho ou resumem seus livros completamente.

A Getty não prevê que as organizações de notícias usem seu novo gerador de imagens de IA.

Cortesia da Getty

Bhamati Viswanathan, que leciona direito autoral e de propriedade intelectual na New England School of Law e é presidente da seção de New England da Copyright Society of the US, afirma que mesmo que a Getty Images esteja selecionando apenas de sua própria biblioteca de fotos licenciadas, o uso de IA generativa treinada em milhões de fotos profissionais ainda levanta muitas perguntas sem resposta.

“Existe uma cláusula de exclusão onde os artistas podem dizer: ‘Não quero que minhas imagens sejam usadas dessa forma?’”, diz Viswanathan. “Eles estão assumindo que todos os artistas estão dando permissão a eles? Os artistas podem negociar preços? Os termos são diferentes se você já tem contrato com a Getty Images em comparação com se inscrever como um novo colaborador?”

Ela ressalta que há semelhanças com as preocupações levantadas como parte da greve de Hollywood deste ano, na qual escritores e atores têm pressionado não apenas por salários mais justos, mas também por termos e condições mais claros sobre como os estúdios podem usar inteligência artificial para trabalho criativo. “Todo mundo no mundo artístico está aterrorizado”, diz Viswanathan.

Viswanathan também observa que os defensores de conteúdo gerado por IA estão avançando sob a percepção de proteção de uso transformador sob a lei de direitos autorais dos EUA – a ideia, essencialmente, é que as novas obras geradas por IA são protegidas pela doutrina de uso justo se transformarem adequadamente a obra original em algo diferente. No entanto, ainda há a possibilidade de danos de mercado para artistas, como fotógrafos profissionais, se a arte alterada for próxima o suficiente ou suficientemente satisfatória em relação à original, de forma que um cliente opte por usar imagens geradas em vez de pagar pela original.

“Algumas dessas empresas de IA estão dizendo: ‘Vamos fazer isso de forma responsável e os artistas serão compensados’”, diz ela. “Mas acho que os artistas ainda estão muito inseguros sobre isso. Os artistas serão incluídos nas conversas?”