Os Trabalhadores Menores de Idade Estão Treinando a IA

Os Menores de Idade Estão sendo Treinados para a Inteligência Artificial

Como a maioria das crianças da sua idade, o Hassan, de 15 anos, passava muito tempo online. Antes da pandemia, ele gostava de jogar futebol com as crianças locais em sua cidade natal de Burewala, na região do Punjab, no Paquistão. Mas os bloqueios do Covid o tornaram um pouco recluso, ligado ao celular. “Eu só saía do meu quarto quando tinha que comer algo”, diz Hassan, agora com 18 anos, que pediu para ser identificado com um pseudônimo por medo de ações legais. Mas, ao contrário da maioria dos adolescentes, ele não estava rolando o TikTok ou jogando. Do seu quarto de infância, o estudante estava trabalhando na cadeia de suprimentos global de inteligência artificial, carregando e rotulando dados para treinar algoritmos para algumas das maiores empresas de IA do mundo.

Os dados brutos usados para treinar algoritmos de aprendizado de máquina são primeiro rotulados por humanos, e também é necessária verificação humana para avaliar sua precisão. Essa rotulagem de dados varia do simples – identificar imagens de postes de luz, por exemplo, ou comparar produtos de comércio eletrônico semelhantes – até o extremamente complexo, como moderação de conteúdo, onde os trabalhadores classificam conteúdo prejudicial nos dados coletados de todos os cantos da internet. Essas tarefas geralmente são terceirizadas para trabalhadores autônomos, por meio de plataformas online de crowdsourcing, como a Toloka, que foi onde Hassan começou sua carreira.

Um amigo o indicou para o site, prometendo trabalho a qualquer hora, de qualquer lugar. Ele descobriu que uma hora de trabalho lhe renderia cerca de $1 a $2, mais do que o salário mínimo nacional, que era cerca de $0,26 na época. Sua mãe é dona de casa e seu pai é um trabalhador mecânico. “Você pode dizer que eu pertenço a uma família pobre”, diz ele. Quando a pandemia começou, ele precisava de trabalho mais do que nunca. Confinado em sua casa, online e inquieto, ele pesquisou e descobriu que a Toloka era apenas a ponta do iceberg.

“A IA é apresentada como uma caixa mágica que pode fazer tudo”, diz Saiph Savage, diretor do Civic AI Lab da Northeastern University. “As pessoas simplesmente não sabem que há trabalhadores humanos por trás das cortinas.”

Pelo menos alguns desses trabalhadores humanos são crianças. As plataformas exigem que os trabalhadores tenham mais de 18 anos, mas Hassan simplesmente inseriu os dados de um parente e usou um método de pagamento correspondente para burlar as verificações – e ele não estava sozinho nessa prática. A ENBLE conversou com outros três trabalhadores no Paquistão e no Quênia que disseram ter se juntado às plataformas quando menores de idade, além de ter encontrado evidências de que essa prática é generalizada.

“Quando eu ainda estava no ensino médio, muitos adolescentes discutiam sobre empregos online e como entraram usando o ID de seus pais”, diz um trabalhador que entrou na Appen aos 16 anos no Quênia, que pediu para permanecer anônimo. Depois da escola, ele e seus amigos se conectavam para realizar tarefas de anotação até tarde da noite, muitas vezes por oito horas ou mais.

A Appen se recusou a comentar oficialmente.

“Se suspeitarmos que um usuário violou o Contrato do Usuário, a Toloka realizará uma verificação de identidade e solicitará um documento de identidade com foto e uma foto do usuário segurando o documento”, diz Geo Dzhikaev, chefe das operações da Toloka.

Impulsionada pela corrida global em IA, a indústria global de rotulagem e coleta de dados deve crescer para mais de $17,1 bilhões até 2030, de acordo com a Grand View Research, uma empresa de pesquisa e consultoria de mercado. Plataformas de crowdsourcing, como a Toloka, Appen, Clickworker, Teemwork.AI e OneForma, conectam milhões de trabalhadores autônomos remotos do sul global a empresas de tecnologia localizadas no Vale do Silício. As plataformas publicam microtarefas de seus clientes de tecnologia, que incluem Amazon, Microsoft Azure, Salesforce, Google, Nvidia, Boeing e Adobe. Muitas plataformas também são parceiras da própria plataforma de serviços de dados da Microsoft, o Universal Human Relevance System (UHRS).

Esses trabalhadores estão predominantemente baseados na África Oriental, na Venezuela, no Paquistão, na Índia e nas Filipinas – embora haja até trabalhadores em campos de refugiados, que rotulam, avaliam e geram dados. Os trabalhadores são pagos por tarefa, com remuneração variando de um centavo a alguns dólares – embora o valor máximo seja considerado uma raridade, segundo os trabalhadores. “A natureza do trabalho muitas vezes parece servidão digital – mas é uma necessidade para ganhar a vida”, diz Hassan, que agora também trabalha para Clickworker e Appen.

Às vezes, os trabalhadores são solicitados a fazer upload de áudio, imagens e vídeos, que contribuem para os conjuntos de dados usados para treinar IA. Os trabalhadores geralmente não sabem exatamente como suas contribuições serão processadas, mas estas podem ser bastante pessoais: na aba de empregos dos trabalhadores da Clickworker, uma tarefa diz: “Mostre-nos o seu bebê/criança! Ajude a ensinar IA tirando 5 fotos do seu bebê/criança!” por €2 ($2.15). A próxima diz: “Deixe seu menor de idade (com idade entre 13 e 17 anos) participar de um projeto de selfie interessante!”

Algumas tarefas envolvem moderação de conteúdo – ajudando a IA a distinguir entre conteúdo inocente e aquele que contém violência, discurso de ódio ou imagens adultas. Hassan compartilhou capturas de tela das tarefas disponíveis no dia em que falou com a ENBLE. Uma tarefa UHRS pediu a ele para identificar “fuck”, “c**t”, “dick” e “bitch” em um corpo de texto. Para Toloka, ele foi mostrado páginas e mais páginas de corpos parcialmente nus, incluindo imagens sexualizadas, anúncios de lingerie, uma escultura exposta e até mesmo um corpo nu de uma pintura no estilo renascentista. A tarefa? Decifrar o adulto do inofensivo, para ajudar o algoritmo a distinguir entre torsos salaciosos e admissíveis.

Hassan lembra de moderar conteúdo enquanto era menor de 18 anos na UHRS, que, segundo ele, continua afetando sua saúde mental. Ele diz que o conteúdo era explícito: relatos de incidentes de estupro retirados de artigos com citações de registros judiciais; discurso de ódio de postagens em redes sociais; descrições de assassinatos em artigos; imagens sexualizadas de menores de idade; imagens nuas de mulheres adultas; vídeos adultos de mulheres e garotas no YouTube e TikTok.

Muitos dos trabalhadores remotos no Paquistão são menores de idade, diz Hassan. Ele realizou uma pesquisa com 96 respondentes em um grupo de chat no Telegram com quase 10.000 trabalhadores da UHRS, em nome da ENBLE. Cerca de um quinto disse que era menor de 18 anos.

Awais, de 20 anos, de Lahore, que concordou em falar sob condição de que seu primeiro nome não fosse publicado, começou a trabalhar para a UHRS via Clickworker aos 16 anos, depois de prometer à sua namorada uma viagem de aniversário aos lagos turquesa e montanhas cobertas de neve na região norte do Paquistão. Seus pais não podiam ajudá-lo com o dinheiro, então ele recorreu ao trabalho de dados, usando o cartão de identificação de um amigo. “Foi fácil”, diz ele.

Ele trabalhava no site todos os dias, principalmente completando a tarefa “Extensão de Teste Genérico de Cenários” da Microsoft. Isso envolvia testar a precisão da página inicial e do mecanismo de busca. Em outras palavras, selecionar “ofertas de carros” na página inicial do MSN mostrava fotos de carros? Pesquisar “gato” no Bing mostrava imagens de felinos? Ele estava ganhando de $1 a $3 por dia, mas achava o trabalho monótono e irritante. Às vezes, ele trabalhava 10 horas por $1, porque tinha que fazer treinamento não remunerado para acessar certas tarefas. Mesmo quando ele passava pelo treinamento, poderia não haver nenhuma tarefa para completar; ou se ele excedesse o limite de tempo, eles suspenderiam sua conta, ele diz. Então, aparentemente do nada, ele foi banido de realizar sua tarefa mais lucrativa – algo que os trabalhadores dizem acontecer regularmente. Proibições podem ocorrer por uma série de motivos, como dar respostas incorretas, responder muito rápido ou dar respostas que se desviam do padrão médio de outros trabalhadores. Ele havia ganho $70 no total. Era quase suficiente para levar sua namorada do ensino médio na viagem, então Awais saiu de vez.

O Clickworker não respondeu aos pedidos de comentário. A Microsoft se recusou a comentar.

“Em alguns casos, uma vez que um usuário conclui o treinamento, a cota de respostas já foi atingida para aquele projeto e a tarefa não está mais disponível”, disse Dzhikaev. “No entanto, caso outras tarefas semelhantes estejam disponíveis, eles poderão participar sem mais treinamento”.

Pesquisadores afirmam ter encontrado evidências de trabalhadores menores de idade na indústria da IA em outros lugares do mundo. Julian Posada, professor assistente de Estudos Americanos na Universidade de Yale, que estuda o trabalho humano e a produção de dados na indústria de IA, diz que conheceu trabalhadores na Venezuela que ingressaram em plataformas quando ainda eram menores de idade.

Burlar verificações de idade pode ser bastante simples. As plataformas mais flexíveis, como Clickworker e Toloka, simplesmente pedem aos trabalhadores que declarem que têm mais de 18 anos; as mais seguras, como Remotasks, usam tecnologia de reconhecimento facial para comparar os trabalhadores com sua identidade fotográfica. Mas isso também é falível, diz Posada, citando um trabalhador que diz que simplesmente segurou o telefone no rosto de sua avó para passar pelas verificações. O compartilhamento de uma única conta dentro de unidades familiares é outra forma de acesso ao trabalho por menores, diz Posada. Ele descobriu que em algumas casas venezuelanas, quando os pais cozinham ou fazem recados, as crianças fazem login para concluir tarefas. Ele diz que uma família de seis pessoas que conheceu, com crianças de até 13 anos, afirmava compartilhar uma conta. Eles administravam sua casa como uma fábrica, diz Posada, de modo que dois membros da família estavam nos computadores trabalhando na rotulagem de dados em algum momento. “As costas deles doíam porque ficavam sentados por tanto tempo. Então eles faziam uma pausa, e então as crianças assumiam”, diz ele.

As distâncias físicas entre os trabalhadores que treinam a IA e as gigantes da tecnologia no final da cadeia de suprimentos – “a desterritorialização da internet”, como Posada chama – criam uma situação onde forças de trabalho inteiras são essencialmente invisíveis, governadas por um conjunto diferente de regras, ou por nenhuma.

A falta de supervisão dos trabalhadores pode até impedir que os clientes saibam se os funcionários estão recebendo seu pagamento. Um usuário do Clickworker na Índia, que pediu anonimato para evitar ser banido do site, disse à ENBLE que “emprega” 17 trabalhadores da UHRS em um escritório, fornecendo a eles um computador, celular e internet, em troca de metade de seus ganhos. Embora seus trabalhadores tenham entre 18 e 20 anos, devido à falta de requisitos de certificação de idade do Clickworker, ele sabe que adolescentes usam a plataforma.

Nos cantos mais sombrios da indústria de crowdsourcing, o uso de trabalhadores infantis é evidente.

Os serviços de resolução de Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart), nos quais as plataformas de crowdsourcing pagam às pessoas para resolverem captchas, são uma parte menos compreendida do ecossistema de IA. Captchas são projetados para distinguir um bot de um humano – exemplo mais notável sendo o reCaptcha do Google, que pede aos usuários para identificar objetos em imagens para acessar um site. O propósito exato desses serviços que pagam pessoas para resolvê-los permanece um mistério para acadêmicos, diz Posada. “Mas o que posso confirmar é que muitas empresas, incluindo o reCaptcha do Google, usam esses serviços para treinar modelos de IA”, diz ele. “Assim, esses trabalhadores contribuem indiretamente para os avanços da IA.”

O Google não respondeu a um pedido de comentário a tempo para a publicação.

Há pelo menos 152 serviços ativos, principalmente baseados na China, com mais de meio milhão de pessoas trabalhando no mercado clandestino de reCaptcha, de acordo com um estudo de 2019 de pesquisadores da Universidade de Zhejiang, em Hangzhou.

“Emprego estável para todos. Em todos os lugares”, afirma o serviço Kolotibablo em seu site. A empresa tem um site promociona dedicado a exibir depoimentos de seus trabalhadores, que inclui imagens de crianças pequenas de diferentes partes do mundo. Em uma delas, um menino indonésio sorridente mostra seu bolo de 11º aniversário para a câmera. “Estou muito feliz por poder aumentar minhas economias para o futuro”, escreve outro, provavelmente com apenas 7 ou 8 anos. Uma garota de 14 anos, vestindo um longo vestido da Hello Kitty, compartilha uma foto de seu local de trabalho: um laptop sobre uma escrivaninha rosa temática da Barbie.

Não todos os trabalhadores entrevistados pela ENBLE se sentiram frustrados com as plataformas. Com 17 anos, a maioria dos amigos de Younis Hamdeen estava esperando mesas em restaurantes. Mas o adolescente paquistanês optou por se juntar à UHRS via Appen, usando a plataforma por três ou quatro horas por dia, além da escola, ganhando até US$ 100 por mês. Comparar produtos listados na Amazon foi a tarefa mais lucrativa que ele encontrou. “Eu adoro trabalhar nesta plataforma”, diz Hamdeen, agora com 18 anos, porque ele é pago em dólares americanos – o que é raro no Paquistão – e se beneficia de taxas de câmbio vantajosas.

Mas o fato de que o pagamento por esse trabalho é incrivelmente baixo em comparação com os salários dos funcionários das empresas de tecnologia que trabalham internamente, e que os benefícios do trabalho fluem apenas de um lado – do sul global para o norte global – leva a paralelos desconfortáveis. “Precisamos considerar o tipo de colonialismo que está sendo promovido com esse tipo de trabalho”, diz Savage, do Civic AI Lab.

Hassan recentemente foi aceito em um programa de bacharelado em tecnologia de laboratório médico. Os aplicativos continuam sendo sua única fonte de renda, trabalhando das 8h às 18h, seguido de um turno das 2h às 6h. No entanto, seus ganhos caíram para apenas US$ 100 por mês, à medida que a demanda por tarefas superou a oferta e mais trabalhadores se juntaram desde a pandemia.

Ele lamenta que as tarefas da UHRS possam pagar apenas 1 centavo. Mesmo em empregos mais bem remunerados, como as tarefas ocasionais de mídia social no Appen, a quantidade de tempo que ele precisa gastar fazendo pesquisas não remuneradas significa que ele precisa trabalhar cinco ou seis horas para completar uma hora de trabalho em tempo real, tudo para ganhar US$ 2, diz ele.

“É escravidão digital”, diz Hassan.