Sony AI propõe nova solução para lidar com o viés de visão computacional contra a pele amarela

Sony AI propõe solução contra viés de visão computacional para pele amarela.

A gigante japonesa da tecnologia, Sony, descreveu em um artigo recente uma possível maneira de medir o viés do sistema contra alguns tons de pele.

Os sistemas de visão computacional historicamente têm dificuldades em detectar e analisar com precisão pessoas com tons de pele amarelados. A escala padrão de tipos de pele de Fitzpatrick não considera adequadamente a variação no tom da pele, focando apenas no tom claro ao escuro. Como resultado, conjuntos de dados e algoritmos padrão apresentam desempenho reduzido em pessoas com tonalidades de pele amarelada.

Esse problema impacta desproporcionalmente certos grupos étnicos, como os asiáticos, levando a resultados injustos. Por exemplo, estudos têm mostrado que sistemas de reconhecimento facial produzidos no Ocidente têm menor precisão para rostos asiáticos em comparação com outras etnias. A falta de diversidade nos dados de treinamento é um fator-chave que impulsiona esses preconceitos.

No artigo, pesquisadores de IA da Sony propuseram uma abordagem multidimensional para medir a cor aparente da pele em imagens, a fim de avaliar melhor a imparcialidade nos sistemas de visão computacional. O estudo argumenta que a abordagem comum de usar a escala de tipos de pele de Fitzpatrick para caracterizar a cor da pele é limitada, pois se concentra apenas no tom da pele, do claro ao escuro. Em vez disso, os pesquisadores propõem medir tanto a luminosidade perceptual L* para capturar o tom da pele, quanto o ângulo de matiz h* para capturar a tonalidade da pele, indo do vermelho ao amarelo. O autor principal do estudo, William Thong, explicou:

“Embora prática e eficaz, a redução da cor da pele ao seu tom é limitante, dada a complexidade constitutiva da pele. […] Portanto, promovemos uma escala multidimensional para melhor representar variações aparentes na cor da pele entre indivíduos em imagens.”

Os pesquisadores demonstraram o valor dessa abordagem multidimensional em diversos experimentos. Primeiro, eles mostraram que conjuntos de dados de imagens de rostos padrão, como o CelebAMask-HQ e FFHQ, estão inclinados para a cor da pele vermelho-clara e sub-representam tons de pele amarelo-escuros. Modelos gerativos treinados com esses conjuntos de dados reproduzem um viés semelhante.

Em segundo lugar, o estudo revelou preconceitos de tom de pele e tonalidade em modelos de recorte de imagem baseados em saliência e verificação de rosto. O algoritmo de recorte de imagem do Twitter mostrou preferência por cores de pele vermelho-claras. Modelos populares de verificação de rosto também tiveram um desempenho melhor em cores de pele claras e vermelhas.

Por fim, a manipulação do tom de pele e da tonalidade revelou efeitos causais em modelos de previsão de atributos. Pessoas com tons de pele mais claros tinham maior probabilidade de serem classificadas como femininas, enquanto aquelas com tonalidades de pele mais vermelhas eram frequentemente previstas como sorrindo. Thong concluiu:

“Nossas contribuições para avaliar a cor da pele de maneira multidimensional oferecem novas perspectivas, anteriormente invisíveis, para melhor entender os preconceitos na avaliação da imparcialidade de conjuntos de dados e modelos.”

Os pesquisadores recomendam adotar escalas de cor de pele multidimensionais como uma ferramenta de imparcialidade ao coletar novos conjuntos de dados ou avaliar modelos de visão computacional. Isso pode ajudar a mitigar problemas como sub-representação e diferenças de desempenho para cores de pele específicas.

Crédito da imagem em destaque: