Ferramenta de IA Gemini do Google em breve voltará a retratar pessoas.

Google espera reativar o Gemini, sua ferramenta AI multimodal geradora, para retratar pessoas, de acordo com o fundador da DeepMind

“`html

Google está otimista de que resolverá o problema histórico de diversidade de imagens do Gemini em algumas semanas. | ENBLE

📅 Publicado em 1 de agosto de 2024 🕒 Leitura de 5 min


A ferramenta de IA generativa multimodal do Google, Gemini, está prestes a recuperar sua capacidade de produzir representações de pessoas, de acordo com o fundador da DeepMind, Demis Hassabis. Em uma entrevista no Mobile World Congress em Barcelona, Hassabis revelou que a capacidade de responder a solicitações de imagens de humanos será reinstalada nas “próximas semanas”. Isso ocorre após o Google suspender temporariamente o recurso devido a imprecisões históricas nas imagens produzidas.

O contratempo ocorreu quando os usuários apontaram que o Gemini estava representando figuras históricas, como os pais fundadores dos EUA, como um grupo diverso de indivíduos, em vez de apenas homens brancos. Quando questionado sobre o problema, Hassabis atribuiu isso ao fracasso do Google em identificar casos em que os usuários estavam buscando uma “representação universal” em vez de retratos diversos. Ele enfatizou que lidar com essas nuances é um desafio no campo avançado da IA.

De acordo com Hassabis, solicitações que pedem imagens de figuras históricas devem resultar em uma distribuição mais estreita de resultados, alinhando-se com a precisão histórica. O Google pretende reintroduzir o recurso após fazer os ajustes necessários nas próximas semanas. No entanto, ao ser questionado sobre como evitar o uso indevido de ferramentas de IA generativa para fins de propaganda, Hassabis reconheceu a complexidade da questão. Ele sugeriu que combater esse desafio exigiria esforços conjuntos da sociedade civil, governos e empresas de tecnologia.

A discussão também abordou os riscos associados aos modelos de IA de propósito geral de código aberto, que o Google também fornece. Hassabis destacou a necessidade de garantir que as aplicações derivadas desses sistemas não se tornem prejudiciais à medida que ganham capacidades cada vez mais poderosas. Ele enfatizou a importância de abordar essa questão antes que sistemas de IA de próxima geração com capacidades de planejamento e resolução de problemas se tornem amplamente difundidos.

Passando para o futuro dos dispositivos de IA e seu impacto no mercado móvel, Hassabis previu o surgimento de assistentes inteligentes de próxima geração que sejam verdadeiramente úteis na vida cotidiana das pessoas. Ele sugeriu que tais avanços podem remodelar a escolha de hardware móvel, potencialmente desafiando a predominância dos smartphones. Hassabis especulou que óculos ou outras formas de tecnologia vestível poderiam aprimorar a compreensão contextual dos sistemas de IA, tornando-os ainda mais úteis na vida diária dos usuários.

Em conclusão, o Google planeja reinstalar o recurso de representação humana em sua ferramenta de IA Gemini com o objetivo de fornecer retratos precisos de figuras históricas. Os desafios enfrentados ao abordar a precisão histórica e evitar o uso indevido de ferramentas de IA destacam a necessidade de discussões sociais mais amplas. Além disso, o futuro dos dispositivos de IA possui um potencial imenso para revolucionar nossa interação com a tecnologia.


Q&A: Perguntas Frequentes

Q1: Por que o Google suspendeu a capacidade de sua ferramenta de IA, Gemini, de gerar imagens de pessoas?

O Google suspendeu temporariamente o recurso devido a imprecisões históricas nas imagens produzidas pelo Gemini. Em vez de representar figuras históricas, como os pais fundadores dos EUA, exclusivamente como homens brancos, a ferramenta estava gerando representações diversas. O Google reconheceu a necessidade de corrigir essas imprecisões para garantir a precisão histórica.

Q2: Quando a capacidade do Gemini de gerar imagens de pessoas será reinstalada?

De acordo com Demis Hassabis, o fundador da DeepMind, o Google pretende reintroduzir esse recurso nas “próximas semanas”. A empresa está trabalhando para fazer os ajustes necessários no Gemini para garantir representações precisas de figuras históricas, oferecendo ao mesmo tempo uma variedade de possibilidades.

Q3: Como as ferramentas de IA generativa podem ser impedidas de serem usadas por atores mal-intencionados?

Prevenir o uso indevido de ferramentas de IA generativa apresenta um desafio complexo. De acordo com Hassabis, abordar essa questão requer colaboração entre empresas de tecnologia, sociedade civil e governos, pois envolve determinar e impor os limites dessas ferramentas. Garantir que valores e intenções estejam alinhados com os criadores da tecnologia e frustrar o uso não autorizado são aspectos críticos que precisam ser abordados coletivamente.

Q4: Quais são os riscos associados aos modelos de IA de propósito geral de código aberto?

Os modelos de IA de propósito geral de código aberto levantam preocupações sobre o uso posterior. À medida que esses sistemas se tornam mais poderosos, torna-se crucial garantir que não sejam mal utilizados ou reaproveitados para fins prejudiciais. Como um campo incipiente, os riscos potenciais são atualmente menores. No entanto, à medida que a tecnologia de IA avança, a sociedade deve considerar seriamente a potencial proliferação e má utilização desses sistemas por indivíduos ou até mesmo estados não convencionais.


🌐 Para obter mais informações sobre este tópico, confira os seguintes links:

  1. Google pausa a capacidade da ferramenta de IA Gemini de gerar imagens de pessoas após imprecisões históricas (TechCrunch)
  2. Os Cinco Grandes Atualizações do Pixel 8 e 8 Pro do Google (Digital Trends)

“““html

Imagem

🎉 Notícias emocionantes! A ferramenta de IA Gemini do Google está voltando em breve com seu recurso de representação humana! Leia tudo sobre o assunto e obtenha insights sobre os desafios da precisão histórica e o futuro dos dispositivos de IA. Não se esqueça de compartilhar este artigo com seus amigos e colegas nas redes sociais!

🤖🧠💡✨📲🌐


Observação: Este artigo foi reescrito com base no conteúdo original e inclui informações adicionais, análises e conteúdo de perguntas e respostas.

“`