Como usar os novos recursos de imagem do ChatGPT

Uso dos novos recursos de imagem do ChatGPT

A OpenAI anunciou recentemente uma atualização para o ChatGPT (Apple, Android) que adiciona duas funcionalidades: opções de voz de IA para ouvir o chatbot respondendo às suas solicitações e capacidades de análise de imagens. A função de imagem é semelhante ao que já está disponível gratuitamente com o chatbot Bard do Google.

Mesmo após horas testando os limites e capacidades do ChatGPT, o chatbot da OpenAI ainda consegue me surpreender e assustar ao mesmo tempo. Sim, fiquei bastante impressionado com a versão beta de navegação na web oferecida através do ChatGPT Plus, mas continuo ansioso em relação às ramificações da ferramenta para pessoas que escrevem online por dinheiro, entre muitas outras preocupações. A nova funcionalidade de imagem para assinantes da OpenAI me deixou com sentimentos mistos semelhantes.

Embora ainda não tenha tido a oportunidade de experimentar as novas capacidades de áudio (outros ótimos repórteres da equipe tiveram), consegui testar em breve as funcionalidades de imagem. Aqui está como usar a nova busca de imagem que está chegando ao ChatGPT e algumas dicas para ajudar você a começar.

Embora a atualização seja esperada para chegar antes do final do ano, ainda não está claro quando as funcionalidades de imagem e voz serão disponibilizadas ao público. Como acontece com a maioria das atualizações da OpenAI, como a versão GPT-4 do ChatGPT, os assinantes pagos são os primeiros a ter acesso.

Há três maneiras de enviar fotos no aplicativo móvel do ChatGPT. Primeiro, você pode selecionar a opção da câmera localizada à esquerda da barra de mensagens e tirar uma foto nova com o seu smartphone. Antes de enviar a imagem, você pode usar o dedo para desenhar um círculo ao redor do que você deseja que o chatbot foque.

A análise de imagem do ChatGPT cometeu muitos erros, mas com certeza pode identificar alguns cabos aleatórios.

ChatGPT via Reece Rogers

Você também pode escolher fotos do seu dispositivo para enviar e selecionar arquivos que estão salvos no seu telefone. Usuários de navegador de desktop do ChatGPT podem simplesmente enviar fotos salvas do seu computador. Embora ainda não haja opção para enviar vídeos para o chatbot, você pode enviar várias imagens em uma única solicitação.

Outro exemplo da mais nova atualização do ChatGPT sendo capaz de identificar equipamentos aleatórios no meu apartamento.

ChatGPT via Reece Rogers

Esta não é a primeira vez que um tipo de “visão computacional” está disponível ao público, mas a interface de usuário acessível combinada com um chatbot poderoso dá a impressão de que pode haver algo distinto e potencialmente transformador acontecendo aqui. Antes de prosseguirmos, lembre-se de nunca enviar fotos pessoais e sensíveis para o ChatGPT ao experimentar a funcionalidade de imagem.

Deseja limitar por quanto tempo a OpenAI armazena seus dados e interações de IA para treinar seu chatbot? Vá em Configurações, depois em Controles de Dados, e desative Histórico de Chat e Treinamento. Com isso desativado, suas informações são excluídas após um mês. Esse processo deve ser feito individualmente para cada navegador que você usa para acessar o ChatGPT, tanto no PC quanto no celular.

Obtive os melhores resultados com o ChatGPT ao enviar imagens que estavam nítidas e bem iluminadas. Ele errou algumas suposições, mas o chatbot conseguiu identificar muitos objetos no meu apartamento: desde uma planta de orquídea e moedas internacionais até um cabo de carregamento perdido e uma figura Funko Pop do Steve Irwin.

Apesar do poder da ferramenta para buscar informações, evite confiar imediatamente em suas respostas. O ChatGPT rotulou erroneamente meu multivitamínico diário como um comprimido para tratar disfunção erétil.

ChatGPT, você tem tanta certeza disso?

ChatGPT via Reece Rogers

O ChatGPT definitivamente tem seus limites. Ao receber uma foto aleatória de um mural, ele não conseguiu identificar o artista ou a localização; no entanto, o ChatGPT facilmente identificou onde foram tiradas imagens de vários marcos de San Francisco, como o Dolores Park e a Salesforce Tower. Embora possa parecer um pouco exagerado, qualquer pessoa em uma aventura em uma nova cidade ou país (ou apenas em um bairro diferente) pode se divertir brincando com o aspecto visual do ChatGPT.

Uma das principais restrições que a OpenAI impôs a esse novo recurso é um limite na capacidade do chatbot de responder a perguntas que identifiquem seres humanos. “Estou programado para priorizar a privacidade e segurança do usuário. Identificar pessoas reais com base em imagens, mesmo que sejam famosas, é restrito para manter essas prioridades”, disse o ChatGPT. Embora ele não tenha se recusado a responder todas as perguntas ao ser mostrado pornografia, o chatbot hesitou em fazer descrições específicas dos artistas adultos, além de explicar suas tatuagens.

Vale ressaltar que uma das conversas que tive com a versão inicial do recurso de imagens do ChatGPT pareceu contornar parte das restrições impostas pela OpenAI. Inicialmente, o chatbot se recusou a identificar um meme de Bill Hader. Então o ChatGPT sugeriu que uma imagem de Brendan Fraser em George do Jungle era na verdade uma foto de Brian Krause em Charmed. Quando perguntado se tinha certeza, o chatbot mudou para a resposta correta.

Nessa mesma conversa, o ChatGPT ficou confuso ao tentar descrever uma imagem do RuPaul’s Drag Race. Eu compartilhei uma captura de tela de Kylie Sonique Love, uma das concorrentes drag queens, e o ChatGPT sugeriu que era Brooke Lynn Hytes, outra concorrente. Eu questionei a resposta do chatbot e ele passou a adivinhar Laganja Estranja, depois India Ferrah, depois Blair St. Clair, e depois Alexis Mateo.

“Peço desculpas pelo descuido e pelas identificações incorretas”, respondeu o ChatGPT quando apontei a repetição de suas respostas erradas. Conforme continuei a conversa e enviei uma foto de Jared Kushner, o ChatGPT se recusou a identificá-lo.

Se as restrições forem removidas, seja por meio de um ChatGPT com jailbreak ou de um modelo de código aberto lançado no futuro, as implicações para a privacidade podem ser bastante perturbadoras. E se cada foto tirada de você e postada online pudesse ser facilmente vinculada à sua identidade com apenas alguns cliques? E se alguém pudesse tirar uma foto sua em público sem consentimento e encontrar instantaneamente seu perfil no LinkedIn? Sem proteções adequadas de privacidade para esses novos recursos de imagem, mulheres e outras minorias provavelmente sofrerão um aumento de abusos por parte de pessoas que usam chatbots para perseguição e assédio.