Uma olhada no curioso comportamento de pausa de inverno do ChatGPT-4

Descobrindo o curioso comportamento de hibernação do ChatGPT-4 no inverno

A inteligência artificial (IA) generativa mais popular do mundo está ficando “preguiçosa” conforme o inverno se aproxima – essa é a afirmação de alguns usuários perspicazes do ChatGPT.

De acordo com um relatório recente da ArsTechnica no final de novembro, usuários do ChatGPT, o chatbot de IA alimentado pelo modelo de linguagem natural GPT-4 da OpenAI, começaram a perceber algo estranho. Em resposta a certos pedidos, o GPT-4 se recusava a concluir tarefas ou fornecia respostas simplificadas “preguiçosas” em vez das respostas detalhadas típicas.

A OpenAI reconheceu o problema, mas afirmou que não atualizou o modelo intencionalmente. Alguns especulam agora que essa preguiça pode ser uma consequência não intencional das mudanças sazonais de comportamento humano imitadas pelo GPT-4.

Dublada de “hipótese da pausa de inverno”, a teoria sugere que, porque o GPT-4 recebe a data atual, ele aprendeu em seus vastos dados de treinamento que as pessoas tendem a encerrar grandes projetos e desacelerar em dezembro. Pesquisadores estão investigando urgentemente se essa ideia aparentemente absurda tem fundamento. O fato de estar sendo levada a sério destaca a natureza imprevisível e semelhante à humana dos grandes modelos de linguagem, como o GPT-4.

Em 24 de novembro, um usuário do Reddit relatou pedindo ao GPT-4 para preencher um grande arquivo CSV, mas ele só forneceu uma entrada como modelo. Em 1º de dezembro, Will Depue, da OpenAI, confirmou a conscientização sobre problemas de “preguiça” relacionados a “recusas excessivas” e se comprometeu a resolvê-los.

Alguns argumentam que o GPT-4 sempre foi ocasionalmente “preguiçoso” e observações recentes são apenas viés de confirmação. No entanto, o momento em que os usuários percebem mais recusas após a atualização para o GPT-4 Turbo em 11 de novembro é interessante, se coincidente, e alguns assumiram que era um novo método da OpenAI para economizar computação.

Entretenimento da teoria da “pausa de inverno”

Em 9 de dezembro, o desenvolvedor Rob Lynch descobriu que o GPT-4 gerou 4.086 caracteres quando recebeu uma data de dezembro como prompt, em comparação com 4.298 para uma data de maio. Embora o pesquisador de IA Ian Arawjo não tenha conseguido reproduzir os resultados de Lynch estatisticamente significativos, a natureza subjetiva do viés de amostragem com os modelos de linguagem torna a reprodução notoriamente difícil. Enquanto os pesquisadores se apressam para investigar, a teoria continua intrigando a comunidade de IA.

Geoffrey Litt, da Anthropic, criador do Claude, chamou isso de “teoria mais engraçada já feita”, mas admitiu que é difícil descartá-la, dadas todas as maneiras estranhas pelas quais os modelos de linguagem reagem a estímulos e incentivos no estilo humano, como mostrado pelos prompts cada vez mais estranhos. Por exemplo, pesquisas mostram que os modelos GPT produzem pontuações matemáticas melhores quando são instruídos a “respirar fundo”, enquanto a promessa de uma “dica” aumenta o tamanho das respostas. A falta de transparência em torno de possíveis alterações no GPT-4 torna até mesmo teorias improváveis dignas de exploração.

Esse episódio demonstra a imprevisibilidade dos grandes modelos de linguagem e as novas metodologias necessárias para entender suas capacidades e limitações em constante evolução. Também mostra a colaboração global em andamento para avaliar urgentemente os avanços em IA que impactam a sociedade. Por fim, é um lembrete de que os LLMs de hoje ainda exigem supervisão e testes extensos antes de serem implantados de forma responsável em aplicativos do mundo real.

A “hipótese da pausa de inverno” por trás da aparente preguiça sazonal do GPT-4 pode se provar falsa ou oferecer novas informações que melhorem iterações futuras. De qualquer forma, esse caso curioso exemplifica a natureza estranhamente antropomórfica dos sistemas de IA e a importância de compreender os riscos junto com a busca por inovações rápidas.

Imagem em destaque: Pexels