A Anthropic lança um modelo de IA mais rápido, mais inteligente e mais barato

Anthropic launches a faster, smarter, and cheaper AI model.

Desde que a OpenAI lançou o ChatGPT, muitas empresas tentaram criar seus próprios modelos de IA, mas apenas algumas conseguiram se destacar. A Anthropic é uma delas.

A startup de IA lançou seu próprio modelo de IA, chamado Claude, em março. Ele provou ser um rival digno para o GPT-3.5 e GPT-4 da OpenAI. Com esse lançamento inicial, a Anthropic também lançou o Claude Instant, uma versão mais leve, menos cara e mais rápida do Claude, de acordo com a Anthropic. Agora, ele está recebendo uma atualização.

Também: Como a IA ajudou a colocar minha música em todas as principais plataformas de streaming

Na quarta-feira, a Anthropic lançou o Claude Instant 1.2, uma versão aprimorada do modelo que utiliza o Claude 2.0, a versão mais recente do Claude lançada em julho.

Devido às capacidades avançadas do Claude 2.0, o Claude Instant 1.2 melhorou significativamente em matemática, programação, raciocínio e segurança, gerando respostas mais longas e estruturadas, de acordo com o comunicado.

Para testar o modelo, a Anthropic comparou o desempenho do Claude Instant 1.1 e 1.2 em avaliações de referência padrão, incluindo a avaliação Codex e o benchmark de problemas matemáticos de escola primária (GSM8k), que são bons parâmetros de referência para habilidades matemáticas e de programação.

Também: Criadores do TikTok precisarão divulgar conteúdo gerado por IA, caso contrário

Em ambos os casos, o 1.2 superou o 1.1, com uma pontuação de 58,7% em comparação com os 52,8% originais na avaliação Codex e 86,7% em comparação com os 80,9% originais no GSM8k.

Para o restante dos exames de referência, o modelo mais recente teve um desempenho ligeiramente abaixo ou acima do modelo anterior, com diferenças mínimas.

A qualidade das respostas também melhorou, com menos alucinações e maior resistência a tentativas de violação. Uma avaliação de “red-teaming” descobriu que o Claude 1.2 é o modelo mais seguro para uso.

Empresas podem ter acesso ao novo modelo preenchendo um formulário de interesse e os desenvolvedores podem usar a API, que é muito mais barata que o Claude 2.