A Anthropic lança um modelo de IA mais rápido, mais inteligente e mais barato
Anthropic launches a faster, smarter, and cheaper AI model.
![](https://www.zdnet.com/a/img/resize/4a96f5d9c400530493f099a579355d6b001e2dbc/2023/08/10/c8189ff9-a20f-44e9-9b18-8aa6150f83f5/gettyimages-1246871267.jpg?auto=webp&width=1280)
Desde que a OpenAI lançou o ChatGPT, muitas empresas tentaram criar seus próprios modelos de IA, mas apenas algumas conseguiram se destacar. A Anthropic é uma delas.
A startup de IA lançou seu próprio modelo de IA, chamado Claude, em março. Ele provou ser um rival digno para o GPT-3.5 e GPT-4 da OpenAI. Com esse lançamento inicial, a Anthropic também lançou o Claude Instant, uma versão mais leve, menos cara e mais rápida do Claude, de acordo com a Anthropic. Agora, ele está recebendo uma atualização.
Também: Como a IA ajudou a colocar minha música em todas as principais plataformas de streaming
Na quarta-feira, a Anthropic lançou o Claude Instant 1.2, uma versão aprimorada do modelo que utiliza o Claude 2.0, a versão mais recente do Claude lançada em julho.
Devido às capacidades avançadas do Claude 2.0, o Claude Instant 1.2 melhorou significativamente em matemática, programação, raciocínio e segurança, gerando respostas mais longas e estruturadas, de acordo com o comunicado.
- Como a IA ajudou a colocar minha música em todos os principais serv...
- 5 casos de uso emergentes de IA generativa no comércio, de acordo c...
- O recurso de Instruções Personalizadas do ChatGPT agora está dispon...
Para testar o modelo, a Anthropic comparou o desempenho do Claude Instant 1.1 e 1.2 em avaliações de referência padrão, incluindo a avaliação Codex e o benchmark de problemas matemáticos de escola primária (GSM8k), que são bons parâmetros de referência para habilidades matemáticas e de programação.
Também: Criadores do TikTok precisarão divulgar conteúdo gerado por IA, caso contrário
Em ambos os casos, o 1.2 superou o 1.1, com uma pontuação de 58,7% em comparação com os 52,8% originais na avaliação Codex e 86,7% em comparação com os 80,9% originais no GSM8k.
Para o restante dos exames de referência, o modelo mais recente teve um desempenho ligeiramente abaixo ou acima do modelo anterior, com diferenças mínimas.
A qualidade das respostas também melhorou, com menos alucinações e maior resistência a tentativas de violação. Uma avaliação de “red-teaming” descobriu que o Claude 1.2 é o modelo mais seguro para uso.
Empresas podem ter acesso ao novo modelo preenchendo um formulário de interesse e os desenvolvedores podem usar a API, que é muito mais barata que o Claude 2.