A Anthropic afirma que sua versão atualizada do ChatGPT possui mais habilidades e conta menos mentiras.
A Anthropic declara que sua versão atualizada do ChatGPT possui ampla capacidade e relatos mais precisos.
ChatGPT não é o único jogo de IA na cidade. Para provar esse ponto, a Anthropic aprimorou seu chatbot de IA Claude com mais habilidades e menos limitações. Em um post publicado na terça-feira, a Anthropic descreveu o que há de novo para o Claude na versão 2.1, incluindo uma diminuição das alucinações, a capacidade de processar 150.000 palavras em uma solicitação e o uso de ferramentas personalizadas para tarefas específicas.
Alucinações, ou mentiras, são uma fraqueza comum em todos os bots de IA generativa, pois tendem a fornecer informações enganosas ou imprecisas. Com o Claude 2.1, a Anthropic promete maior honestidade, com uma redução de 50% em declarações falsas em comparação com a versão anterior.
Também: Sam Altman retorna para a OpenAI como CEO após remoção de membros do conselho
Para testar o novo nível de veracidade do Claude 2.1, a equipe de desenvolvimento criou um grande número de perguntas complexas, mas factuais, que desafiam outros modelos de IA. Usando um guia para distinguir afirmações falsas de admissões de incerteza, a equipe descobriu que o Claude 2.1 era mais propenso a recusar responder a uma pergunta do que fornecer uma resposta errada.
A nova versão do Claude também expandiu suas habilidades de compreensão e resumo, especialmente com documentos longos e complexos que requerem maior precisão, como documentos jurídicos, relatórios financeiros e especificações técnicas. Nos testes, o Claude 2.1 apresentou uma diminuição de 30% em respostas incorretas e uma redução de 3x a 4x em encontrar erroneamente que um documento suportava uma reivindicação específica.
- Compre uma associação ao Costco por apenas $20 agora mesmo com esta...
- Este Dyson Airwrap de $480 é uma oferta que você não deve perder.
- Economize $1900 nesta TV externa durante o evento de Black Friday d...
Na lista de próximas atualizações, a nova versão do Claude aceitará o dobro de informações apresentadas em uma solicitação. O novo limite é de 200.000 tokens, o que equivale a cerca de 150.000 palavras ou mais de 500 páginas.
Também: Avanços em IA generativa forçarão as empresas a pensar grande e agir rápido
Agora você pode fazer upload de documentos técnicos grandes, como bases de código, declarações financeiras e até mesmo obras literárias completas, como a Ilíada ou a Odisseia. Em resposta, o Clause analisará os arquivos enviados para resumir seu conteúdo, gerar uma sessão de P&R e até mesmo comparar vários documentos.
O uso de ferramentas personalizadas é outra habilidade nova do Claude. Atualmente em desenvolvimento inicial como um recurso beta, esta nova opção permite que você integre o Claude a processos externos, produtos e APIs. Assim, o Claude agora pode pesquisar na web, obter informações de bancos de dados externos e acessar funções ou APIs projetadas por desenvolvedores.
Com a nova integração, o Claude pode determinar qual ferramenta personalizada é necessária para realizar uma determinada tarefa. Por exemplo, ele poderia usar uma calculadora para resolver equações complexas, traduzir solicitações de linguagem natural em chamadas de API, responder a solicitações pesquisando em um banco de dados ou na web e se conectar a bancos de dados de produtos para ajudar as pessoas com recomendações ou compras.
Também: Agora você pode conversar com o ChatGPT por voz gratuitamente
Por fim, o Claude 2.1 pode aceitar solicitações do sistema em que você fornece instruções personalizadas ao chatbot para responder a uma solicitação específica. O objetivo das solicitações do sistema é definir um determinado contexto para ajudar o Claude a fornecer respostas mais consistentes e estruturadas.
O Claude 2.1 está agora disponível através da sua API e está em execução no site da Claude.AI tanto para usuários gratuitos como para assinantes Pro. No entanto, o limite de 200.000 tokens está disponível apenas para usuários Pro do Claude.