A Anthropic usa Pokémon Red para avaliar novo modelo de IA

4 de março de 2025
Automatize experiências conversacionais com IA
Descubra o poder de uma plataforma que lhe oferece controle e flexibilidade para proporcionar experiências valiosas aos clientes em grande escala.
Agende uma demonstração


A Anthropic utilizou o clássico jogo Pokémon Red do Game Boy para testar seu mais recente modelo de IA, o Claude 3.7 Sonnet. Ao contrário de seu antecessor, o Claude 3.0 Sonnet, que teve dificuldades para sair da área inicial, o modelo atualizado lutou com sucesso contra três líderes de ginásio, demonstrando um progresso impressionante. Equipado com memória básica, entrada de pixels na tela e chamadas de função, o Claude 3.7 Sonnet aproveitou o “pensamento ampliado” para realizar 35.000 ações e alcançar marcos significativos. A empresa revelou que, em poucas horas, a IA derrotou Brock e, posteriormente, conquistou Misty, demonstrando suas capacidades avançadas de resolução de problemas. Pokémon Red se junta a uma série de jogos agora usados para avaliar o desempenho da IA.

Leia mais

Por que Inbenta

Com nossa solução de IA composta, seu agente virtual aprende continuamente com cada interação, alcançando mais de 99% de precisão.
Aprenda mais
Logotipo da Gartner Peer Insights
Com base em mais de 20 avaliações de pares
Serviço e suporte

Postagens relacionadas da AI This Week

Fundadores da Fitbit retornam com aplicativo de saúde familiar com inteligência artificial
Leia mais
Claude Sonnet 5 Vazamento gera agitação na semana do Super Bowl
Leia mais
Musk incorpora a xAI à SpaceX em megaacordo privado
Leia mais