A Anthropic usa Pokémon Red para avaliar novo modelo de IA
A Anthropic utilizou o clássico jogo Pokémon Red do Game Boy para testar seu mais recente modelo de IA, o Claude 3.7 Sonnet. Ao contrário de seu antecessor, o Claude 3.0 Sonnet, que teve dificuldades para sair da área inicial, o modelo atualizado lutou com sucesso contra três líderes de ginásio, demonstrando um progresso impressionante. Equipado com memória básica, entrada de pixels na tela e chamadas de função, o Claude 3.7 Sonnet aproveitou o “pensamento ampliado” para realizar 35.000 ações e alcançar marcos significativos. A empresa revelou que, em poucas horas, a IA derrotou Brock e, posteriormente, conquistou Misty, demonstrando suas capacidades avançadas de resolução de problemas. Pokémon Red se junta a uma série de jogos agora usados para avaliar o desempenho da IA.
Por que Inbenta

