Anthropic utilise Pokémon Red pour évaluer son nouveau modèle d'IA

Automatiser l'expérience client grâce à l'IA conversationnelle

Découvrez la puissance d'une plateforme qui vous offre le contrôle et la flexibilité nécessaires pour offrir des expériences client enrichissantes à grande échelle.

Planifier une démo

Anthropic a utilisé le jeu classique Pokémon Red sur Game Boy pour tester son dernier modèle d'IA, Claude 3.7 Sonnet. Contrairement à son prédécesseur, Claude 3.0 Sonnet, qui avait du mal à quitter la zone de départ, le modèle mis à jour a réussi à combattre trois chefs de gymnase, démontrant ainsi des progrès impressionnants. Doté d'une mémoire de base, d'une entrée pixel écran et d'appels de fonction, Claude 3.7 Sonnet a exploité la « pensée étendue » pour effectuer 35 000 actions et franchir des étapes importantes. La société a révélé qu'en quelques heures, l'IA avait vaincu Brock, puis Misty, démontrant ainsi ses capacités avancées en matière de résolution de problèmes. Pokémon Red rejoint une gamme de jeux désormais utilisés pour évaluer les performances de l'IA.

Découvrez l'IA d'Inbenta

Pourquoi Inbenta ?

Grâce à notre solution d'IA composite, votre agent virtuel apprend en permanence de chaque interaction, atteignant une précision supérieure à 99 %.

Basé sur plus de 20 évaluations par des pairs

Service et assistance

Articles connexes publiés cette semaine sur l'IA

Mozilla et Claude Mythos d'Anthropic ont découvert 271 failles de sécurité dans Firefox avant sa sortie

SpaceX conclut une option de 60 milliards de dollars pour acquérir Cursor, géant du codage en IA

Apple nomme John Ternus au poste de PDG, mettant ainsi fin aux 15 années de mandat de Tim Cook à la tête de l'entreprise

Anthropic utilise Pokémon Red pour évaluer un nouveau modèle d'IA

Pourquoi Inbenta ?

Articles connexes publiés cette semaine sur l'IA