Anthropic divulgue accidentellement des informations sur son modèle d'IA le plus puissant à ce jour
Une faille dans la sécurité des données a révélé les secrets les mieux gardés d'Anthropic. Près de 3 000 documents internes ont été divulgués sur Internet après que l'entreprise a omis de marquer certains fichiers comme privés dans son système de gestion de contenu.
Les documents divulgués révèlent l'existence de « Claude Mythos », que la société Anthropic qualifie de « modèle d'IA de loin le plus puissant que nous ayons jamais développé ». L'entreprise a confirmé cette fuite et affirme que ce modèle marque un « tournant décisif » en matière de performances de l'IA. Il fait actuellement l'objet d'essais auprès d'une sélection de clients bénéficiant d'un accès anticipé.
Cette fuite a également révélé l'existence d'un nouveau niveau de modèle encore inédit, baptisé « Capybara », destiné à se situer au-dessus du niveau Opus actuel d'Anthropic. Le plus frappant : des documents internes mettent en garde contre le fait que Claude Mythos présente de graves risques en matière de cybersécurité et pourrait aider les pirates informatiques à mener des cyberattaques qui « dépasseraient de loin les capacités des défenseurs ».
Pourquoi Inbenta ?

