Anthropic filtra accidentalmente detalles sobre su modelo de IA más potente hasta la fecha
Un error en el manejo de datos ha sacado a la luz los secretos mejor guardados de Anthropic. Cerca de 3.000 documentos internos se filtraron en Internet después de que la empresa no marcara los archivos como privados en su sistema de gestión de contenidos.
Los materiales filtrados revelan «Claude Mythos», al que Anthropic califica como «el modelo de IA más potente que hemos desarrollado hasta la fecha, con diferencia». La empresa ha confirmado la filtración y afirma que el modelo supone un «salto cualitativo» en el rendimiento de la IA. Actualmente se encuentra en fase de pruebas con un grupo selecto de clientes con acceso anticipado.
La filtración también reveló una nueva categoría de modelos aún no lanzada, denominada «Capybara», diseñada para situarse por encima de la categoría Opus ya existente de Anthropic. Lo más llamativo: los documentos internos advierten de que Claude Mythos plantea graves riesgos de ciberseguridad y podría ayudar a los piratas informáticos a llevar a cabo ciberataques que «superan con creces los esfuerzos de los defensores».
¿Por qué Inbenta?

