Claude Mythos es un modelo de IA tan poderoso que da miedo. Por lo tanto, Anthropic ha decidido que no puedes utilizarlo. – Desde dentro
Vista previa de Claude Mythos ya esta ahi y es tan bueno que da miedo. Literalmente. Anthropic acaba de

Vista previa de Claude Mythos ya esta ahi y es tan bueno que da miedo. Literalmente. Anthropic acaba de lanzarlo al público, pero lo hicieron con tanto cuidado que ni siquiera podemos probarlo y sólo estará disponible para ciertos socios tecnológicos. Esto es frustrante e inquietante al mismo tiempo, pero también sensato.
Tan poderoso que da miedo. El 24 de febrero de 2026, los ingenieros de Anthropic pudieron probar por primera vez su nuevo modelo de inteligencia artificial, al que llamaron Claude Mythos Preview. Mientras lo hacían, una cosa les quedó clara:
«Demostró un salto dramático en sus capacidades cibernéticas en comparación con modelos anteriores, incluida la capacidad de descubrir y explotar vulnerabilidades de forma autónoma». día cero en los principales sistemas operativos y navegadores web del mercado.
Amenaza a la ciberseguridad global. Este resultado dejó claro a los líderes de Anthropic que, si bien esta capacidad lo hace muy valioso para fines de defensa, también plantea riesgos claros si el modelo se ofreciera a nivel mundial. Así, un ciberdelincuente podría aprovechar esto para encontrar y explotar vulnerabilidades en todo tipo de sistemas. Hace unas horas la compañía desarrolló este análisis del mito como amenaza a la ciberseguridad en una publicación en su blogy, por ejemplo, destacó cómo Mythos encontró una debilidad (ahora corregido), que estuvo presente durante 27 años en OpenBSD, un sistema operativo conocido precisamente por su altísima seguridad. Hubo otros ejemplos y todos dejaron clara la conclusión:
El mito es demasiado poderoso para que lo utilicen simples mortales.
El mejor de la historia según benchmarks. Antropoceno ha publicado un informe muy detallado sobre este modelo con su “tarjeta de sistema”. Entre los datos disponibles, por ejemplo, está su rendimiento en benchmarks, donde superó a GPT 5.4, Gemini 3.1 Pro y también a Claude Ous 4.6, que hasta ahora ha sido el mejor modelo del mundo en casi todas las pruebas de rendimiento. Aunque en algunos casos el salto no es espectacular, en otros casos, por ejemplo USAMO – resolución de problemas matemáticos – el mito prácticamente alcanza la perfección.
Casi no alucina… Este mapa del sistema también detalla que Claude Mythos Preview tiene una tasa de alucinaciones significativamente más baja que Claude Opus 4.6 y modelos anteriores. También es capaz de decir «No sé» cuando no tiene suficiente información para responder, lo que reduce las alucinaciones debidas al exceso de confianza.
…pero cuando suceda, ten cuidado. El artículo advierte sobre un nuevo fenómeno: cuando el modelo falla en algunas tareas complejas, las “alucinaciones” no son errores obvios, sino errores técnicos extremadamente sutiles y bien argumentados. Esto es peligroso porque la respuesta parece completamente correcta a los expertos y requiere una verificación muy exhaustiva.
Proyecto ala de cristal. Este rendimiento y capacidad ha significado que el modelo sólo estará disponible a través de lo que llaman un “programa de defensa”. Proyecto ala de cristal y que estará disponible exclusivamente para algunos de los socios tecnológicos de Anthropic. En concreto AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. Todos ustedes tienen el privilegio (y la responsabilidad) de tener acceso a Claude Mythos Preview para identificar y remediar vulnerabilidades y exploits antes de que actores malintencionados puedan hacerlo.
Avance del mito «Es sólo el comienzo». Aunque este modelo es el de mejor rendimiento hasta la fecha, al menos según los puntos de referencia y los datos presentados por Anthropic, la compañía asegura: “No vemos ninguna razón para creer que Mythos Preview sea el punto en el que las capacidades de ciberseguridad de los modelos de lenguaje alcanzan su punto máximo”. Aseguran que esperan que los modelos sigan mejorando en los próximos meses y años, aunque sin duda este nuevo modelo está en un nivel diferente.
En | OpenAI y Anthropic se han propuesto lo imposible: perder 85.000 millones de dólares en un año y sobrevivir