Saltar al contenido
Inteligencia Artificial

Anthropic restablece acceso global a Claude Fable 5 tras levantamiento de controles

El gobierno de EE. UU. levantó las restricciones de exportación sobre los modelos Claude Fable 5 y Mythos 5 de Anthropic, permitiendo el acceso global a Fable 5 a partir del 1 de julio de 2026.

Redacción Tricuatro 1 julio, 2026 3 min de lectura Agreganos en
Tamaño de texto

El gobierno de EE. UU. levantó los controles de exportación sobre los modelos de IA Claude Fable 5 y Claude Mythos 5 de Anthropic el 30 de junio de 2026, permitiendo que Fable 5 esté disponible globalmente a partir del 1 de julio de 2026, según anunció la compañía.

Esta decisión llega después de una suspensión temporal impuesta el 12 de junio de 2026, cuando el gobierno estadounidense aplicó controles de exportación a ambos modelos. La medida inicial restringía el acceso a ciudadanos extranjeros, tanto dentro como fuera de EE. UU., debido a preocupaciones de seguridad y la incapacidad de verificar la nacionalidad en tiempo real.

La suspensión se originó tras un informe de investigadores de Amazon que descubrieron un método para eludir las salvaguardas de Fable 5. Este "jailbreak" permitió al modelo identificar vulnerabilidades de software y, en un caso, generar código que demostraba cómo explotar una de ellas.

Anthropic actuó rápidamente, colaborando estrechamente con el gobierno y sus socios, incluyendo Amazon, para revisar el informe y la evidencia. La compañía confirmó que muchos modelos menos potentes, como Claude Opus 4.8, GPT-5.5 y Kimi K2.7, podían identificar las mismas vulnerabilidades. Además, todos los modelos probados, incluyendo Claude Haiku 4.5, Sonnet 4.6, Opus 4.6, Opus 4.7, Opus 4.8, GPT-5.4, GPT-5.5 y Kimi K2.7, podían producir demostraciones de explotación similares.

"Nuestras pruebas confirmaron que muchos modelos menos capaces, incluyendo Claude Opus 4.8, GPT-5.5 y Kimi K2.7, podían identificar las mismas vulnerabilidades que Fable 5 en el informe."

A pesar de que el comportamiento reportado se consideró un "caso límite" para las salvaguardas de Fable 5, relacionado con tareas rutinarias de ciberseguridad defensiva y sin exponer capacidades ofensivas únicas de Mythos 5, Anthropic implementó mejoras. Entrenaron un clasificador de seguridad avanzado que bloquea la técnica específica descrita en el informe de Amazon en más del 99% de los casos. Las solicitudes bloqueadas por Fable 5 serán redirigidas automáticamente a Opus 4.8.

La estrategia de Anthropic para Fable 5 siempre incluyó las salvaguardas más robustas aplicadas hasta la fecha, duplicando el personal dedicado a la seguridad antes de su lanzamiento. Esto se basa en un enfoque de "defensa en profundidad", combinando el entrenamiento del modelo para rechazar solicitudes peligrosas con el análisis retroactivo de patrones de uso indebido. Los clasificadores de seguridad, pequeños sistemas de IA, son clave para detectar y bloquear tareas de ciberseguridad potencialmente dañinas.

Para Fable 5, se implementó un "margen de seguridad" significativamente más amplio, lo que significa que el clasificador bloquea un mayor número de solicitudes que son probablemente benignas, pero que podrían tener un mínimo riesgo. Esto, aunque a veces frustrante para los usuarios, asegura que las solicitudes genuinamente peligrosas sean bloqueadas. Anthropic considera que los "jailbreaks" reportados hasta ahora para Fable 5 entran en la categoría de "menores", sin desbloquear comportamientos dañinos centrales.

Reconociendo la necesidad de un estándar unificado, Anthropic está colaborando con Amazon, Microsoft, Google y otros socios de Project Glasswing para desarrollar un marco de consenso que evalúe la gravedad de los "jailbreaks" de IA. Este marco propone cuatro criterios: la ganancia de capacidad, la amplitud de la ganancia de capacidad, la facilidad de "weaponización" y la "descubribilidad" de la técnica.

Además, Anthropic está profundizando su colaboración con el gobierno de EE. UU., incluyendo el Centro para Estándares e Innovación de IA (CAISI) del Departamento de Comercio. Esto implica acceso temprano del gobierno a modelos y salvaguardas para evaluación previa al lanzamiento, intercambio rápido de información sobre "jailbreaks" y recursos dedicados para investigación conjunta en seguridad de IA. También se restauró el acceso a Mythos 5 para un conjunto de organizaciones estadounidenses el 26 de junio de 2026, y se espera reanudar el acceso en AWS, Google Cloud y Microsoft Foundry lo antes posible.

La empresa espera que esta cooperación y el marco de la industria sirvan como base para reglas sistemáticas en todo el sector, y que estas reglas se codifiquen en una regulación sólida y transparente. Para seguir fortaleciendo la seguridad, Anthropic lanzará un nuevo programa HackerOne para que investigadores de seguridad puedan enviar "jailbreaks" cibernéticos potenciales descubiertos en Fable 5.

Compartir:
También disponible en: EN

Notas relacionadas

Últimas noticias

Ver todas

Comentarios (0)

Aún no hay comentarios. ¡Sé el primero!

Solo los lectores registrados pueden comentar.