Inteligencia Artificial

Claude Opus 4.8 de Anthropic mejora la "honestidad" y reduce errores en código

El nuevo modelo de inteligencia artificial de Anthropic, Claude Opus 4.8, se lanza este jueves con un enfoque en la transparencia y la reducción de fallas, ofreciendo a los usuarios mayor control sobre el esfuerzo computacional.

person Luciano Carnevalini calendar_month 28 mayo, 2026 schedule 1 min de lectura

Claude Opus 4.8 de Anthropic mejora la "honestidad" y reduce errores en código

Si usás inteligencia artificial para programar, esta noticia te interesa directamente. Anthropic está lanzando Claude Opus 4.8 este jueves, un modelo que la compañía destaca por su “honestidad”, prometiendo una reducción significativa en la propensión a errores en el código que genera.

Según Anthropic, sus modelos se entrenan para ser “honestos”, lo que implica evitar afirmaciones que no puedan sustentar. Esto es crucial, ya que un problema general en los modelos de IA es su tendencia a sacar conclusiones apresuradas, presentando su trabajo con confianza a pesar de tener evidencia escasa.

Los primeros testers de Opus 4.8 han notado que el modelo es más propenso a señalar incertidumbres sobre su trabajo y menos dado a hacer afirmaciones sin respaldo. Esta capacidad de autocrítica representa un avance importante en la fiabilidad de las herramientas de IA.

En las evaluaciones internas de la compañía, Opus 4.8 es aproximadamente 4 veces menos propenso que su predecesor a dejar pasar desapercibidas fallas en el código que genera.

Esta mejora es particularmente relevante para desarrolladores. Un modelo que detecta sus propios errores en el código no solo ahorra tiempo de depuración, sino que también aumenta la confianza en las soluciones generadas por la IA. Es un paso adelante hacia asistentes de programación más confiables y eficientes.

Además de estas mejoras en la “honestidad”, Claude Opus 4.8 introduce una función que permite a los usuarios dirigir la cantidad de esfuerzo que el modelo dedica a una tarea. Esto significa que podés elegir entre respuestas de mayor o menor esfuerzo.

Las respuestas de mayor esfuerzo consumirán más tokens, lo que resulta útil para tareas complejas que requieren máxima precisión. Por otro lado, las respuestas de menor esfuerzo son ideales si querés conservar tus límites de uso y necesitás una solución más rápida sin tanta profundidad.

Anthropic también está presentando una característica llamada “dynamic workflows” (flujos de trabajo dinámicos) en una vista previa de investigación. Esta funcionalidad permitirá a Claude abordar tareas aún más grandes y complejas de forma autónoma.

Con los flujos de trabajo dinámicos, Claude puede planificar el trabajo y luego ejecutar cientos de subagentes paralelos en una única sesión. Lo más interesante es que, con Opus 4.8, estos agentes pueden operar por períodos más largos, y el sistema verifica sus resultados antes de reportar la información final al usuario. ¿Qué implicaciones tendrá esta capacidad de orquestación para proyectos de gran escala?

Temas de la nota

Inteligencia Artificial Anthropic Productividad IA Generativa Machine Learning

También disponible en: EN

Notas relacionadas

Google lanza Gemma 4 12B: IA local para tu laptop con 16GB de RAM

El nuevo modelo de inteligencia artificial de Google busca democratizar el acceso a la IA generativa, permitiendo su ejecución en computadoras de consumo promedio.

schedule 3 min de lectura

Nvidia desafía a Intel y AMD con el superchip RTX Spark para PC

Nvidia presentó RTX Spark, un procesador que promete llevar la inteligencia artificial avanzada directamente a tu PC, sin depender de la nube, y potenciar el gaming a niveles nunca vistos en equipos convencionales.

schedule 3 min de lectura

La pantalla de inicio de Roku se renueva con IA para 2026

Roku está preparando una importante actualización de su interfaz principal, que promete una experiencia más personalizada y con publicidad integrada.

schedule 3 min de lectura

Últimas noticias

Ver todas

Stuntman Hollywood: regresa tras 19 años de silencio en PS5, Xbox Series y PC

La icónica saga de acción y acrobacias vehiculares vuelve de la mano de Saber Interactive, prometiendo una dosis de nostalgia y adrenalina para la nueva generación.

schedule 2 min de lectura

La sonda Maven de la NASA declarada fuera de servicio tras seis meses sin comunicación

Después de una anomalía que interrumpió su órbita y agotó sus baterías, la nave Maven, crucial para entender la atmósfera de Marte, finaliza su misión activa. Sus datos seguirán siendo un legado invaluable para la ciencia.

schedule 4 min de lectura

Windows abandona NTLM: Microsoft refuerza la seguridad con Kerberos

Microsoft está dando un paso crucial para fortalecer la seguridad en Windows 11, anunciando el abandono de NTLM, su protocolo de autenticación más antiguo, a favor de Kerberos.

schedule 3 min de lectura

Comentarios (0)

Aún no hay comentarios. ¡Sé el primero!

Temas de la nota

¿Te gustó este artículo?

Notas relacionadas

Google lanza Gemma 4 12B: IA local para tu laptop con 16GB de RAM

Nvidia desafía a Intel y AMD con el superchip RTX Spark para PC

La pantalla de inicio de Roku se renueva con IA para 2026

Últimas noticias

Stuntman Hollywood: regresa tras 19 años de silencio en PS5, Xbox Series y PC

La sonda Maven de la NASA declarada fuera de servicio tras seis meses sin comunicación

Windows abandona NTLM: Microsoft refuerza la seguridad con Kerberos

Comentarios (0)

Deja un comentario