Claude Opus 4.8 de Anthropic mejora la "honestidad" y reduce errores en código
El nuevo modelo de inteligencia artificial de Anthropic, Claude Opus 4.8, se lanza este jueves con un enfoque en la transparencia y la reducción de fallas, ofreciendo a los usuarios mayor control sobre el esfuerzo computacional.

Si usás inteligencia artificial para programar, esta noticia te interesa directamente. Anthropic está lanzando Claude Opus 4.8 este jueves, un modelo que la compañía destaca por su “honestidad”, prometiendo una reducción significativa en la propensión a errores en el código que genera.
Según Anthropic, sus modelos se entrenan para ser “honestos”, lo que implica evitar afirmaciones que no puedan sustentar. Esto es crucial, ya que un problema general en los modelos de IA es su tendencia a sacar conclusiones apresuradas, presentando su trabajo con confianza a pesar de tener evidencia escasa.
Los primeros testers de Opus 4.8 han notado que el modelo es más propenso a señalar incertidumbres sobre su trabajo y menos dado a hacer afirmaciones sin respaldo. Esta capacidad de autocrítica representa un avance importante en la fiabilidad de las herramientas de IA.
En las evaluaciones internas de la compañía, Opus 4.8 es aproximadamente 4 veces menos propenso que su predecesor a dejar pasar desapercibidas fallas en el código que genera.
Esta mejora es particularmente relevante para desarrolladores. Un modelo que detecta sus propios errores en el código no solo ahorra tiempo de depuración, sino que también aumenta la confianza en las soluciones generadas por la IA. Es un paso adelante hacia asistentes de programación más confiables y eficientes.
Además de estas mejoras en la “honestidad”, Claude Opus 4.8 introduce una función que permite a los usuarios dirigir la cantidad de esfuerzo que el modelo dedica a una tarea. Esto significa que podés elegir entre respuestas de mayor o menor esfuerzo.
Las respuestas de mayor esfuerzo consumirán más tokens, lo que resulta útil para tareas complejas que requieren máxima precisión. Por otro lado, las respuestas de menor esfuerzo son ideales si querés conservar tus límites de uso y necesitás una solución más rápida sin tanta profundidad.
Anthropic también está presentando una característica llamada “dynamic workflows” (flujos de trabajo dinámicos) en una vista previa de investigación. Esta funcionalidad permitirá a Claude abordar tareas aún más grandes y complejas de forma autónoma.
Con los flujos de trabajo dinámicos, Claude puede planificar el trabajo y luego ejecutar cientos de subagentes paralelos en una única sesión. Lo más interesante es que, con Opus 4.8, estos agentes pueden operar por períodos más largos, y el sistema verifica sus resultados antes de reportar la información final al usuario. ¿Qué implicaciones tendrá esta capacidad de orquestación para proyectos de gran escala?
Temas de la nota
Notas relacionadas

Google lanza Gemma 4 12B: IA local para tu laptop con 16GB de RAM
El nuevo modelo de inteligencia artificial de Google busca democratizar el acceso a la IA generativa, permitiendo su ejecución en computadoras de consumo promedio.

Nvidia desafía a Intel y AMD con el superchip RTX Spark para PC
Nvidia presentó RTX Spark, un procesador que promete llevar la inteligencia artificial avanzada directamente a tu PC, sin depender de la nube, y potenciar el gaming a niveles nunca vistos en equipos convencionales.

La pantalla de inicio de Roku se renueva con IA para 2026
Roku está preparando una importante actualización de su interfaz principal, que promete una experiencia más personalizada y con publicidad integrada.
Últimas noticias
Ver todas
Stuntman Hollywood: regresa tras 19 años de silencio en PS5, Xbox Series y PC
La icónica saga de acción y acrobacias vehiculares vuelve de la mano de Saber Interactive, prometiendo una dosis de nostalgia y adrenalina para la nueva generación.

La sonda Maven de la NASA declarada fuera de servicio tras seis meses sin comunicación
Después de una anomalía que interrumpió su órbita y agotó sus baterías, la nave Maven, crucial para entender la atmósfera de Marte, finaliza su misión activa. Sus datos seguirán siendo un legado invaluable para la ciencia.

Windows abandona NTLM: Microsoft refuerza la seguridad con Kerberos
Microsoft está dando un paso crucial para fortalecer la seguridad en Windows 11, anunciando el abandono de NTLM, su protocolo de autenticación más antiguo, a favor de Kerberos.
Comentarios (0)
Aún no hay comentarios. ¡Sé el primero!
Deja un comentario