Llega Claude Opus 4.8: mejor en código, más honesto y con sub-agentes en paralelo

Thu, 28 May 2026 00:00:00 +0200

Anthropic ha presentado esta tarde Claude Opus 4.8, su modelo más capaz en producción. Llega menos de dos meses después de Opus 4.7 y, lo más llamativo, sin subir el precio: cuesta lo mismo que la versión anterior.

Las mejoras en números

Los benchmarks publicados por Anthropic comparan directamente con Opus 4.7:

Coding agéntico: 64,3% → 69,2% — Tareas largas donde el modelo encadena llamadas a herramientas, lee archivos, corre tests y se autocorrige.
Razonamiento multidisciplinar con herramientas: 54,7% → 57,9% — Problemas que requieren saltar entre dominios y usar el contexto de tools externas.
Trabajo de conocimiento: 1753 → 1890 — Métrica interna de Anthropic para tareas tipo análisis, redacción y síntesis.

Según los datos compartidos por Anthropic, Opus 4.8 supera a GPT-5.5 y Gemini 3.1 Pro en varios de estos benchmarks. En el Super-Agent benchmark interno, es el único modelo que completa todos los casos de principio a fin.

Anthropic on Blog de Sergio Comerón

Llega Claude Opus 4.8: mejor en código, más honesto y con sub-agentes en paralelo

Las mejoras en números