Llega Claude Opus 4.8: mejor en código, más honesto y con sub-agentes en paralelo

Thu, 28 May 2026 00:00:00 +0200

Anthropic ha presentado esta tarde Claude Opus 4.8, su modelo más capaz en producción. Llega menos de dos meses después de Opus 4.7 y, lo más llamativo, sin subir el precio: cuesta lo mismo que la versión anterior.

Las mejoras en números

Los benchmarks publicados por Anthropic comparan directamente con Opus 4.7:

Coding agéntico: 64,3% → 69,2% — Tareas largas donde el modelo encadena llamadas a herramientas, lee archivos, corre tests y se autocorrige.
Razonamiento multidisciplinar con herramientas: 54,7% → 57,9% — Problemas que requieren saltar entre dominios y usar el contexto de tools externas.
Trabajo de conocimiento: 1753 → 1890 — Métrica interna de Anthropic para tareas tipo análisis, redacción y síntesis.

Según los datos compartidos por Anthropic, Opus 4.8 supera a GPT-5.5 y Gemini 3.1 Pro en varios de estos benchmarks. En el Super-Agent benchmark interno, es el único modelo que completa todos los casos de principio a fin.

Gemini 3.5 Flash: velocidad antes que inteligencia en agentes de IA

Fri, 22 May 2026 00:00:00 +0200

Google presentó Gemini 3.5 Flash en el I/O del 19 de mayo. Rápido, barato, optimizado para agentes. Buenas noticias para desarrolladores. Pero lo más interesante no es lo que hace para Google, sino para quién más lo va a usar.

Apple tiene un acuerdo plurianual con Google para integrar modelos Gemini en Apple Intelligence. La WWDC 2026 es el 8 de junio. Todo apunta a que la nueva Siri —esa que llevan años prometiendo y nunca acaba de llegar— va a correr, al menos en parte, sobre este mismo modelo.

Agentes on Blog de Sergio Comerón

Llega Claude Opus 4.8: mejor en código, más honesto y con sub-agentes en paralelo

Las mejoras en números

Gemini 3.5 Flash: velocidad antes que inteligencia en agentes de IA