<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Anthropic on Blog de Sergio Comerón</title>
    <link>https://sergiocomeron.com/blog/tags/anthropic/</link>
    <description>Recent content in Anthropic on Blog de Sergio Comerón</description>
    <generator>Hugo</generator>
    <language>es</language>
    <lastBuildDate>Thu, 28 May 2026 00:00:00 +0200</lastBuildDate>
    <atom:link href="https://sergiocomeron.com/blog/tags/anthropic/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Llega Claude Opus 4.8: mejor en código, más honesto y con sub-agentes en paralelo</title>
      <link>https://sergiocomeron.com/blog/posts/claude-opus-4-8/</link>
      <pubDate>Thu, 28 May 2026 00:00:00 +0200</pubDate>
      <guid>https://sergiocomeron.com/blog/posts/claude-opus-4-8/</guid>
      <description>&lt;p&gt;Anthropic ha presentado esta tarde Claude Opus 4.8, su modelo más capaz en producción. Llega menos de dos meses después de Opus 4.7 y, lo más llamativo, sin subir el precio: cuesta lo mismo que la versión anterior.&lt;/p&gt;&#xA;&lt;h2 id=&#34;las-mejoras-en-números&#34;&gt;Las mejoras en números&lt;/h2&gt;&#xA;&lt;p&gt;Los benchmarks publicados por Anthropic comparan directamente con Opus 4.7:&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;Coding agéntico&lt;/strong&gt;: 64,3% → &lt;strong&gt;69,2%&lt;/strong&gt; — Tareas largas donde el modelo encadena llamadas a herramientas, lee archivos, corre tests y se autocorrige.&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Razonamiento multidisciplinar con herramientas&lt;/strong&gt;: 54,7% → &lt;strong&gt;57,9%&lt;/strong&gt; — Problemas que requieren saltar entre dominios y usar el contexto de tools externas.&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Trabajo de conocimiento&lt;/strong&gt;: 1753 → &lt;strong&gt;1890&lt;/strong&gt; — Métrica interna de Anthropic para tareas tipo análisis, redacción y síntesis.&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Según los datos compartidos por Anthropic, Opus 4.8 supera a GPT-5.5 y Gemini 3.1 Pro en varios de estos benchmarks. En el Super-Agent benchmark interno, es el único modelo que completa todos los casos de principio a fin.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
