<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Agentes on Blog de Sergio Comerón</title>
    <link>https://sergiocomeron.com/blog/tags/agentes/</link>
    <description>Recent content in Agentes on Blog de Sergio Comerón</description>
    <generator>Hugo</generator>
    <language>es</language>
    <lastBuildDate>Thu, 28 May 2026 00:00:00 +0200</lastBuildDate>
    <atom:link href="https://sergiocomeron.com/blog/tags/agentes/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Llega Claude Opus 4.8: mejor en código, más honesto y con sub-agentes en paralelo</title>
      <link>https://sergiocomeron.com/blog/posts/claude-opus-4-8/</link>
      <pubDate>Thu, 28 May 2026 00:00:00 +0200</pubDate>
      <guid>https://sergiocomeron.com/blog/posts/claude-opus-4-8/</guid>
      <description>&lt;p&gt;Anthropic ha presentado esta tarde Claude Opus 4.8, su modelo más capaz en producción. Llega menos de dos meses después de Opus 4.7 y, lo más llamativo, sin subir el precio: cuesta lo mismo que la versión anterior.&lt;/p&gt;&#xA;&lt;h2 id=&#34;las-mejoras-en-números&#34;&gt;Las mejoras en números&lt;/h2&gt;&#xA;&lt;p&gt;Los benchmarks publicados por Anthropic comparan directamente con Opus 4.7:&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;Coding agéntico&lt;/strong&gt;: 64,3% → &lt;strong&gt;69,2%&lt;/strong&gt; — Tareas largas donde el modelo encadena llamadas a herramientas, lee archivos, corre tests y se autocorrige.&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Razonamiento multidisciplinar con herramientas&lt;/strong&gt;: 54,7% → &lt;strong&gt;57,9%&lt;/strong&gt; — Problemas que requieren saltar entre dominios y usar el contexto de tools externas.&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Trabajo de conocimiento&lt;/strong&gt;: 1753 → &lt;strong&gt;1890&lt;/strong&gt; — Métrica interna de Anthropic para tareas tipo análisis, redacción y síntesis.&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Según los datos compartidos por Anthropic, Opus 4.8 supera a GPT-5.5 y Gemini 3.1 Pro en varios de estos benchmarks. En el Super-Agent benchmark interno, es el único modelo que completa todos los casos de principio a fin.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Gemini 3.5 Flash: velocidad antes que inteligencia en agentes de IA</title>
      <link>https://sergiocomeron.com/blog/posts/gemini-35-flash/</link>
      <pubDate>Fri, 22 May 2026 00:00:00 +0200</pubDate>
      <guid>https://sergiocomeron.com/blog/posts/gemini-35-flash/</guid>
      <description>&lt;p&gt;Google presentó Gemini 3.5 Flash en el I/O del 19 de mayo. Rápido, barato, optimizado para agentes. Buenas noticias para desarrolladores. Pero lo más interesante no es lo que hace para Google, sino para quién más lo va a usar.&lt;/p&gt;&#xA;&lt;p&gt;Apple tiene un acuerdo plurianual con Google para integrar modelos Gemini en Apple Intelligence. La WWDC 2026 es el 8 de junio. Todo apunta a que la nueva Siri —esa que llevan años prometiendo y nunca acaba de llegar— va a correr, al menos en parte, sobre este mismo modelo.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
