Anthropic lanza Claude Sonnet 4.5

Anthropic acaba de lanzar Claude Sonnet 4.5, y no es exageración decir que estamos ante el mejor modelo de programación del mundo. Esta nueva versión representa un salto cuántico en capacidades de razonamiento, matemáticas y, lo más importante, en la construcción de agentes complejos. Si el código es el lenguaje que impulsa cada aplicación, hoja de cálculo y herramienta de software que usas, ahora Claude Sonnet 4.5 hace posible dominar ese lenguaje como nunca antes.

La compañía no solo ha lanzado el modelo, sino toda una suite de mejoras importantes para sus productos. En Claude Code han añadido puntos de control —una de las funciones más solicitadas— que guardan tu progreso y permiten retroceder instantáneamente a un estado anterior. También han renovado la interfaz de terminal y lanzado una extensión nativa para VS Code. Las aplicaciones de Claude ahora incluyen ejecución de código y creación de archivos (hojas de cálculo, presentaciones y documentos) directamente dentro de la conversación.

Pero lo realmente revolucionario es que Anthropic está dando a los desarrolladores los mismos bloques de construcción que usan internamente. Lo llaman el Claude Agent SDK, la infraestructura que impulsa sus productos de vanguardia y que ahora está disponible para que cualquiera pueda construir agentes igual de capaces. Después de más de seis meses enviando actualizaciones a Claude Code, saben exactamente lo que se necesita para diseñar y construir agentes de IA efectivos.

En cuanto al rendimiento, las cifras hablan por sí solas: Claude Sonnet 4.5 es estado del arte en la evaluación SWE-bench Verified, que mide habilidades reales de programación de software. Prácticamente, han observado que mantiene el enfoque durante más de 30 horas en tareas complejas de múltiples pasos. En OSWorld, un benchmark que prueba modelos de IA en tareas informáticas del mundo real, Sonnet 4.5 ahora lidera con un 61.4% —un salto masivo desde el 42.2% que tenía Sonnet 4 hace apenas cuatro meses.

Expertos en finanzas, derecho, medicina y STEM encontraron que Sonnet 4.5 muestra conocimientos específicos de dominio y razonamiento dramáticamente mejores comparedo con modelos anteriores, incluido Opus 4.1. Las experiencias de clientes iniciales son igualmente impresionantes: desde reducir el tiempo promedio de ingreso de vulnerabilidades en un 44% mientras mejora la precisión en un 25%, hasta manejar más de 30 horas de programación autónoma.

Algunos de los números clave de Claude Sonnet 4.5 — Claude 4.5 Sonnet demuestra considerables mejoras en comparación con los modelos anteriores de Anthropic. Programación, uso del terminal, modo agente, matemáticas y comprensión del lenguaje natural.

Y aquí viene lo mejor: Claude Sonnet 4.5 es el modelo frontera más alineado que ha lanzado Anthropic, mostrando grandes mejoras en varias áreas de alineación comparedo con modelos Claude anteriores. La compañía ha reducido comportamientos preocupantes como la sicofancia, el engaño, la búsqueda de poder y la tendencia a fomentar pensamientos delirantes.

El modelo está disponible en todas partes hoy mismo. Si eres desarrollador, simplemente usa claude-sonnet-4-5 a través de la API de Claude, y el precio sigue siendo el mismo que Claude Sonnet 4: $3/$15 por millón de tokens. Además, hay una vista previa de investigación temporal llamada “Imagine with Claude” donde el genera software sobre la marcha, sin funcionalidad predeterminada ni código preescrito.

Más información | Anthropic