Anthropic lanza Claude Sonnet 4.5
4.5 es una mejora sobre Claude Sonnet 4, con mejores capacidades de razonamiento, matemáticas y construcción de agentes complejos
La compañía no solo ha lanzado el modelo, sino toda una suite de mejoras importantes para sus productos. En Claude Code han añadido puntos de control —una de las funciones más solicitadas— que guardan tu progreso y permiten retroceder instantáneamente a un estado anterior. También han renovado la interfaz de terminal y lanzado una extensión nativa para VS Code. Las aplicaciones de Claude ahora incluyen ejecución de código y creación de archivos (hojas de cálculo, presentaciones y documentos) directamente dentro de la conversación.
Pero lo realmente revolucionario es que Anthropic está dando a los desarrolladores los mismos bloques de construcción que usan internamente. Lo llaman el Claude Agent SDK, la infraestructura que impulsa sus productos de vanguardia y que ahora está disponible para que cualquiera pueda construir agentes igual de capaces. Después de más de seis meses enviando actualizaciones a Claude Code, saben exactamente lo que se necesita para diseñar y construir agentes de IA efectivos.
En cuanto al rendimiento, las cifras hablan por sí solas: Claude Sonnet 4.5 es estado del arte en la evaluación SWE-bench Verified, que mide habilidades reales de programación de software. Prácticamente, han observado que mantiene el enfoque durante más de 30 horas en tareas complejas de múltiples pasos. En OSWorld, un benchmark que prueba modelos de IA en tareas informáticas del mundo real, Sonnet 4.5 ahora lidera con un 61.4% —un salto masivo desde el 42.2% que tenía Sonnet 4 hace apenas cuatro meses.
Expertos en finanzas, derecho, medicina y STEM encontraron que Sonnet 4.5 muestra conocimientos específicos de dominio y razonamiento dramáticamente mejores comparedo con modelos anteriores, incluido Opus 4.1. Las experiencias de clientes iniciales son igualmente impresionantes: desde reducir el tiempo promedio de ingreso de vulnerabilidades en un 44% mientras mejora la precisión en un 25%, hasta manejar más de 30 horas de programación autónoma.
Y aquí viene lo mejor: Claude Sonnet 4.5 es el modelo frontera más alineado que ha lanzado Anthropic, mostrando grandes mejoras en varias áreas de alineación comparedo con modelos Claude anteriores. La compañía ha reducido comportamientos preocupantes como la sicofancia, el engaño, la búsqueda de poder y la tendencia a fomentar pensamientos delirantes.
El modelo está disponible en todas partes hoy mismo. Si eres desarrollador, simplemente usa claude-sonnet-4-5
a través de la API de Claude, y el precio sigue siendo el mismo que Claude Sonnet 4: $3/$15 por millón de tokens. Además, hay una vista previa de investigación temporal llamada “Imagine with Claude” donde el genera software sobre la marcha, sin funcionalidad predeterminada ni código preescrito.
Más información | Anthropic
Continúa Leyendo

Windows ML: Potenciando desarrolladores para utilizar IA local en dispositivos Windows
Microsoft recientemente anunció que están reimaginando lo que hoy es posible para IA, trayendo …

Gemini AI en Chrome ahora es gratis para todos
¡Buenas noticias para todos los usuarios de Chrome! (O malas, si crees que AI ya ha llegado a …