Anthropic lanza Claude Opus 4.5: El primer modelo de IA que supera el 80% en el benchmark de programación, rendimiento superior al humano y precio reducido en un 67%
Resumen de Noticias
Anthropic lanzó oficialmente su último modelo insignia de IA, Claude Opus 4.5, el 24 de noviembre de 2025. Este modelo logra avances revolucionarios en desarrollo de software, capacidad de razonamiento y procesamiento de tareas complejas de múltiples pasos. Actualmente está disponible para los usuarios a través de la aplicación Claude, su API y las tres principales plataformas de la nube. Esta es la tercera gran versión de modelo de Anthropic en dos meses, después del lanzamiento de Sonnet 4.5 en septiembre y Haiku 4.5 en octubre, lo que marca la entrada de la competencia en la industria de la IA en una fase de intensa ebullición.
El cambio más significativo de Claude Opus 4.5 es una reducción drástica de precios. Su precio se ha fijado en 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, lo que representa una disminución del 67% en comparación con los 15/75 dólares de su predecesor, Opus 4.1, haciendo que las capacidades de IA de primer nivel sean más accesibles. Esta estrategia de precios lo hace más atractivo en la competencia con GPT-5.1 de OpenAI (1.25/10 dólares) y Gemini 3 Pro de Google (2/12 dólares).
En términos de rendimiento, Claude Opus 4.5 alcanzó una precisión del 80.9% en el benchmark SWE-bench Verified, convirtiéndose en el primer modelo en superar la marca del 80%. Superó a GPT-5.1-Codex-Max de OpenAI (77.9%) y Gemini 3 Pro de Google (76.2%). Este benchmark evalúa específicamente el rendimiento de los sistemas de IA en tareas reales de ingeniería de software, y el resultado de Claude Opus 4.5 representa un nuevo punto de referencia en la industria.
Aún más impresionante, Anthropic probó Opus 4.5 utilizando el examen técnico real que la compañía emplea para contratar ingenieros de rendimiento, y el modelo superó la puntuación más alta histórica de todos los candidatos humanos. Este resultado ha provocado un debate profundo en la industria sobre cómo la tecnología de IA podría remodelar las profesiones de cuello blanco.
A nivel técnico, Claude Opus 4.5 está equipado con una ventana de contexto de 200,000 tokens y un límite de salida de 64,000 tokens, con su fecha de corte de conocimiento actualizada a marzo de 2025. El modelo ha experimentado mejoras significativas en la gestión de memoria, optimizado específicamente para operaciones de contexto largo, lo que le permite recordar detalles clave de manera más inteligente. Estas mejoras lo hacen particularmente adecuado para actuar como un agente principal que coordina el trabajo colaborativo de múltiples subagentes Haiku.
En aplicaciones prácticas, los primeros probadores informaron que Opus 4.5 puede manejar tareas que Sonnet 4.5 apenas podía completar, encontrando soluciones a problemas complejos de múltiples sistemas sin necesidad de una guía paso a paso. El reconocido desarrollador Simon Willison utilizó Claude Code durante un fin de semana de pruebas para completar una refactorización a gran escala de sqlite-utils, realizando 20 commits en dos días, que involucraron 39 archivos, 2022 líneas de código añadidas y 1173 líneas eliminadas.
En cuanto a la seguridad, Anthropic afirma que Opus 4.5 es el modelo más robusto en alineación hasta la fecha, logrando avances significativos en la defensa contra ataques de inyección de prompts, siendo más difícil de engañar que cualquier otro modelo de vanguardia en la industria. Esto es particularmente importante para los clientes empresariales que utilizan Claude para tareas críticas.
Simultáneamente con el lanzamiento del modelo, Anthropic introdujo una serie de actualizaciones de productos: la extensión Claude para Chrome ya está disponible para todos los usuarios Max, y Claude para Excel se lanzó oficialmente para usuarios Max, Team y Enterprise, con soporte para tablas dinámicas, gráficos y carga de archivos. La aplicación de escritorio Claude Code también se lanzó oficialmente, compatible con las plataformas Windows, macOS y Windows (Arm 64), permitiendo a los desarrolladores ejecutar múltiples sesiones de codificación o investigación en paralelo.
Cabe destacar que Anthropic ha ajustado los límites de uso, permitiendo a los usuarios con acceso a Opus 4.5 utilizar el modelo a un nivel similar al de la capa Sonnet anterior. Esto significa que los usuarios no tendrán que preocuparse por demasiadas restricciones en su trabajo diario.
En cuanto al panorama competitivo del mercado, Microsoft y Nvidia anunciaron la semana pasada inversiones multimillonarias en Anthropic, elevando la valoración de este laboratorio de IA a aproximadamente 350 mil millones de dólares. Anthropic logró unos ingresos anualizados de 2 mil millones de dólares en el primer trimestre de 2025, duplicando los mil millones de dólares del trimestre anterior, y el número de clientes con un gasto anual superior a 100,000 dólares se multiplicó por ocho interanualmente.
El lanzamiento de Claude Opus 4.5 llega en un momento de intensa competencia en la industria de la IA. OpenAI lanzó GPT-5.1 el 12 de noviembre, Google presentó Gemini 3 el 18 de noviembre, y ahora Anthropic responde al mercado con Opus 4.5. Scott White, jefe de producto de Anthropic, declaró: "Estoy increíblemente emocionado por la cantidad de productos que estamos lanzando al mercado y el ciclo de retroalimentación que esto genera".
En cuanto al público objetivo, White señaló que los usuarios ideales de Opus 4.5 son desarrolladores de software profesionales y trabajadores del conocimiento, como analistas financieros, consultores y contadores, así como aquellos que buscan impulsar la creatividad y construir cosas nuevas.
Los desarrolladores pueden invocar Claude Opus 4.5 utilizando la cadena de modelo "claude-opus-4-5-20251101" a través de la API, y también pueden beneficiarse de un ahorro del 90% en costos con el almacenamiento en caché de prompts y un ahorro del 50% con el procesamiento por lotes. El modelo ya está disponible en plataformas como Amazon Bedrock, Vertex AI de Google Cloud y Microsoft Foundry.
Anthropic enfatiza que Opus 4.5 es un modelo avanzado diseñado para "casos de uso sin precedentes", especialmente adecuado para ingeniería de software profesional, flujos de trabajo de agentes complejos y tareas empresariales de alto riesgo. Su capacidad de razonamiento híbrido permite una conmutación flexible entre respuestas instantáneas o pensamiento extendido, y los usuarios de la API pueden ajustar finamente el esfuerzo general que el modelo dedica a una respuesta, equilibrando rendimiento, latencia y costo.
Los comentarios de los socios de la industria también confirman las potentes capacidades de Opus 4.5. Lovable afirma que el modelo ofrece capacidades de razonamiento de vanguardia en su modo de chat, el razonamiento profundo ha cambiado la forma de planificar, y una excelente planificación conduce a una mejor generación de código. Warp informó que en las pruebas de Terminal Bench, Opus 4.5 mostró una mejora del 15% sobre Sonnet 4.5, lo cual es particularmente evidente en el uso del Modo de Planificación. Nico Christie, cofundador de la empresa de modelado financiero Fundamental Research Labs, declaró que en las evaluaciones internas, la precisión aumentó un 20% y la eficiencia un 15%, y que tareas complejas que antes parecían inalcanzables ahora son factibles.
El lanzamiento de Claude Opus 4.5 no solo representa un nuevo avance en la destreza tecnológica de Anthropic, sino que también presagia la evolución de los asistentes de IA de simples herramientas de preguntas y respuestas a sistemas inteligentes capaces de completar de forma independiente tareas profesionales complejas. Con la drástica reducción de precios y la mejora significativa de las capacidades, se espera que la aplicación comercial de la tecnología de IA se acelere aún más, trayendo consigo profundas transformaciones a todas las industrias.