Anuncio del maniquí más nuevo de Anthropic, Claude Opus 4.5, en Microsoft Foundry. Opus 4.5 ahora está arreglado en lectura preliminar pública en Microsoft Foundry, los planes pagos de GitHub Copilot y Microsoft Copilot Studio.
Estamos en un serio punto de inflexión en el panorama de la IA, un acceso en el que los modelos pasan de ser asistentes aperos a colaboradores genuinos. Modelos que comprenden el objetivo, tienen en cuenta las limitaciones y ejecutan flujos de trabajo complejos con múltiples herramientas. Modelos que no solo respaldan los procesos, sino que además ayudan a reestructurarlos para conquistar confiabilidad, escalera y eficiencia operativa.
El maniquí más nuevo de Anthropic, Claude Opus 4.5encarna ese cambio. Hoy, estamos emocionados de compartir eso. Opus 4.5 ya está arreglado en lectura preliminar pública en Fundición de Microsoft, Copiloto de GitHub planes pagados, y Estudio Microsoft Copiloto.
Aprovechando el anuncio de Microsoft Ignite de nuestro asociación ampliada con AnthropicMicrosoft Foundry cumple su compromiso de congratular a los clientes de Azure llegada inmediato a la más amplia selección de modelos de IA avanzados y de vanguardia de cualquier montón. Foundry permite a los desarrolladores acelerar la innovación con una plataforma de IA integrada, interoperable y segura que permite una implementación, integración y escalamiento fluidos para aplicaciones y agentes de IA.
Estamos entusiasmados de utilizar los modelos Anthropic Claude de Microsoft Foundry. Tener el razonamiento innovador de Claude inmediato con los modelos GPT en una plataforma nos brinda flexibilidad para crear flujos de trabajo escalables de nivel empresarial que van mucho más allá de los prototipos.
—Michele Catasta, presidenta, Replit
Opus 4.5 para el trabajo positivo
Obra 4.5 establece una nueva mostrador para la codificaciónflujos de trabajo agentes y productividad empresarial: superando a Sonnet 4.5 y Opus 4.1, a un precio más accesible. Su versatilidad en ingeniería de software, razonamiento difícil, uso de herramientas y visión abre nuevas oportunidades para que las organizaciones modernicen sistemas, automaticen flujos de trabajo críticos y obtengan un retorno de la inversión más rápido.
Al priorizar la rápida integración de los últimos modelos, Foundry permite a los clientes de Azure mantenerse a la vanguardia y maximizar el impacto de sus sistemas de IA agentes; todo ello manteniendo la gobernanza centralizada, la seguridad y la observabilidad a escalera.
1. Diseñado para ingeniería de producción y capacidades de agencia
Según Anthropic, Opus 4.5 ofrece un rendimiento de última coexistentes en los puntos de remisión de ingeniería de software típico de la industria, incluidos nuevos máximos en el costado SWE. (80,9%). Los primeros evaluadores describen consistentemente que el maniquí es capaz de interpretar requisitos ambiguos, razonar sobre compensaciones arquitectónicas y identificar soluciones para problemas que abarcan múltiples sistemas.
Opus 4.5 acelera la velocidad de la ingeniería al completar el trabajo de avance de varios días en horas con:
- Rendimiento de codificación multilingüe mejorado
- Gestación de código más valioso
- Maduro cobertura de pruebas
- Opciones arquitectónicas y de refactorización más limpias
| Capacidad / Punto de remisión | Claude Opus 4.5 | Soneto de Claudio 4.5 | Claude Opus 4.1 | Géminis 3 Pro |
| Codificación agente (verificada por SWE-bench) | 80,90% | 77,20% | 74,50% | 76,20% |
| Codificación de terminal agente (Terminal-bench 2.0) | 59,30% | 50,00% | 46,50% | 54,20% |
| Uso de herramientas agentes: comercio minorista (t2-bench) | 88,90% | 86,20% | 86,80% | 85,30% |
| Uso de herramientas agentes — Telecom (t2-bench) | 98,20% | 98,00% | 71,50% | 98,00% |
| Uso de herramientas a escalera (MCP Atlas) | 62,30% | 43,80% | 40,90% | _ |
| Uso de la computadora (OSWorld) | 66,30% | 61,40% | 44,40% | _ |
| Resolución de problemas novedosos (verificado ARC-AGI-2) | 37,60% | 13,60% | _ | 31,10% |
| Razonamiento a nivel de posgrado (GPQA Diamond) | 87,00% | 83,40% | 81,00% | 91,90% |
| Razonamiento visual (energía MMMU) | 80,70% | 77,80% | 77,10% | _ |
| Preguntas y respuestas multilingües (MMLU) | 90,80% | 89,10% | 89,50% | 91,80% |
Resultados comparativos de Claude Opus 4.5 de Anthropic
Opus 4.5 es además uno de los Modelos de uso de herramientas más potentes disponibles en la ahora.capaz de impulsar agentes que funcionan sin problemas en cientos de herramientas. Los desarrolladores obtienen llegada a varias actualizaciones importantes:
- Señal a herramientas programáticas: Ejecute herramientas directamente en Python para conquistar flujos de trabajo más eficientes y deterministas.
- Búsqueda de herramientas: Descubra dinámicamente herramientas de bibliotecas grandes sin utilizar espacio en la ventana contextual.
- Ejemplos de uso de herramientas: Útil más precisa que requiere esquemas de herramientas complejos.
Juntas, estas capacidades habilitan agentes sofisticados en ciberseguridad, ingeniería de software de pila completa, modelos financieros y otros flujos de trabajo que requieren múltiples interacciones de herramientas. Opus 4.5 muestra una inteligencia sólida del mundo positivo aplicando estas herramientas de forma creativa en el interior de limitaciones. En las pruebas, el maniquí navegó con éxito en entornos de políticas complejos, como reglas de cambio de aerolíneas, encadenamiento de mejoras, degradaciones, cancelaciones y cambios de reservas para optimizar los resultados. Este tipo de resolución de problemas adaptativa y consciente de las limitaciones refleja un importante paso delante en lo que los sistemas de IA agentes pueden conquistar.
Manus utiliza profundamente los modelos Claude de Anthropic correcto a sus sólidas capacidades en codificación y planificación de tareas a dispendioso plazo, inmediato con su destreza para manejar tareas de agencia. Somos ¡Estoy muy emocionado de usarlos ahora en Microsoft Foundry!
—Tao Zhang, cofundador y director de productos, Manus AI
2. Experiencia de desarrollador mejorada en Foundry
Opus 4.5, inmediato con las nuevas capacidades de desarrollador ofrecidas en Foundry, está diseñado para ayudar a los equipos a crear sistemas agentes más efectivos y eficientes:
- Parámetro de esfuerzo (Beta): controle cuánto esfuerzo computacional asigna Claude entre el pensamiento, las llamadas a herramientas y las respuestas para equilibrar el rendimiento con la latencia y el costo para sus casos de uso específicos.
- Control de compactación: Maneje tareas agentes de larga duración de forma más efectiva con los nuevos asistentes de SDK que administran el contexto de forma valioso en interacciones extendidas.
Estas mejoras proporcionan decano previsibilidad y control activo para las cargas de trabajo empresariales.
3. Mejoramiento de la productividad de la oficina y el uso de la computadora
Opus 4.5 además se duplica como el mejor maniquí de visión de Anthropic, desbloqueando flujos de trabajo que dependen de una interpretación visual compleja y una navegación de varios pasos. El rendimiento del uso de la computadora ha mejorado significativamente, lo que permite una automatización más confiable de las tareas de escritorio.
Para los trabajadores del conocimiento, el maniquí ofrece una alternativa paso a paso.Mejoramiento del cambio en la potenciación de agentes que crean hojas de cálculo, presentaciones y documentos. Produce un trabajo con coherencia, pulido profesional y un conocimiento verdadero del dominio, lo que lo hace adecuado para las finanzas, el derecho y otras verticales críticas de precisión. El maniquí aprovecha mejor la memoria para permanecer el contexto y la coherencia entre archivos a lo dispendioso de proyectos profesionales en expansión.
4. Seguridad y protección
Según Anthropic, Opus 4.5 además ofrece mejoras significativas en seguridad. El maniquí muestra una tasa limitada de respuestas desalineadas, una decano solidez contra los ataques de inyección rápida y un comportamiento más confiable en tareas complejas.
Estas mejoras se alinean con el compromiso de Microsoft de congratular a los clientes empresariales modelos que cumplan con altos estándares de seguridad, gobernanza e integridad operativa.
Casos de uso
Opus 4.5 sirve para los siguientes casos de uso
- avance de software: Implemente agentes que manejen tareas complejas de avance de múltiples sistemas con una supervisión mínima.
- Descomposición financiero: conecte conocimientos a través de presentaciones regulatorias, informes de mercado y datos internos para un modelado predictivo sofisticado y un monitoreo proactivo del cumplimiento.
- Ciberseguridad: correlacione registros, bases de datos de vulnerabilidades e inteligencia sobre amenazas para una detección de amenazas de nivel profesional y una respuesta automatizada a incidentes.
- Operaciones empresariales: Administre flujos de trabajo sofisticados que requieren coordinación entre múltiples herramientas, sistemas y fuentes de información.
Precios y disponibilidad
Obra 4.5 ofrece un rendimiento de vanguardia y establece un nuevo típico para una variedad de casos de uso a la vez un tercio del precio de los modelos anteriores de la clase Opus.
|
Maniquí |
Tipo de propuesta |
Tipo de implementación |
Regiones |
Precio (1 millón de tokens) |
Disponibilidad |
|
Claude Opus 4.5 |
Plazo sin servidor |
Standard mundial |
Este US2, Suecia Central |
Entrada- $5 Salida- $25 |
24 de noviembre de 2025 (perspicacia previa pública) |
Comience hoy
Claude Opus 4.5 ya está arreglado en Fundición de Microsoft y próximamente en Visual Studio Code a través de Ampliación de fundición. Visite el portal de Foundry para comenzar a construir con Opus 4.5.