Maniquí de origen hendido de OpenAI: GPT -OSS en Azure Ai Foundry y Windows AI Foundry

Con el impulso de los modelos GPT-ASS de OpenAI, su primer impulso de peso hendido desde GPT-2, estamos brindando a los desarrolladores y empresas la capacidad sin precedentes de ejecutar, adaptarse e implementar modelos Operai por completo en sus propios términos.

La IA ya no es una capa en la pila, se está convirtiendo en la pila. Esta nueva era requiere herramientas abiertas, adaptables y listas para ejecutar donde sea que sus ideas vivan, desde nubarrón hasta borde, desde el primer tentativa hasta la implementación subida. En Microsoft, estamos construyendo una aplicación de IA de pila completa y una taller de agentes que capacita a cada desarrollador no solo para usar IA, sino crearlo.

Esa es la visión detrás de nuestra plataforma AI que zapatilla la nubarrón a la superioridad. Azure ai fundición proporciona una plataforma unificada para construir, ajustar y desplegar agentes inteligentes con confianza mientras Foundry recinto Lleva modelos de código hendido al borde, lo que permite la inferencia flexible en el dispositivo a través de miles de millones de dispositivos. Windows AI Foundry se basamento en esta almohadilla, integrando Foundry Específico en Windows 11 para aceptar un ciclo de vida de ampliación de IA recinto seguro de descenso latencia profundamente vinculado con la plataforma Windows.

Con el impulso de Modelos GPT -ASS de OpenAI—Es el primer impulso de peso hendido desde GPT-2: estamos brindando a los desarrolladores y empresas la capacidad sin precedentes de ejecutar, adaptarse e implementar modelos Operai por completo en sus propios términos.

Por primera vez, puede ejecutar modelos Operai como GPT – OSS – 20120B en una sola GPU empresarial, o ejecutar gt -oSH‑20b en la zona. Es importante que estas no se despojan de réplicas: son rápidas, capaces y diseñadas con la implementación del mundo efectivo en mente: razonamiento a escalera en la nubarrón o tareas de agente en el borde.

Y oportuno a que son de peso hendido, estos modelos asimismo son fáciles de ajustar, destilar y optimizar. Ya sea que se esté adaptando para un copiloto específico de dominio, comprimir para inferencia fuera de sarta o crear prototipos localmente ayer de resquilar en la producción, Azure ai fundición y Foundry recinto Déle las herramientas para hacerlo todo, segura, eficientemente y sin compromiso.

Modelos abiertos, impulso efectivo

Los modelos abiertos se han mudado de los márgenes a la corriente principal. Hoy, están impulsando todo, desde agentes autónomos hasta copilotos específicos del dominio, y redefiniendo cómo se construye y despliega la IA. Y con Azure Ai Foundry, le estamos dando la infraestructura para moverse con ese impulso:

Con los pesos abiertos, los equipos pueden ajustar utilizando métodos de eficiencia de parámetros (Lora, Qlora, Peft), empalme en datos patentados y envían nuevos puntos de control en horas, no semanas.
Puede destilar o cuantificar modelos, recortar la largo del contexto o aplicar escasez estructurada para alcanzar sobres de memoria estrictos para GPU de borde e incluso computadoras portátiles de entrada matiz.
El paso completo al peso asimismo significa que puede inspeccionar los patrones de atención para auditorías de seguridad, adaptadores de dominio inyectados, capacitar a capas específicas o exportar a ONNX/Triton para inferencia contenederizada en el servicio de Azure Kubernetes (AKS) o Foundry Específico.

En extracto, los modelos abiertos no son solo reemplazos de paredes de características: son sustratos programables. Y Azure AI Foundry proporciona tuberías de capacitación, control de peso y planura posterior de descenso latencia para que pueda explotar cada una de esas palancas y empujar la pinta de la personalización de la IA.

Conocer a GPT -OSS: dos modelos, infinitas posibilidades

Hoy, GPT-OSS-120B y GPT-OSS-20B están disponibles en Azure Ai Foundry. GPT-OSS-20B asimismo está adecuado en Windows AI Foundry y pronto llegará en MacOS a través de Foundry Específico. Si estás optimizando para soberanía, rendimiento o portabilidadestos modelos desbloquean un nuevo nivel de control.

gt -oSH-120b es una potencia de razonamiento. Con 120 mil millones de parámetros y escasez arquitectónica, ofrece un rendimiento de nivel de Mini de O4 a una fracción del tamaño, sobresaliendo en tareas complejas como matemáticas, código y preguntas y respuestas específicas de dominio, pero es lo suficientemente apto como para ejecutarse en una sola GPU de clases de datos de datos. Ideal para implementaciones seguras de stop rendimiento donde la latencia o el costo importan.
gt -oSH-20b es diestro en herramientas y inconstante. Optimizado para tareas de agente como la ejecución del código y el uso de la aparejo, se ejecuta de modo apto en una matiz de hardware de Windows, incluidas las GPU discretas con 16GB+ VRAM, con soporte para más dispositivos pronto. Es valentísimo para construir asistentes autónomos o damasquinar la IA en flujos de trabajo del mundo efectivo, incluso en entornos limitados por el orgulloso de costado.

Uno y otro modelos pronto serán compatibles con la API con la API de respuestas ahora ubicuas. Eso significa que puede intercambiarlos en aplicaciones existentes con cambios mínimos y la máxima flexibilidad.

Traer GPT -OSS a Cloud and Edge

Azure Ai Foundry es más que un catálogo de modelos: es una plataforma para los constructores de IA. Con más de 11,000 modelos y crecimiento, brinda a los desarrolladores un espacio unificado para evaluar, ajustar y producir modelos con confiabilidad y seguridad de límite empresarial.

Hoy, con GPT -OSS en el catálogo, puedes:

Puntos finales de inferencia de rotación usando GPT -OSS en la nubarrón con solo unos pocos comandos CLI.
Tune y destile los modelos que usan sus propios datos e implementan con confianza.
Mezcle modelos abiertos y patentados para que coincidan con las evacuación específicas de la tarea.

Para las organizaciones que desarrollan escenarios solo posibles en dispositivos de clientes,Foundry recintotrae prominentes modelos de código hendido aWindows AI Foundry pre-optimizado para inferencia en su propio hardware, compatible con CPU, GPU y NPU, a través de una CLI, API y SDK simples.

Ya sea que esté trabajando en una configuración fuera de sarta, construyendo en una red segura o ejecutándose en el borde: el fundamento recinto y Windows Ai Foundry le permite ir completamente activo en la nubarrón. Con la capacidad de implementar GPT-OSS-20B en las PC modernas de Windows de stop rendimiento, sus datos se mantienen donde lo desea, y el poder de los modelos de clase fronteriza llega a usted.

Esta es la IA híbrida en energía: la capacidad de mezclar y combinar modelos, optimizar el rendimiento y el costo, y cumplir con sus datos donde vive.

Empoderar a los constructores y tomadores de decisiones

La disponibilidad de GPT -ASS en Azure y Windows desbloquea nuevas posibilidades poderosas tanto para constructores como para líderes empresariales.

Para los desarrolladores, los pesos abiertos significan transparencia total. Inspeccione el maniquí, personalice, ajuste y despliegue en sus propios términos. Con GPT -OSS, puede construir con confianza, comprender exactamente cómo funciona su maniquí y cómo mejorarlo para su caso de uso.

Para los tomadores de decisiones, se manejo de control y flexibilidad. Con GPT-OSS, obtiene un rendimiento competitivo, sin cajas negras, menos compensaciones y más opciones en el despliegue, el cumplimiento y el costo.

Una visión para el futuro: IA abierta y responsable, juntos

El impulso de GPT -ASS y su integración en Azure y Windows es parte de una historia más ancho. Imaginamos un futuro donde la IA es ubicua, y estamos comprometidos a ser una plataforma abierta para padecer estas tecnologías innovadoras a nuestros clientes, en todos nuestros centros y dispositivos de datos.

Al ofrecer a GPT -OSS a través de una variedad de puntos de entrada, estamos duplicando nuestro compromiso de democratizar la IA. Reconocemos que nuestros clientes se beneficiarán de una cartera diversa de modelos, propietarios y abiertos, y estamos aquí para apoyar el valía de la ruta para usted. Ya sea que esté trabajando con modelos de código hendido o de propiedad, las herramientas de seguridad incorporadas de Foundry garantizan un gobierno, cumplimiento y confianza constantes, por lo que los clientes pueden innovar con confianza en todos los tipos de modelos.

Finalmente, nuestro apoyo a GPT-OSS es solo el postrero en nuestro compromiso de desplegar herramientas y estándares. En junio anunciamos que la extensión de chat de copilot github ya es código hendido en Github Según la inmoralidad del MIT: el primer paso para hacer VS Code Un editor de AI de código hendido. Buscamos acelerar la innovación con la comunidad de código hendido y crear un veterano valía para las herramientas de desarrolladores líderes en el mercado. Así es como se ve cuando se unen la investigación, el producto y la plataforma. Los avances mismo que hemos facultado con nuestra nubarrón en OpenAI ahora son herramientas abiertas en las que cualquiera puede construir, y Azure es el puente que los da vida.

Próximos pasos y capital para navegar por GPTS

Implemente GPT -OSS en la nubarrón hoycon algunos comandos CLI usando Azure Ai Foundry. Explorar el Catálogo de modelos Azure AI para virar un punto final.
Implemente GPT-OSS-20B en su dispositivo Windows hoy (etcétera en macOS) a través de Foundry Específico. Sigue la director QuickStart para cultivarse más.
Fijación de precios¹ Para estos modelos es el subsiguiente:

Una captura de pantalla de una computadora

*Ver Página de precios de cuenta administrado aquí.

¹El precio es preciso a partir de agosto de 2025.

Etiquetado abierto, Azure, Foundry, GPT, modelo, OpenAI, origen, OSS, Windows