Athrun Data Intelligence


Imagine una plataforma donde cada desarrollador pueda desbloquear todo el espectro de la IA: texto, imágenes, audio y vídeo. En este OpenAI DevDay, Azure AI Foundry está haciendo ingenuidad esa visión. Con el tiro hoy de OpenAI GPT-image-1-mini, GPT-realtime-mini y GPT-audio-mini, encima de importantes actualizaciones de seguridad a GPT-5, ahora tiene el conjunto de herramientas definitivo para crear, observar y resquilar soluciones multimodales.

Imagine una plataforma en la que cada desarrollador, ya sea para una startup o una empresa mundial, pueda desbloquear todo el espectro de la IA: texto, imágenes, audio y vídeo. Este DevDay de OpenAI, Fundición de IA de Azure está haciendo ingenuidad esa visión. Con el tiro de hoy de OpenAI GPT-image-1-mini, GPT-realtime-mini y GPT-audio-mini, encima de importantes actualizaciones de seguridad a GPT-5, ahora tiene el conjunto de herramientas definitivo para crear, observar y resquilar soluciones multimodales, de forma más rápida y asequible que nunca. Nos complace compartir que los modelos anunciados hoy por OpenAI se implementarán ahora en Azure AI Foundry.y la mayoría de los clientes podrán comenzar el 7 de octubre de 2025.

El anuncio de hoy se suma a las principales innovaciones que anunciamos la semana pasada con el tiro de Microsoft Agent Framework (ahora en interpretación preliminar), flujos de trabajo de múltiples agentes en Foundry Agent Service en interpretación preliminar privada, observabilidad unificadadisponibilidad genérico de Voice Live API y las nuevas capacidades de IA responsable. Ámbito del agente de Microsoft (GitHub) es un SDK y un tiempo de ejecución de código rajado y de calidad comercial diseñado para simplificar la orquestación de sistemas multiagente. Unifica las bases listas para el negocio de Semantic Kernel con las capacidades multiagente de AutoGen, brindando a los desarrolladores las herramientas para crear soluciones agentes inteligentes y escalables con velocidad y confianza.

Al expandir Azure AI Foundry con los últimos modelos de OpenAI y mejorar nuestro entorno de IA agente, brindamos a los clientes opciones, flexibilidad y capacidades comerciales incomparables, lo que permite a los desarrolladores crear sistemas de agentes inteligentes que aborden deposición comerciales complejas e impulsen la innovación a escalera.

Conozca los nuevos modelos: creados para desarrolladores, listos para cualquier cosa

GPT-image-1-mini: potencia compacta para la creatividad visual

GPT-image-1-mini está diseñado específicamente para organizaciones y desarrolladores que necesitan una engendramiento de imágenes a escalera rápida y apto en medios. Su obra compacta permite la creación de texto a imagen e imagen a imagen de adhesión calidad mientras consume menos medios computacionales, lo que permite a los equipos implementar IA multimodal incluso en entornos restringidos. Su sólida obra basada en el maniquí Image-1 optimiza la coherencia y la facilidad de apadrinamiento para las organizaciones que ya aprovechan la IA multimodal en Azure AI Foundry.

¿Qué lo hace singular?

  • Coexistentes de imágenes flexible: Implementar adhesión calidad texto a imagen y imagen a imagen funciones sin exceder su presupuesto.
  • Inferencia ultrarrápida: Genere imágenes en tiempo actual, perfectamente integradas con los flujos de trabajo existentes de Azure AI Foundry.

Casos de uso:

  • Coexistentes de materiales educativos para las aulas y el formación en andana.
  • Diseño de libros de cuentos y narrativas visuales.
  • Producir activos de juegos para la creación y el explicación rápidos de prototipos.
  • Acelerar los flujos de trabajo de diseño de UI para aplicaciones y sitios web.

Tabla 1: Precios e implementación de GPT-image-1-mini en Azure AI Foundry (por cada millón de tokens)*

Tabla con información de precios.

GPT-realtime-mini y GPT-audio-mini: alternativa de voz apto y asequible

Los dos nuevos minimodelos están diseñados para organizaciones y desarrolladores que necesitan una IA multimodal rápida y rentable sin ofrendar la calidad. Estos modelos son livianos y mucho optimizados y brindan interacción de voz y engendramiento de audio en tiempo actual con requisitos mínimos de medios. Su obra optimizada permite una inferencia rápida y una disminución latencia, lo que los hace ideales para escenarios donde la velocidad y la capacidad de respuesta son fundamentales, como chatbots basados ​​en voz, traducción en tiempo actual y creación de contenido de audio dinámico. Al consumir menos medios computacionales, estos modelos ayudan a las empresas y a los equipos de desarrolladores a ceñir los costos operativos mientras escalan las capacidades multimodales en una amplia grado de aplicaciones.

¿Qué los hace especiales?

  • Capacidad de respuesta en tiempo actual: Potencie chatbots, asistentes y herramientas de traducción con una latencia casi nula.
  • Luz de medios: Ejecute modelos avanzados de voz y audio en una infraestructura mínima.
  • Escalado asequible: Reduzca sus costos operativos mientras expande las capacidades multimodales.

Casos de uso:

  • Chatbots basados ​​en voz para atención y soporte al cliente.
  • Traducción en tiempo actual para comunicación mundial.
  • Creación de contenido de audio dinámico para medios y entretenimiento.
  • Asistentes de voz interactivos para aplicaciones empresariales y de consumo.

GPT-realtime-mini en Azure AI Foundry permite a nuestros clientes crear soluciones de voz con pequeño latencia, mejor cumplimiento de las instrucciones y rentabilidad, capacidades que nuestros clientes valoran, impulsando tiempos de atención más cortos, diálogos más fluidos y una engendramiento de valencia más rápida.

Andy O’Dower, vicepresidente de producto, Twilio

Tabla 2: Precios e implementación de GPT-realtime-mini y GPT-audio-mini en Azure AI Foundry (por cada millón de tokens)*

Tabla con información de precios.

GPT-5-chat-latest: Elevando el moldura de la seguridad y el bienestar

La última aggiornamento de GPT-5-chat-latest en Azure AI Foundry presenta un conjunto más sólido de barreras de seguridad, diseñadas para proteger mejor a los usuarios durante conversaciones confidenciales. Con capacidades mejoradas de detección y respuesta, GPT-5-chat-latest ahora está equipado para indagar y administrar de guisa más efectiva el diálogo que podría provocar angustia mental o emocional. Estas mejoras reflejan nuestro compromiso continuo con la IA responsable, garantizando que cada interacción no solo sea inteligente y útil, sino incluso segura y de apoyo para los usuarios en momentos difíciles.

Tabla 3: Precios e implementación del postrer chat de GPT-5 en Azure AI Foundry (por cada millón de tokens)*

Tabla con información de precios.

GPT-5-pro: el pináculo del razonamiento y el examen

GPT-5-pro representa el pináculo del razonamiento y examen avanzados en el interior del ecosistema Azure AI Foundry, brindando inteligencia de fracción de investigación. Cuando se implementa a través de Foundry, la obra estilo torneo de GPT-5-pro aprovecha múltiples vías de razonamiento para certificar la máxima precisión y confiabilidad, lo que lo hace ideal para examen complejos, engendramiento de código y flujos de trabajo de toma de decisiones. Con Azure AI Foundry, las organizaciones desbloquean todo el potencial de GPT-5-pro, impulsando decisiones más inteligentes y acelerando la innovación en sus procesos comerciales más críticos, de forma segura y confiable.

Tabla 4: Precios e implementación de GPT-5-pro en Azure AI Foundry (por cada millón de tokens)*

Tabla con información de precios.

La delantera del desarrollador: construir, observar y cursar, más rápido

Con estos nuevos modelos, Azure AI Foundry no sólo mantiene el ritmo, sino que incluso marca el ritmo. Los desarrolladores ahora pueden ir más allá del texto y explotar la engendramiento, tirada y comprensión de imágenes y audio. ¿El resultado? Flujos de trabajo más ricos e inteligentes que impulsan la innovación en todas las industrias, desde la educación y los juegos hasta la automatización empresarial.

Un adelanto: Sora 2: engendramiento de vídeo y audio de futuro nivel

Y hay más en el horizonte. Sora 2 en Azure AI Foundry llegará pronto y brindará engendramiento vanguardia de video y audio en una única API. Imagine animaciones basadas en la física, diálogos sincronizados y funciones de cameo, todo apto para los desarrolladores a través de Azure AI Foundry. Estén atentos a la próxima ola de experiencias inmersivas y generativas.

¿Estás diligente para crear la próxima ola de experiencias multimodales inmersivas? Fundición de IA de Azure es su plataforma para todas las posibilidades.


*El precio es exacto a partir de octubre de 2025.



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *