Acelere la escalera con la proposición de Azure OpenAI Service Provisioned

Con las nuevas mejoras en la proposición Azure OpenAI Service Provisioned, estamos dando un gran paso delante para hacer que la IA sea accesible y esté registro para la empresa.

En el panorama digital coetáneo en rápida transformación, las empresas necesitan poco más que potentes modelos de IA: necesitan soluciones de IA que sean adaptables, confiables y escalables. Con la próxima disponibilidad de zonas de datos y nuevas mejoras en la proposición aprovisionada en Servicio Azure OpenAIestamos dando un gran paso delante para que la IA esté ampliamente arreglado y incluso preparada para las empresas. Estas características representan un cambio fundamental en la forma en que las organizaciones pueden implementar, dirigir y optimizar modelos de IA generativa.

Con el propagación de Azure OpenAI Service Data Zones en la Unión Europea y Estados Unidos, las empresas ahora pueden ascender sus cargas de trabajo de IA con aún decano facilidad y al mismo tiempo apoyar el cumplimiento de los requisitos regionales de residencia de datos. Históricamente, las variaciones en la disponibilidad de la región maniquí obligaban a los clientes a gobernar múltiples bienes, lo que a menudo ralentizaba el expansión y complicaba las operaciones. Las zonas de datos del servicio Azure OpenAI pueden eliminar esa fricción al ofrecer un procesamiento de datos multirregional flexible y al mismo tiempo respaldar que los datos se procesen y almacenen en el interior del divisoria de datos seleccionado.

Se proxenetismo de una conquista en materia de cumplimiento que incluso permite a las empresas ascender sin problemas sus operaciones de IA en todas las regiones, optimizando tanto el rendimiento como la confiabilidad sin tener que navegar por las complejidades de gobernar el tráfico en sistemas dispares.

Leya, una startup tecnológica que crea una plataforma genAI para profesionales legales, ha estado explorando la opción de implementación de Data Zones.

“La opción de implementación Azure OpenAI Service Data Zones ofrece a Leya una forma rentable de ascender de forma segura aplicaciones de IA a miles de abogados, garantizando el cumplimiento y el mayor rendimiento. Nos ayuda a alcanzar una mejor calidad y control del cliente, con entrada rápido a las últimas innovaciones de Azure OpenAI.“—Sigge Calado, CTO, Leya

Las zonas de datos estarán disponibles para las ofertas Tipificado (PayGo) y Provisionada a partir de esta semana el 1 de noviembre de 2024.

interfaz gráfica de usuario, texto, aplicación, chat o mensaje de texto

Rendimiento líder en la industria

Las empresas dependen de la previsibilidad, especialmente cuando implementan aplicaciones de representación crítica. Es por eso que presentamos un acuerdo de nivel de servicio de latencia del 99 % para la reproducción de tokens. Este SLA de latencia garantiza que los tokens se generen a velocidades más rápidas y consistentes, especialmente en grandes volúmenes.

La proposición aprovisionada proporciona un rendimiento predecible para su aplicación. Ya sea que se dedique al comercio electrónico, la atención médica o los servicios financieros, la capacidad de reconocer de una infraestructura de IA de desaparecido latencia y reincorporación confiabilidad se traduce directamente en mejores experiencias para los clientes y operaciones más eficientes.

Disminuir el costo de comenzar

Para que sea más claro probar, ascender y gobernar, estamos reduciendo el precio por hora para las implementaciones de Provisioned General y Provisioned Data Zone a partir del 1 de noviembre de 2024. Esta reducción en el costo garantiza que nuestros clientes puedan beneficiarse de estas nuevas características sin la carga de altos costos. gastos. La proposición aprovisionada continúa ofreciendo descuentos por compromisos mensuales y anuales.

Opción de implementación	PTU por hora	Reserva de un mes por PTU	Reserva de un año por PTU
Aprovisionado entero	Contemporáneo: $2.00 por hora 1 de noviembre de 2024: $1,00 por hora	$260 por mes	$221 por mes
Zona de datos aprovisionados^Nuevo	1 de noviembre de 2024: $1,10 por hora	$260 por mes	$221 por mes

Todavía estamos reduciendo los puntos de entrada mínimos de implementación para la implementación entero de Provisioned en un 70% y ampliando los incrementos hasta en un 90%, reduciendo la barrera para que las empresas comiencen con la proposición de Provisioned en una etapa más temprana de su ciclo de vida de expansión.

Cantidades mínimas e incrementos de implementación para la proposición aprovisionada

Maniquí	General	Zona de datos ^Nuevo	Regional
GPT-4o	Reducido: 50 15 Incremento 50 5	Reducido: 15 Incremento 5	Reducido: 50 Incremento 50
GPT-4o-mini	Reducido: 25 15 Incremento: 25 5	Reducido: 15 Incremento 5	Reducido: 25 Incremento: 25

Para los desarrolladores y equipos de TI, esto significa un tiempo de implementación más rápido y menos fricción al realizar la transición de la proposición normalizado a la aprovisionada. A medida que las empresas crecen, estas transiciones simples se vuelven vitales para apoyar la agilidad mientras se escalan las aplicaciones de IA a nivel mundial.

Eficiencia a través del almacenamiento en gusto: un punto de inflexión para aplicaciones de gran grosor

Otra característica nueva es Prompt Caching, que ofrece una inferencia más económica y rápida para solicitudes API repetitivas. Los tokens almacenados en gusto tienen un 50 % de descuento para Tipificado. Para las aplicaciones que envían con frecuencia las mismas indicaciones e instrucciones del sistema, esta restablecimiento proporciona una importante delantera de costo y rendimiento.

Al acumular en gusto las solicitudes, las organizaciones pueden maximizar su rendimiento sin exigencia de reprocesar solicitudes idénticas repetidamente, al mismo tiempo que reducen los costos. Esto es particularmente favorecedor para entornos de mucho tráfico, donde incluso pequeños aumentos en el rendimiento pueden traducirse en ganancias comerciales tangibles.

Una nueva era de flexibilidad y rendimiento de modelos

Uno de los beneficios secreto de la proposición Provisioned es que es flexible, con un precio simple por hora, mensual y anual que se aplica a todos los modelos disponibles. Todavía escuchamos sus comentarios de que es difícil entender cuántos tokens por minuto (TPM) obtiene para cada maniquí en implementaciones aprovisionadas. Ahora proporcionamos una perspicacia simplificada de la cantidad de tokens de entrada y salida por minuto para cada implementación aprovisionada. Los clientes ya no necesitan reconocer de calculadoras o tablas de conversión detalladas.

Mantenemos la flexibilidad que a los clientes les encanta con la proposición Provisioned. Con compromisos mensuales y anuales, aún puedes cambiar el maniquí y la lectura (como GPT-4o y GPT-4o-mini) en el interior del período de reserva sin perder ningún descuento. Esta agilidad permite a las empresas verificar, iterar y progresar sus implementaciones de IA sin incurrir en costos innecesarios ni tener que reestructurar su infraestructura.

Preparación empresarial en actividad

Las continuas innovaciones de Azure OpenAI no son sólo teóricas; ya están dando resultados en varias industrias. Por ejemplo, empresas como AT&T, Piedra H&R, mercedesy más están usando Servicio Azure OpenAI no solo como una útil, sino como un activo transformador que remodela la forma en que operan y se relacionan con los clientes.

Más allá de los modelos: la promesa de nivel empresarial

Está claro que el futuro de la IA es mucho más que ofrecer los últimos modelos. Si correctamente modelos potentes como GPT-4o y GPT-4o-mini proporcionan la colchoneta, es la infraestructura de soporte (como la proposición aprovisionada, la opción de implementación de zonas de datos, los SLA, el almacenamiento en gusto y los flujos de implementación simplificados) lo que efectivamente hace que Azure OpenAI Service esté sagaz para la empresa. .

La visión de Microsoft es proporcionar no solo modelos de IA de vanguardia, sino incluso herramientas y soporte de nivel empresarial que permitan a las empresas ascender estos modelos de guisa segura, confiable y rentable. Desde permitir implementaciones de desaparecido latencia y reincorporación confiabilidad hasta ofrecer una infraestructura flexible y simplificada, Azure OpenAI Service permite a las empresas adoptar plenamente el futuro de la innovación impulsada por la IA.

Comience hoy

A medida que el panorama de la IA continúa evolucionando, la exigencia de soluciones de IA escalables, flexibles y confiables se vuelve aún más crítica para el éxito empresarial. Con las últimas mejoras al servicio Azure OpenAI, Microsoft está cumpliendo esa promesa: brindando a los clientes no solo entrada a modelos de IA de clase mundial, sino incluso las herramientas y la infraestructura para ponerlos en funcionamiento a escalera.

Ahora es el momento de que las empresas liberen todo el potencial de la IA generativa con Azure, yendo más allá de la experimentación en torno a aplicaciones de nivel empresarial del mundo auténtico que generen resultados mensurables. Ya sea que esté ampliando un asistente imaginario, desarrollando aplicaciones de voz en tiempo auténtico o transformando el servicio al cliente con IA, Azure OpenAI Service proporciona la plataforma preparada para la empresa que necesita para innovar y crecer.

Etiquetado Acelere, Azure, con, escala, oferta, OpenAI, Provisioned, Service