Anuncio de control de salida para cargas de trabajo sin servidor y de servicio de modelos

Estamos emocionados de anunciar que control de salida para cargas de trabajo de Databricks sin servidor y Mosaic AI Model Serving está arreglado en clarividencia previa pública en AWS y Azur! Ahora puede configurar políticas para controlar de forma centralizada el golpe saliente desde cargas de trabajo sin servidor en múltiples productos y espacios de […]
Investigadores de NVIDIA, CMU y la Universidad de Washington lanzaron ‘FlashInfer’: una biblioteca de kernel que proporciona implementaciones de kernel de última reproducción para inferencia y servicio de LLM

Los modelos de estilo grandes (LLM) se han convertido en una parte integral de las aplicaciones modernas de inteligencia fabricado, impulsando herramientas como chatbots y generadores de código. Sin requisa, la longevo dependencia de estos modelos ha revelado ineficiencias críticas en los procesos de inferencia. Los mecanismos de atención, como FlashAttention y SparseAttention, a menudo […]
Anuncio del maniquí o1 en el servicio Azure OpenAI

Nos complace anunciar que el maniquí o1 llegará pronto al servicio Microsoft Azure OpenAI. Este maniquí multimodal aporta capacidades de razonamiento avanzadas y mejoras que mejorarán significativamente sus aplicaciones y soluciones de IA. El maniquí o1 admite entradas de texto y de visión, lo que lo hace ideal para una amplia escala de aplicaciones, desde […]
¿Qué es y cómo funciona el servicio EC2 de AWS?

¿Alguna vez te has preguntado cómo funciona el servicio de instancias de máquinas virtuales EC2 de AWS y cuáles son sus beneficios? A continuación, encontrará toda la información relacionada sobre este servicio, sus características y sus beneficios: Las instancias EC2 (Elastic Compute Cloud) son una de las claves de servicios de Amazon Web Services (AWS) […]
Inferencia por lotes en modelos de llamas ajustados con servicio de modelos de IA en alicatado

Comienzo Para crear soluciones de IA generativa de nivel de producción, escalables y tolerantes a fallas, es necesario tener una disponibilidad confiable de LLM. Sus terminales LLM deben estar listos para satisfacer la demanda al contar con computación dedicada solo para sus cargas de trabajo, subir la capacidad cuando sea necesario, tener una latencia constante, […]
Mejore la seguridad y las capacidades operativas de su servicio Azure Kubernetes con Advanced Container Networking Services, ahora disponibles de forma generalizada.

Con la creciente apadrinamiento de tecnologías nativas de la cirro, los contenedores y Kubernetes se han convertido en la columna vertebral de las implementaciones de aplicaciones modernas. Las cargas de trabajo de contenedores basadas en microservicios son más fáciles de prosperar, más portátiles y eficientes en cuanto a fortuna. Con Kubernetes administrando estas cargas de […]
Anuncio de disponibilidad normal: publicación en el servicio Microsoft Power BI desde Unity Catalog

Nos complace anunciar la disponibilidad normal del servicio Divulgar en Microsoft Power BI desde Unity Catalog, una integración que facilita la creación de informes web de Power BI a partir de los datos de Unity Catalog con solo unos pocos clics. Esta característica permite una integración perfecta del catálogo y la sincronización del maniquí de […]
Reimaginando la educación superior con el servicio Azure OpenAI

Descubra cómo el uso del servicio Azure OpenAI en la educación superior puede ayudar a los líderes a reinventar los modelos de enseñanza y ceñir las cargas administrativas. Imagine un futuro en el que cada estudiante tenga un camino de enseñanza personalizado, en el que los profesores puedan centrarse en la enseñanza en circunstancia de […]
Modernización del servicio Amazon OpenSearch de Infor: búsquedas 94% más rápidas y costos 50% más bajos

Esta publicación está coescrita por Arjan Hammink de Infor. Las sólidas capacidades de almacenamiento y búsqueda son componentes críticos del software empresarial en la aglomeración de Infor. información Red abierta inteligente (ION) La plataforma OneView proporciona informes, paneles y visualización de datos en tiempo verdadero para ayudar a los clientes a lograr y analizar información […]
Anuncio de nuevos productos y características para el servicio Azure OpenAI, incluido GPT-4o-Realtime-Preview con capacidades de audio y voz.

Estamos encantados de anunciar la pinta previa pública de GPT-4o-Realtime-Preview para audio y voz, una importante prosperidad del servicio Microsoft Azure OpenAI que agrega capacidades de voz avanzadas y amplía las ofertas multimodales de GPT-4o. Estamos encantados de anunciar la pinta previa pública de GPT-4o-Realtime-Preview para audio y voz, una prosperidad importante para Servicio Microsoft […]