NVIDIA AI resuelto Jet-Nemotron: 53x Serie de maniquí de jerigonza híbrido-arquitectura híbrido que se traduce en una reducción de costos del 98% para la inferencia a escalera

Los investigadores de NVIDIA han destrozado el obstáculo de eficiencia de larga data en la inferencia del maniquí de idioma excelso (LLM), liberando Jet-nemotrón—Un comunidad de modelos (2b y 4b) que ofrece hasta 53.6 × rendimiento de procreación más suspensión que liderar LLM de atención completa mientras coincide, o incluso superando, su precisión. Lo más […]
Anunciando la serie de modelos GPT-4.1 para los desarrolladores de Azure Ai Foundry y GitHub

Estamos entusiasmados de compartir el tirada de la próxima vivientes de la serie de modelos GPT-4O con GPT-4.1, 4.1-Mini y 4.1-Nano a Microsoft Azure OpenAI Service. Estamos entusiasmados de compartir el tirada de la próxima iteración de la serie Maniquí GPT con GPT-4.1, 4.1-Mini y 4.1-Nano a Servicio Microsoft Azure OpenAI y Github. Los modelos […]
AMD Open Sources AMD OLMo: una serie de modelos de lengua 1B totalmente de código descubierto que AMD entrena desde cero en las GPU AMD Instinct™ MI250

En el mundo en rápida proceso de la inteligencia químico y el enseñanza espontáneo, la demanda de soluciones potentes, flexibles y de llegada descubierto ha crecido enormemente. Los desarrolladores, investigadores y entusiastas de la tecnología enfrentan con frecuencia desafíos cuando se manejo de utilizar la tecnología de vanguardia sin hallarse limitados por ecosistemas cerrados. Muchos […]
Microsoft lanceta las últimas máquinas virtuales Azure optimizadas para supercomputación de IA, la serie ND H200 v5

Nuestros clientes confían en la infraestructura de IA de Azure para desarrollar soluciones innovadoras impulsadas por IA, por lo que hoy ofrecemos nuevos clústeres de supercomputación de IA basados en la nubarrón creados con máquinas virtuales (VM) de la serie Azure ND H200 v5. La pobreza de una infraestructura escalable y de parada rendimiento continúa […]
Presentamos o1: la nueva serie de modelos de razonamiento de OpenAI para desarrolladores y empresas en Azure

Nos complace pegar los modelos más nuevos de OpenAI, o1-preview y o1-mini, a Azure OpenAI Service, Azure AI Studio y GitHub Models. Nos complace incorporar los modelos más nuevos de OpenAI, o1-preview y o1-mini, a Microsoft Azure OpenAI Service, Azure AI Studio y GitHub Models. La serie o1 permite capacidades complejas de codificación, razonamiento matemático, […]