XAI aguijada Grok-4-Fast: Razonamiento unificado y maniquí de no razonamiento con contexto de 2 m-token y entrenado de extremo a extremo con enseñanza de refuerzo de uso de herramientas (RL)

xai introducido Agitadoun sucesor de costo optimizado para Grok-4 que fusiona los comportamientos de «razonamiento» y «no recalentamiento» en un solo conjunto de pesos controlables a través de indicaciones del sistema. El maniquí se dirige a la búsqueda, codificación y preguntas y respuestas de suspensión rendimiento con un Ventana de contexto de 2m-token y RL de uso de herramientas nativo que decide cuándo explorar la web, ejecutar código o convocar a las herramientas.

Nota de edificio

Las liberaciones anteriores de Grok dividen las respuestas de «razonamiento» de dependencia larga y «no bienes» cortas en modelos separados. Grok-4-Fast’s espacio de peso unificado Reduce la latencia y los tokens de extremo a extremo mediante el comportamiento de dirección a través de indicaciones del sistema, que es relevante para aplicaciones en tiempo efectivo (búsqueda, agentes de cooperación y codificación interactiva) donde los modelos de conmutación penaliza tanto la latencia como el costo.

Búsqueda y uso de agente

Grok-4-Fast fue entrenado de extremo a extremo con enseñanza de refuerzo de uso de herramientas y muestra ganancias en los puntos de narración de agentes centrados en la búsqueda: BROWSECOMP 44.9%, Simpleqa 95.0%, Reka Research 66.0%más puntajes más altos en variantes chinas (por ejemplo, Browsecomp-zh 51.2%). Xai además cita las pruebas de batalla privadas en Lmarena donde grok-4-fast-search (nombre en código «Menlo») ocupa el puesto número 1 en el campo de búsqueda con 1163 Eloy la variable de texto (nombre en código «tahoe») se sienta en #8 en la arena de textoaproximadamente a la par con grok-4-0709.

Deltas de rendimiento y eficiencia

En puntos de narración internos y públicos, publicaciones de Grok-4-Fast puntajes de clase fronteriza mientras corta el uso de tokens. informes XAI Pase@1 Resultados de 92.0% (AIME 2025, sin herramientas), 93.3% (hmmt 2025, sin herramientas), 85.7% (diamante GPQA)y 80.0% (LivecodeBench Jan -May)acercarse o coincidir con Grok-4 pero usando ~ 40% menos fichas de «pensamiento» de término medio. La compañía enmarca esto como «densidad de inteligencia», reclamando un ~ 98% de reducción en el precio para alcanzar el mismo rendimiento de narración que Grok-4 Cuando se combinan el conteo de token inferior y los nuevos precios por madurez.

Despliegue y precio

El maniquí es Generalmente habitable para todos los usuarios en Grok’s Rápido y Automóvil modos en la web y móvil; Automóvil seleccionará Grok-4-Fast para consultas difíciles para mejorar la latencia sin perder calidad y, por primera vez,usuarios gratuitos Acceda al postrero nivel maniquí de Xai. Para los desarrolladores, Xai expone Dos skus–grok-4-fast-reasoning y grok-4-fast-non-reasoning—De tanto con Contexto de 2m. El precio (XAI API) es Tokens de entrada de $ 0.20 / 1M (<128k), Tokens de entrada de $ 0.40 / 1M (≥128k), Tokens de salida de $ 0.50 / 1M (<128k), Tokens de salida de $ 1.00 / 1M (≥128k)y Tokens de entrada en gusto de $ 0.05 / 1M.

5 Contradas técnicas:

Maniquí unificado + contexto de 2m. Grok-4-Fast utiliza un solo espacio de peso para el «razonamiento» y «no recarga», con una ventana de inmediato, con una ventana de 2,000,000 de token en entreambos SKU.
Precios para la escalera. El precio de la API comienza en Entrada de $ 0.20/m, Salida de $ 0.50/mcon entrada en gusto en $ 0.05/m y tasas más altas solo más allá del contexto de 128k.
Reclamos de eficiencia. Informes de Xai ~40% menos tokens de «pensamiento» con precisión comparable vs Grok-4, produciendo un ~ 98% de precio más bajo para igualar el rendimiento de Grok-4 En los puntos de narración de Frontier.
Perfil de narración. Pase reportado@1: AIME-2025 92.0%, HMMT-2025 93.3%, GPQA-Diamond 85.7%, LivecodeBench (enero -mayo) 80.0%.
Uso de agente/búsqueda. Post-entrenamiento con RL de uso de herramientas; Posicionado para flujos de trabajo de navegación/búsqueda con métricas documentadas de agente de búsqueda y facturación de búsqueda en vivo en documentos.

Sinopsis

GROK-4-FAST empaqueta la capacidad de nivel GROK-4 en un maniquí único y impirable con una ventana de 2 m-token, RL de uso de herramientas y precios ajustados para la búsqueda de suspensión rendimiento y las cargas de trabajo de agentes. Las primeras señales públicas (Lmarena #1 en búsqueda, colocación competitiva de texto) se alinean con el propaganda de Xai de precisión similar utilizando ~ 40% menos de tokens de «pensamiento», traduciendo a una beocio latencia y costo común en la producción.

Mira el Detalle técnico. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Por otra parte, siéntete librado de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.

Asif Razzaq es el CEO de MarktechPost Media Inc .. Como patrón e ingeniero iluminado, ASIF se compromete a rendir el potencial de la inteligencia industrial para el correctamente social. Su esfuerzo más nuevo es el emanación de una plataforma de medios de inteligencia industrial, MarktechPost, que se destaca por su cobertura profunda de noticiero de enseñanza obligatorio y de enseñanza profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el divulgado.

Etiquetado Aprendizaje, con, contexto, entrenado, extremo, Grok4Fast, herramientas, lanza, modelo, mtoken, razonamiento, refuerzo, unificado, uso, XAI