La dirección Qwen de Alibaba ha evolucionado rápidamente en las últimas semanas. Recientemente vimos Qwen3-Coder-Futuro Dirigirse a los desarrolladores con un asistente de codificación de IA. Esto fue seguido por Imagen Qwen 2.0lo que impulsó aún más la calidad de engendramiento de imágenes de la plataforma. Cada tirada fortaleció una capacidad específica adentro del ecosistema. Ahora, basándose en esa proceso, llega la grupo Qwen 3.5 con dos nuevos modelos de IA: su primer maniquí de peso libre: el Qwen3.5 397B-A17B y el Qwen3.5-Plus.
Entre los dos, el primero, o Qwen3.5 397B-A17B, es el maniquí insignia, mientras que Qwen3.5-Plus es el maniquí alojado habitable a través de Alibaba Cloud Model Studio. Ahora se puede penetrar a uno y otro modelos en Qwen Chat.
Por lo que nos dice Alibaba, la grupo Qwen 3.5 se centra en un razonamiento, codificación, capacidades de agencia, comprensión multimodal y eficiencia mejorada. Más importante aún, refleja un impulso más amplio de Alibaba en dirección a sistemas de inteligencia industrial que puedan manejar tareas complejas de varios pasos con anciano autonomía. Si lo miras detenidamente, el maniquí es más que una simple aggiornamento: es una señal de en dirección a dónde se dirige la grupo Qwen.
En este artículo, cubrimos las novedades de Qwen 3.5, su posición competitiva y lo que revelan nuestras pruebas prácticas sobre su rendimiento en el mundo verdadero. Saltemos de inmediato.
¿Qué es Qwen 3.5?
Qwen 3.5 no es sólo «el próximo maniquí Qwen». Alibaba ha emprendedor oficialmente la serie Qwen 3.5 mediante el código libre del primer maniquí y lo ha denominado oficialmente ‘Qwen3.5-397B-A17B’.
Ahora viene la parte más importante en lo que respecta a su funcionamiento: el maniquí tiene 397 mil millones de parámetros totales, pero no los utiliza todos cada vez. Gracias a un escaso Mezcla de expertos (MoE), activa solo 17B parámetros por pase directo. Ésta es una forma elegante de aseverar: cerebro alto, pero sólo “despierta” las partes que necesita, por lo que la inferencia sigue siendo rápida y rentable.
Aún más importante, este es un nativo maniquí visión-lenguaje. Esto significa que está diseñado para manejar texto e imágenes juntos, no como una ocurrencia tardía. Alibaba afirma que tiene un excelente desempeño en razonamiento, codificación, capacidades de agentes y comprensión multimodal en evaluaciones comparativas.
Y incluso hay una aggiornamento muy del «mundo verdadero»: el soporte de idiomas pasa de 119 a 201 idiomas y dialectos, lo cual es importante si estás creando aplicaciones globales.
Paralelamente, Alibaba incluso anunció Qwen3.5-Plus, que es una traducción alojada habitable a través de Alibaba Cloud Model Studio. Ofrece una ventana contextual de 1 millón de tokens de forma predeterminada e incluye herramientas integradas con uso de herramientas adaptables. Esto lo hace adecuado para flujos de trabajo de contexto prolongado y automatización estilo agente.
Esto nos lleva a la pregunta: ¿cómo hace Qwen 3.5 todo esto? Echemos un vistazo debajo del capó para entender esto.
Debajo del capó: cómo funciona Qwen 3.5
Qwen 3.5 es interesante no sólo por su tamaño, sino incluso por la eficiencia con la que utiliza esa escalera.
A nivel de infraestructura, el maniquí separa cómo se procesan los componentes de visión y estilo en oportunidad de forzarlos a formar parte de un proceso único para todos. Esta configuración heterogénea permite que las entradas de texto, imágenes y video se procesen de guisa más valioso, lo que permite un rendimiento de entrenamiento cercano al 100 % incluso en datos multimodales mixtos.
La eficiencia se ve impulsada aún más por activaciones escasas. Esto permite que diferentes componentes se calculen en paralelo. Si a esto le sumamos un proceso nativo del FP8 (que aplica desestimación precisión cuando sea seguro y al mismo tiempo conserva una anciano precisión en capas sensibles), el sistema reduce la memoria de activación en aproximadamente un 50 % al tiempo que progreso la velocidad.
Alibaba incluso creó un situación de formación por refuerzo asincrónico escalable para perfeccionar continuamente el maniquí. Al separar las cargas de trabajo de capacitación e inferencia, el sistema progreso la utilización del hardware, equilibra la carga dinámicamente y se recupera rápidamente de fallas. Técnicas como la decodificación especulativa, la reproducción de implementación y el corte de implementación de múltiples turnos mejoran aún más el rendimiento y la estabilidad, especialmente para los flujos de trabajo de estilo agente.
Preentrenamiento: potencia, eficiencia y versatilidad
Qwen 3.5 fue entrenado previamente con un claro enfoque en tres cosas: potencia, eficiencia y versatilidad.
Fue entrenado con una combinación significativamente anciano de datos visuales y de texto que Qwen 3, con una cobertura multilingüe, STEM y de razonamiento más sólida. A pesar de activar sólo 17 mil millones de parámetros a la vez, el maniquí supuestamente iguala el rendimiento de sistemas mucho más grandes de billones de parámetros.
Arquitectónicamente, se friso en el Qwen3-Próximo diseñocombinando MoE de anciano escasez con mecanismos de atención híbridos. Esto permite velocidades de decodificación dramáticamente más rápidas manteniendo un rendimiento comparable.
El maniquí incluso es multimodal de forma nativa, fusionando texto y visión desde el principio del entrenamiento. La cobertura de idiomas se expande de 119 a 201 idiomas y dialectos, mientras que un vocabulario más amplio de 250 000 progreso la eficiencia de codificación y decodificación en todos los idiomas.
Rendimiento de remisión: dónde se encuentra Qwen 3.5
Los puntos de remisión nos muestran dónde un maniquí comienza a separarse del conjunto de opciones que existen. Según las evaluaciones publicadas por Alibaba, Qwen3.5-397B-A17B ofrece un rendimiento competitivo en razonamiento, flujos de trabajo agentes, codificación y comprensión multimodal. Aquí hay un vistazo a sus puntos de remisión y lo que significa:
Seguimiento de instrucciones y razonamiento
- IFBench (siguiendo instrucciones): 76,5: entre las puntuaciones más altas de su clase
- GPQA Diamond (razonamiento de nivel de posgrado): 88,4: competitivo con modelos de razonamiento de frontera
Estos resultados sugieren una sólida comprensión y un razonamiento estructurado que son fundamentales para los flujos de trabajo del mundo verdadero.
Capacidades de uso de agentes y herramientas
- BFCL v4 (uso de herramientas agentes): 72,9
- BrowseComp (búsqueda agente): 78,6
- Terminal-Faja 2 (Codificación de terminal Agentic): 52,5
Qwen 3.5 funciona especialmente adecuadamente en tareas impulsadas por agentes, reforzando su posicionamiento para la automatización del flujo de trabajo y la orquestación de herramientas.
Flujos de trabajo de codificación y mejora
Esto lo coloca sólidamente en la grado de modelos capaces de manejar flujos de trabajo reales de codificación y depuración.
Conocimiento multilingüe
La puntuación se alinea con su cobertura gramática ampliada y su recuperación de conocimientos mejorada.
Razonamiento visual y multimodal
- MMMU-Pro (razonamiento visual): 79,0
- OmniDocBench v1.5 (comprensión de documentos): 90,8
- Vídeo-MME (Video razonamiento): 87,5
- VITA-Bench (interacción multimodal agente): 49,7
Estos números resaltan una de las mayores fortalezas de Qwen 3.5: la comprensión multimodal en documentos, imágenes y videos.
Razonamiento corporal y espacial
Esto refleja la progreso de las capacidades en escenarios del mundo verdadero y de razonamiento incorporado.
Lo que efectivamente significan estos puntos de remisión
En oportunidad de dominar una sola categoría, Qwen 3.5 muestra una fortaleza equilibrada entre el razonamiento, la ejecución agencial, la codificación y la comprensión multimodal. Ese compensación es importante porque las cargas de trabajo modernas de IA no son problemas de una sola tarea. Implican herramientas, documentos, imágenes, código y flujos de trabajo de varios pasos, y Qwen 3.5 parece estar diseñado exactamente para esa ingenuidad.
Maña con Qwen 3.5
Realizamos un par de pruebas tanto en el Qwen3.5 397B-A17B como en el Qwen3.5-Plus. Aquí están las pruebas y los resultados.
Tarea 1: Codificación con Qwen3.5-Plus
Inmediato:
Eres un desarrollador frontend experimentado y diseñador UI/UX.
Cree un sitio web promocional flamante y responsivo (sitio de destino de una sola página) para el posterior evento. El sitio debe ser visualmente premium, centrado en la conversión y optimizado para registros.
Detalles del evento:
Título: Desafío de becas de IA iqigai 2026
Consigna: La búsqueda de tecnología de datos e inteligencia industrial más alto de la India
Presentado por: Fractal
Socio: Analytics Vidhya
Enlace de registro:
https://analyticsvidhya.com/datahack/contest/iqigai-genai-fellowship-challenge/?utm_source=social&utm_medium=X&utm_campaign=postContenido a incluir:
– Titular: ¡La búsqueda de tecnología de datos e inteligencia industrial más alto de la India ya está habitable!
– Descripción:
El iqigai AI Fellowship Challenge 2026 es más que un hackathon: es una plataforma que define su carrera donde los participantes compiten, obtienen clasificaciones a nivel doméstico y ganan visibilidad entre los principales empleadores.
– Fechas: 20 de enero – 8 de marzo de 2026
– Fondo total de premios: ₹20 Lacs
– Premios principales:
Campeón: ₹ 5 lakhs
1er finalista: ₹ 3 lakhs
Segundo finalista: ₹ 2 lakhsRequisitos del sitio web:
1. Utilice HTML, CSS y JavaScript (o React si lo prefiere).
2. Totalmente responsivo (escritorio + móvil).
3. Estilo flamante con temática de gradiente/tecnología AI.
4. Navegación con desplazamiento suave.
5. Borre los chico de CTA que enlazan a la página de registro.
6. Secciones:
– Sección de héroe (título alto + CTA)
– Sobre el desafío
– Aspectos destacados esencia / Por qué participar
– Sección de premios (tarjetas o insignias visuales)
– Cronología / Fechas
– Banner de llamado a la actividad
– Pie de páginaPautas de diseño:
– Fondo degradado de tecnología oscura
– Animaciones sutiles / mercadería de desplazamiento
– Tipografía limpia
– Tarjetas con sombras y esquinas redondeadas.
– Iconos o ilustraciones opcionales
– Surtir el tono profesional de la marca del evento.Requisitos de salida:
– Proporcionar código ejecutable completo
– Organizar claramente en archivos
– Comentar partes importantes.
– NO incluya registrador de posición lorem ipsum
– Certificar una estructura nómina para la producciónGenere el código completo del sitio web ahora.
Producción:
Tarea 2: conversión de texto a imagen con Qwen3.5-Plus
Inmediato:
Cree una cuadro cinematográfica de transformación al estilo anime con Vegeta de Dragon Ball Super desbloqueando Reaccionario Ego: represente un tenebroso campo de batalla cósmico mientras su cuerpo irradia un ki destructivo parecido a un dios, sus músculos se tensan y su postura cambia en dirección a una confianza feroz, su pelo se vuelve de un color morado intenso y sus fanales brillan en color magenta, rodeado por un aura malva parecida a una fogata furiosa que crepita y distorsiona el entorno; Capture la esencia de una mentalidad de Altísimo de la Destrucción donde el poder crece a través de la intensidad de la batalla y el daño, enfatizando el orgullo salvaje, las ondas de energía caóticas, el ámbito destrozado y la iluminación dramática: ángulos de cámara dinámicos, de suspensión contraste y reaccionario detallados, desenfoque de movimiento y sombreados de anime explosivos, que transmiten un dominio destructivo abrumador y una ascensión imparable.
Producción:
Tarea 3: Imagen a vídeo con Qwen3.5-Plus
Simplemente haga clic en la opción Crear video en la imagen.
Producción:
Tarea 4: conversión de texto a imagen con Qwen3.5 Open Weight
Inmediato:
“Slash and Burn” podría ser un espíritu o fuerza de la naturaleza, que encarna el ciclo de destrucción y renovación. Podría aparecer como un ser obvio y alterado que consume todo a su paso, sólo para que nueva vida surja de las cenizas. Esta entidad podría ser adorada o temida como una ídolo de transformación y renacimiento. firma inferior izquierda “sapope”
Producción:
Tarea 5: Imagen a video con Qwen3.5 Open Weight
Simplemente haga clic en la opción Crear video en la imagen.
Producción:
Vídeo final:
Conclusión
La grupo Qwen 3.5, con Qwen3.5 Open, es un paso en dirección a un sistema de IA unificado y más capaz. Con su inmueble híbrida MoE, diseño multimodal nativo, cobertura de idiomas ampliada y sólido rendimiento en puntos de remisión de razonamiento, codificación y comprensión de documentos, Alibaba está claramente optimizando las cargas de trabajo del mundo verdadero.
Lo que más destaca es el compensación. En oportunidad de sobresalir en una tarea específica, Qwen 3.5 muestra una fortaleza constante en los flujos de trabajo agentes, el razonamiento multimodal y la eficiencia a escalera. A medida que la IA pasa de las interfaces de chat a los sistemas basados en la ejecución, los modelos creados para ofrecer versatilidad y rendimiento serán más importantes. Con el rendimiento de remisión y los resultados que vemos en nuestras pruebas prácticas, Qwen 3.5 se posiciona firmemente en ese futuro.
Inicie sesión para continuar leyendo y disfrutar de contenido seleccionado por expertos.