Athrun Data Intelligence


Los asistentes de codificación se están volviendo populares posteriormente del propagación de Código Claude y OpenAi Codex CLI. Lo que siguió fue una avalancha de nuevas herramientas, de Géminis cli a Grok 4 Codex. Ahora, Qwen 3 ingresa a la refriega, con el objetivo de despuntar como una poderosa alternativa de código despejado. Ya sea que se enfrente a un problema de codificación difícil o simplemente busque una forma más inteligente de codificar, Qwen 3 ofrece una alternativa gratuita e innovadora. Diseñado para la reproducción de código reformista y los flujos de trabajo de codificación flexibles, es valentísimo para los científicos de datos y los entusiastas de la IA. En este blog, exploraremos qué distingue a Qwen 3.

¿Qué es QWEN3-coder?

QWEN3-Coder es el maniquí de IA de código despejado más nuevo y poderoso del equipo QWEN. El maniquí insignia de esta serie es el instructo QWEN3-coder-480b-A35B, que cuenta con una inmueble de parámetros masiva de 480 mil millones.

Una característica secreto de este maniquí es el uso de una inmueble de mezcla de expertos (MOE). Este diseño permite que el maniquí sea más efectivo activando solo una pequeña porción de sus parámetros en un momento transmitido.

Lo más destacado de QWen3 coder

  • 480 mil millones de parámetros: El maniquí funciona con 480 mil millones de parámetros, pero solo 35 mil millones están activos durante una consulta.
  • Eficiencia a través de MOE: Con el enfoque de la mezcla de expertos, solo un número selecto de expertos (que están admisiblemente versados en el tema relevante) se activan para una tarea determinada, lo que lo hace poderoso pero manejable.
  • Ventana de contexto prolongado: Admite un contexto de 256,000 tokensque se puede extender hasta 1 millón de tokensusando extrapolación.
  • Extrapolación: Esta característica permite que el maniquí procese entradas más grandes de las que se entrenó originalmente, lo que permite una longevo flexibilidad y capacidad.

Esta inmensa ventana de contexto permite a QWEN3-coder comprender y trabajar con repositorios de código enteros, lo que lo convierte en una útil invaluable para los desarrolladores.

Bloque de QWen3 codificador

QWEN3-coder se desarrolla con la idea central de sobresalir en la codificación de agente. Su inmueble y capacitación están diseñados para convertirlo en un maniquí de primer nivel para la reproducción de código y las tareas relacionadas con el código.

  • Mezcla de expertos (MOE): El maniquí utiliza una inmueble MOE con 160 expertos, de los cuales 8 están activos a la vez. Esto permite que el maniquí sea muy sobresaliente y poderoso sin ser moroso.
  • Ventana de contexto masivo: Con soporte nativo para 256,000 tokens, QWEN3-coder puede manejar grandes cantidades de código directamente. Esto a menudo es crucial para comprender el contexto de un plan completo.
  • Capacitación avanzadilla: El maniquí se entrenó previamente en 7,5 billones de tokens de datos, con el 70% de eso siendo código. Además pasó por una escalón posterior a la capacitación que incluía el formación de refuerzo de la feedback humana para mejorar su capacidad para manejar tareas de codificación del mundo positivo.

Esta capacitación avanzadilla se realizó para adoptar una visión más amplia, en área de centrarse en la reproducción de código de nivel competitivo en la comunidad. El representación mencionado muestra las ganancias de rendimiento constantes en una amplia grado de puntos de narración, incluida la reproducción de códigos, el ampliación de software, el investigación de datos, la programación competitiva, la codificación de varios idiomas, la programación SQL, la publicación de códigos e instrucción a continuación. Estas tendencias ascendentes consistentes demuestran la efectividad del formación de refuerzo para mejorar la extensión del maniquí en desafíos de codificación estructurados y no estructurados.

Rendimiento de QWEN3-coder

QWEN3-Coder logró un rendimiento agente de última reproducción en comparación con otros modelos de código despejado en el punto de narración SWE-Bench. Como se muestra en el representación, logra un 69.6% de precisión verificada en una configuración interactiva de 500 giros y 67.0% en modo de disparo único. Superó a otros modelos como Mistral-Small-2507 con 53.6% y GPT-4.1 con un 54.6% de precisión. Se ubica calibrado detrás de Claude-Sonnet-4 (70.4%) y por delante de Kimi-K2 (65.4%), y Gemini-2.5 (49.0%). Esto establece QWEN3-coder como el maniquí de agente despejado de stop rendimiento para tareas de ingeniería de software del mundo positivo.

Comenzando con el código Qwen

Para ceder al código qwen directamente, diríjase a https://chat.qwen.ai/y allí puede pretender QWEN3-coder como maniquí y comenzar a usarlo.

Comenzando con el código Qwen

QWEN API

Puede ceder directamente a la API de QWEN3-coder a través de Estudio de modelos de cirro de Alibaba. Aquí hay una demostración de cómo usar este maniquí con la API QWEN. A partir de ahora, no hay una cuota gratuita apto.

import os

from openai import OpenAI

# Create client - using intl URL for users outside of China

# If you are in mainland China, use the following URL:

# "https://dashscope.aliyuncs.com/compatible-mode/v1"

client = OpenAI(

   api_key=os.getenv("DASHSCOPE_API_KEY"),

   base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",

)

prompt = "Help me create a web page for an online bookstore."

# Send request to qwen3-coder-plus model

completion = client.chat.completions.create(

   model="qwen3-coder-plus",

   messages=(

       {"role": "system", "content": "You are a helpful assistant."},

       {"role": "user", "content": prompt}

   ),

)

# Print the response

print(completion.choices(0).message.content.strip())

El equipo de Qwen todavía ha decidido una útil de fila de comandos emplazamiento Código Qwen para suministrar el uso de QWEN3. Aquí hay una preceptor paso a paso para comenzar:

¿Cómo usar el código QWEN?

Paso 1: Instalar node.js

Primero, deberá instalar Node.js lectura 20 o superior en su sistema. Puede instalarlo con los siguientes comandos. Abrigo su terminal y pegue los siguientes comandos uno por uno.

# Download and install nvm:

curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.3/install.sh | bash

# in lieu of restarting the shell

. "$HOME/.nvm/nvm.sh"

# Download and install Node.js:

nvm install 22

# Verify the Node.js version:

node -v # Should print "v22.17.1".

nvm current # Should print "v22.17.1".

# Verify npm version:

npm -v # Should print "10.9.2".

Paso 2: Instale el código QWEN

A continuación, instale la útil de código QWEN utilizando el Administrador de paquetes NPM:

npm i -g @qwen-code/qwen-code

Deberías ver poco como esto:

  Instalar node.js

Paso 3: Configure su secreto API

Puede ceder directamente a la API de QWEN3-coder a través de Estudio de modelos de cirro de Alibaba. A partir de ahora, no hay una cuota gratuita apto.

Deberá configurar su secreto API para usar el maniquí. Puede hacer esto estableciendo variables de entorno.

export OPENAI_API_KEY="your_qwen_api_key_here"

export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"

export OPENAI_MODEL="qwen3-coder-plus"

Paso 4: comenzar a codificar

Ahora está pronto para usar el `Código Qwen`. Puede navegar hasta el directorio de su plan y comenzar a interactuar con el agente. Por ejemplo, para comprender la inmueble de un plan, puede usar el comando o simplemente escribir el subsiguiente comando, aparecerá el código qwen:

qwen
Comience a codificar en Qwen Coder

Además puede usarlo para tareas más complejas como el código de refactorización o incluso automatizar flujos de trabajo.

¿Cómo usar QWEN3-coder en el código Claude?

Adicionalmente del código QWEN, ahora puede usar QWEN3 -Coder con el código Claude. Simplemente solicite una secreto API en Estudio de modelos de cirro de Alibaba Plataforma e instale el código Claude para iniciar la codificación.

npm install -g @anthropic-ai/claude-code

Set up environment variables for using Qwen3‑Coder

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/api/v2/apps/claude-code-proxy

export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey

¡Entonces debería poder usar el código Claude con QWEN3-coder!

Nota: Puede usar QWEN CLI o interfaz web para realizar tareas de codificación. Ahora, realicemos algunas tareas para probar las capacidades de codificador QWEN3.

Codificador de qwen3 práctico

Probamos QWen3 -Conder en algunas tareas de codificación interesantes y complejas. Veamos cómo funcionó. Aquí estamos utilizando la lectura de interfaz de afortunado, a la que se puede ceder en https://chat.qwen.ai/

Tarea 1: Smart Data Storyteller

Inmediato: Cree una aplicación de narración de datos donde los usuarios pueden cargar archivos CSV y hacer preguntas de jerga natural sobre sus datos. La IA debe originar visualizaciones, identificar patrones y crear explicaciones narrativas de las ideas. Incluya características para que los usuarios hagan preguntas de seguimiento como ‘¿Por qué las ventas cayeron en el Q3?’ o ‘Muéstrame la correlación entre el pago en marketing y los ingresos’. Haz que sea accesible para usuarios no técnicos.

Smart Data Storyteller

Tomó algún tiempo originar el código, pero generó la aplicación completa en un solo script. Cuando probamos en el espectador HTML, obtuvimos estos resultados:

Smart Data Storyteller

La interfaz de la aplicación es interesante; Maneja con éxito el procesamiento de archivos, lo que permite que la aplicación maneje las cargas de archivos. Los componentes de UI ricos se crean usando React. La aplicación está teniendo un diseño receptivo, por lo tanto, demuestra que QWEN3-coder está funcionando admisiblemente en esta tarea.

Tarea 2: depuración y refactorización de una saco compleja de código de errores

Inmediato: Actúa como desarrollador senior de Python y revisor de código. Tengo un script de Python que se supone que procesa una cinta de datos de usuarios de una API simulada, filtro para usuarios activos y calcula su permanencia promedio. Sin incautación, es buggy, moroso y mal escrito. Tu tarea es:

  • Identificar los errores: Encuentre y enumere todos los errores lógicos, posibles errores de tiempo de ejecución y prácticas malas en el código.
  • Corrige el código: Proporcione una lectura corregida del script que funcione según lo previsto.
  • Refactor para mejorar: Refactorizar el código corregido para mejorar su rendimiento, legibilidad y mantenimiento. Específicamente, deberías:
    • Agregue el manejo de errores para la solicitud API.
    • Use una estructura o método de datos más efectivo si es posible.
    • Mejorar los nombres de las variables para ser más descriptivos.
    • Agregue el tipo de sugerencias y comentarios cuando sea necesario.
    • Orquestar el código en funciones para una mejor estructura.

Aquí está el código de errores:

import requests

def process_users():

    data = ()

    # Inefficiently fetching one user at a time

    for i in range(1, 101):

        # API endpoint is incorrect and will fail for some users

        response = requests.get(f"https://my-mock-api.com/users/{i}")

        data.append(response.json())

    total_age = 0

    active_users_count = 0

    for user in data:

        # Bug: 'status' key might not exist

        if user('status') == 'active':

            # Bug: 'profile' or 'age' might not exist, will raise KeyError

            total_age += user('profile')('age')

            active_users_count += 1

    # Bug: Division by zero if no active users are found

    average_age = total_age / active_users_count

    print("Promedio age of active users:", average_age)

process_users()

Producción:

Salida del codificador qwen 3

Qwen generó la alternativa en algún tiempo. Veamos su resultado:

  • Cosas buenas: Qwen agregó manejo de errores y camino seguro de datos para entradas API. El código tiene buena documentación, lo que la hace fácil. El código está siguiendo el estilo de código normalizado.
  • Áreas para mejorar: el código es más prolongado y más detallado que el innovador correcto al manejo de errores y la modularidad adicionales.: La ineficiencia fundamental de realizar llamadas de API individuales en un onda no se ha abordado. La preámbulo de más funciones y manejo de errores hace que la estructura genérico sea levemente más compleja para que un principiante comprenda.

En genérico, el código es bueno y se encargó de todas las instrucciones que se le dieron.

Tarea 3: Visualización del ámbito solar

Inmediato: Cree una visualización 3D Sun Terrain utilizando un solo archivo HTML que incorpore CSS para el diseño y el tema, y usa solo bibliotecas CDN externas, principalmente tres.js y órbitcóntrols, para representar un sol realista y girante. El sol debe presentar una actividad de superficie dinámica utilizando mapas animados o mapas de desplazamiento para aparentar granos solar y bengalas, dándole una textura similar al ámbito. Incluya un fondo ambiguo con temas con estrellas para el realismo ambiental. Asegúrese de que la visualización sea interactiva, soportando la rotación de remolque del mouse y el teleobjetivo basado en el desplazamiento. Todas las texturas y sombreadores deben obtenerse de CDN públicos o métodos de reproducción de procedimientos, sin activos locales o cargados.

Producción:

Salida de visualización del terreno solar

Rápidamente generó un código HTML. Cuando probamos eso en un espectador HTML, obtuvimos esto:

Salida de Qwen 3

Creó un ámbito solar 3D interactivo, que paseo. La estructura similar al semicircular amarillo es una relámpago, según Qwen. Esta animación es poco prometedora, pero no demasiado buena.

Además ha proporcionado algunas opciones en la cima izquierda para detener la rotación, restablecer la traza y ocultar bengalas. La subsiguiente imagen muestra el sol sin bengalas:

Salida de Qwen3

El resultado de esta tarea es bueno, pero no hasta la marca. Hay algunas áreas para mejorar aquí. Tal vez se pueda resolver utilizando su solicitud más detallada.

Conclusión

QWEN3-coder representa un enorme avance en los modelos de IA de código despejado en el interior del dominio de la reproducción de código. Su poderosa inmueble, ventana de contexto masiva y capacidades de agente lo convierten en una útil valiosa para desarrolladores e investigadores. Oportuno a que el maniquí continúa desarrollándose, esperaremos ver características y rendimiento aún más impresionantes en el futuro. Este maniquí de IA de código despejado tendrá un impacto significativo en cómo abordamos los problemas de ampliación de software, lo que lo hace más efectivo y automatizado.

Preguntas frecuentes

Q1. ¿Cuál es la principal superioridad de la inmueble de la mezcla de expertos (MOE) QWEN3-coder?

R. La inmueble MOE permite que el maniquí tenga una gran cantidad de parámetros (480 mil millones) mientras solo activa una fracción de ellos (35 mil millones) a la vez. Esto da como resultado un maniquí poderoso que es más efectivo para ejecutar.

Q2. ¿Cuál es el significado de la ventana de contexto sobresaliente?

R. La ventana de contexto de 256,000 token (desplegable a 1 millón) permite que QWEN3-coder procese y comprenda repositorios de código enteros, lo cual es crucial para tareas complejas que requieren una comprensión profunda del contexto del plan.

Q3. ¿Qué es el código Qwen?

A. El código Qwen es una útil de fila de comandos diseñada para funcionar con QWEN3-coder. Proporciona una interfaz conveniente para interactuar con el maniquí para varias tareas de codificación.

Q4. ¿Cómo se compara QWEN3-coder con otros modelos de reproducción de código?

A. QWEN3-Coder ha demostrado un rendimiento de vanguardia entre los modelos de código despejado en varios puntos de narración, incluido SWE-Bench. Sus capacidades son comparables a algunos de los mejores modelos propietarios disponibles.

Q5. ¿Dónde puedo ceder al maniquí de codificador QWEN3?

R. El maniquí QWEN3-coder está apto en el Hub Face Hub, y puede encontrar más información y capital en el blog oficial de Qwen y el repositorio de GitHub.

Harsh Mishra es un ingeniero de IA/ML que pasa más tiempo hablando con modelos de idiomas grandes que los humanos reales. Apasionado por Genai, PNL, y hacer máquinas más inteligentes (por lo que todavía no lo reemplazan). Cuando no optimiza los modelos, probablemente esté optimizando su consumo de café. 🚀☕

Inicie sesión para continuar leyendo y disfrutando de contenido curado por expertos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *