Todos debemos consentir que septiembre ha sido el mes de Géminis nano plátano. Todos han estado jugando con el maniquí, publicando ediciones extravagantes y selfies divertidas en las redes sociales. Lo más probable es que lo probaste todavía o al menos más allá de una docena de esos mashups de celebridades y publicaciones de figuras en 3D en tu feed. Pero mientras Nano Plátano ha dominado el flanco informal de la coexistentes de imágenes, Qwen ha estado nivelando en silencio el esparcimiento de tirada profesional. El mes pasado, el equipo lanzó Qwen-Image-Edit, y ahora están de regreso con una traducción actualizada: QWEN-IMAGE-EDIT-2509, que se centra en la consistencia, flexibilidad y control. En comparación con el divulgación de agosto, la nueva modernización hace que la tirada sea más poderosa para creadores, desarrolladores e investigadores, sin dejar de ser accesible para cualquiera que quiera observar.
Si desea retener más sobre el maniquí aludido, lea nuestro artículo detallado sobre QWEN-IMAGE-EDIT!
¿Qué hay de nuevo en Qwen-Image-Edit-2509?
En comparación con el divulgación del mes pasado, esta traducción presenta cuatro mejoras principales:
Soporte de tirada de múltiples imágenes
QWEN-IMAGE-EDIT-2509 ahora le permite editar a través de varias imágenes simultáneamente. El maniquí ha sido entrenado utilizando la concatenación de imágenes, que permite ediciones sin problemas en combinaciones como:
- persona + persona
- persona + producto
- persona + suceso
Funciona mejor con 1–3 imágenes de entrada, y todavía se integra perfectamente con los mapas de ControlNet, como puntos secreto para cambios de pose.
Consistencia de imagen única mejorada
Al editar una sola imagen, la modernización de septiembre se centra en gran medida en la consistencia:
- Impresión de la persona: Las caras conservan su identidad en diferentes poses y estilos de retratos.
- Impresión de productos: Los logotipos y los objetos mantienen su aspecto, lo que hace que los carteles de productos sean más fáciles de producir.
- Impresión de texto: No solo puede cambiar las palabras, sino que todavía puede ajustar las fuentes, los colores y los materiales con precisión.
Soporte de control de control nativo
La modernización agrega una integración suave con las entradas de ControlNet como mapas de profundidad, mapas de borde y mapas de punto secreto, expandiendo el control creativo para casos de uso técnico y estético.
Texto mejorado + integración de imágenes
QWEN-IMAGE-EDIT-2509 ahora puede combinar la tirada de texto sin problemas con la manipulación de la imagen. Por ejemplo, el diseño de un póster donde las fuentes, los estilos y las imágenes interactúan de guisa consistente.
Lea todavía: QWEN3-OMNI REVISIÓN: ¿Powerhouse multimodal o promesa sobrevalorada?
Sueltas de la mano para probar con Qwen-Image-Edit-2509
Para todas estas tareas, estoy usando tanto QWEN-IMAGE-EDIT-2509 como Nano Plátano para comparar las horizontes y todavía ver cómo se desempeña QWEN en cada tarea.
Tarea 1: persona + persona
Inmediato: «Use la imagen A y la imagen B. fusionarlos en una foto donde ambas personas se sientan en un mesa del parque. Preservar la identidad facial y la iluminación natural. «

La nueva característica del maniquí de tirada de imágenes QWEN todavía tiene dificultades para suministrar intactas las características faciales. Como puede ver en la imagen de hacia lo alto, Nano Plátano hizo un mejor trabajo al retener las caras de ambas personas. Qwen todavía alteró la bolsa en la imagen innovador, mientras que Nano Plátano la mantuvo sin cambios.
Tarea 2: Persona + suceso
Inmediato: «Coloque este retrato en una concurrida calle de Tokio por la oscuridad con letreros de neón. Mantenga la identidad de la cara y el tono de piel correcto».

Qwen hizo un gran trabajo para retener las expresiones faciales y la calidad genérico de la imagen. El centella y la mezcla de imagen genérico se ve perfectamente. Sin retención, Nano Plátano dio un paso delante y editó el centella de fondo según la foto, lo que hace que se vea más vivo.
Tarea 3: Persona + anuncio de productos
Inmediato: «Use este retrato y esta imagen del producto. Haga que parezca un anuncio donde la persona posee el producto. Mantenga fácil la inscripción del producto».

Para esta tarea, agregué las imágenes del maniquí y el producto en los dos modelos utilizando el mismo aviso. La salida de Qwen se ve mejor, mientras que Nano Plátano simplemente colocó las dos fotos sin pensarlo en combinarlas.
Tarea 4: Pose de control con el plano de punto secreto
Las siguientes imágenes muestran el proceso en el que se utiliza un plano de pose de punto secreto de una imagen para transferir una postura específica a una persona en una imagen diferente, todo mientras preserva su identidad facial. Los ejemplos todavía muestran cómo esta tecnología se puede combinar con otras tareas de tirada compleja, como cambiar los circunstancias y manipular objetos.

He usado esta nueva característica de Qwen en el posterior mensaje:
Inmediato: «Use este retrato y este plano de pose de KeyPoint. Reposte a la persona que coincida con el plano mientras mantiene la identidad facial».

QWEN Image Edit tiene un soporte manifiesto para la tirada guiada por KeyPoint. Es por eso que tu proyecto + superposición de punto secreto sincronizó perfectamente. Sabe estudiar el plano de punto secreto, luego condicionar la coexistentes. Si desea juguetear con poses, ángulos, postura o interacciones con puntos de relato (como Eiffel Tower, Qutub Socavar, Taj Mahal, Akshardham), debe seguir con la tirada de imágenes de Qwen (o cualquier maniquí que mencione «Pose Control» / «KeyPoint Conditioning»).
Sin retención, Nano Plátano no tiene una tubería de acondicionamiento de plano secreto de keyos. Es por eso que simplemente resurgió su imagen de entrada sin cambios: puede editar para el estilo, la textura, los swaps de fondo, etc., pero no analiza ni hace cumplir los mapas de pose humanos/de objetos.
Tarea 5: Juntar texto a la imagen
Inmediato: «La chica de la imagen cargada está sosteniendo un tablero de tiza con el texto» Únete a mi clase importante de Genai para convertirte en una experta en 2025 «escrita en él»

Entre las dos respuestas, la salida de Qwen es claramente mejor. En la traducción Qwen, el texto se encuentra lógicamente en el tablero, seguidor correctamente con la perspectiva y parece que en efectividad pertenece a una pizarra. El estilo de fuente es consistente, despejado y enormemente fácil, lo que hace que el mensaje aparezca más claramente. El texto se combina sin problemas con la superficie del tablero, por lo que el resultado final se siente auténtico y realista.
Por otro flanco, la respuesta de Gemini se parece más a una superposición digital. La fila del texto no coincide completamente con el ángulo de la placa, y el estilo de fuente parece menos como escritura de tiza y más como texto digital estereotipado. Oportuno a esto, el texto parece que está pegado en la parte superior del tablero en extensión de integrarse en él.
Tarea 6: Transformación de dibujos animados o anime
Inmediato: «Convierta esta imagen en un personaje de estilo de anime mientras preserva la misma identidad y expresión de la cara».

Entre los dos resultados, la traducción de Qwen-Image-EDIT-2509 es claramente mejor porque transforma completamente a la persona en un personaje de estilo de anime mientras conserva el mismo atuendo, pose y expresión, lo que lo convierte en fiel para el aviso de la tarea, mientras que la traducción de Nano Plátano se ve casi idéntica a la foto de entrada con muy poca estilización de anime, estilización de anime, por lo que no es positivamente un requisito de «Anime Carácter» que se siente más como una luz de la luz.
Tarea 7: Cartel de productos
Inmediato: «Hacer un comercializable despejado Cartel para este zapato. Use un fondo simple. Agregue el nombre del producto en la parte inferior en negrita, diciendo – soulshoe «

Entre los dos, el póster de Qwen es mejor porque va más allá de una exhibición simple y en efectividad comercializa el producto. El sorpresa brillante hace que los zapatos se destaquen, el contraseña «donde la comodidad se encuentra con el estilo» agrega atractivo emocional, y la insignia de «tirada limitada» crea emergencia, todo lo cual hace que parezca una campaña publicitaria pulida, mientras que la producción de Gemini, aunque limpia y profesional, se siente más como una imagen de catálogo simple que un cartel comercial.
Mi veredicto
Nano Plátano es divertido, accesible e instantáneamente compartible; Consumado para memes, selfies y tendencias sociales. Qwen, por otro flanco, está estructurado, versátil y preparado para la producción, lo que lo convierte en la mejor opción para creadores, diseñadores y profesionales que desean confiabilidad en los resultados.
Lea todavía:
Conclusión
Los modelos de imagen de IA están mejorando mes a mes. Agosto nos dio la primera imagen QWEN. Septiembre nos ha hexaedro esta nueva traducción con soporte de imágenes múltiples y una mejor consistencia. El próximo mes quién sabe qué vendrá. Si te encanta observar, abre Qwen Chat y prueba las indicaciones que compartí. Comience con poco simple como colocarse en un nuevo fondo. Luego pase a múltiples ediciones y carteles.
Seguiré probando y compartiendo lo que funciona. Si intenta alguna de estas indicaciones, déjame retener qué resultado obtuvo. A veces la diversión está en las sorpresas.
Inicie sesión para continuar leyendo y disfrutando de contenido curado por expertos.