Black Forest Labs ha enérgico FLUX.2, su sistema de tiraje y coexistentes de imágenes de segunda coexistentes. FLUX.2 se dirige a flujos de trabajo creativos del mundo actual, como activos de marketing, fotografías de productos, diseños e infografías complejas, con soporte de tiraje de hasta 4 megapíxeles y un cachas control sobre el diseño, los logotipos y la tipografía.
Comunidad de productos FLUX.2 y FLUX.2 (dev)
La clan FLUX.2 albarca API alojadas y pesos abiertos:
- FLUJO.2 (pro) es el nivel de API administrado. Tiene como objetivo una calidad de vanguardia en relación con los modelos cerrados, con un suspensión cumplimiento rápido y un bajo costo de inferencia, y está adecuado en BFL Playground, BFL API y plataformas asociadas.
- FLUX.2 (flexible) expone parámetros como el número de pasos y la escalera de orientación, para que los desarrolladores puedan compensar la latencia, la precisión de la representación del texto y los detalles visuales.
- FLUX.2 (desarrollador) es el punto de control de peso rajado, derivado del maniquí cardinal FLUX.2. Se describe como el maniquí de tiraje y coexistentes de imágenes de peso rajado más poderoso, que combina texto a imagen y tiraje de múltiples imágenes en un solo punto de control, con 32 mil millones de parámetros.
- FLUX.2 (pequeño) es una próxima modificación de Apache 2.0 de código rajado, tamaño extraído del maniquí pulvínulo para configuraciones más pequeñas, con muchas de las mismas capacidades.
Todas las variantes admiten la tiraje de imágenes a partir de texto y múltiples referencias en un solo maniquí, lo que elimina la requisito de perseverar puntos de control separados para la coexistentes y tiraje.
Obra, flujo escondido y FLUX.2 VAE
FLUX.2 utiliza una obra de coincidencia de flujo escondido. El diseño central combina un Maniquí de estilo de visión Mistral-3 24B con un transformador de flujo rectificado que opera sobre representaciones de imágenes latentes. El maniquí de estilo de visión proporciona una pulvínulo semántica y conocimiento del mundo, mientras que la columna vertebral del transformador aprende la estructura espacial, los materiales y la composición.
El maniquí está entrenado para asignar ruidos latentes a imágenes latentes bajo condicionamiento de texto, por lo que la misma obra admite tanto la síntesis como la tiraje impulsadas por texto. Para la tiraje, las latentes se inicializan a partir de imágenes existentes y luego se actualizan bajo el mismo proceso de flujo preservando la estructura.
un nuevo FLUJO.2 VAE define el espacio escondido. Está diseñado para equilibrar la capacidad de estudios, la calidad de la reconstrucción y la compresión, y se publica por separado en Hugging Face bajo una abuso Apache 2.0. Este codificador mecánico es la columna vertebral de todos los modelos de flujo FLUX.2 y igualmente se puede reutilizar en otros sistemas generativos.


Capacidades para flujos de trabajo de producción.
La integración de FLUX.2 Docs y Difusores resalta varias capacidades esencia:
- Soporte de múltiples referencias: FLUX.2 puede combinar hasta 10 imágenes de remisión para perseverar la identidad del personaje, la apariencia del producto y el estilo en todas las producciones.
- Detalle fotorrealista a 4MP: el maniquí puede editar y gestar imágenes de hasta 4 megapíxeles, con texturas, piel, telas, manos e iluminación mejoradas, adecuadas para tomas de productos y casos de uso similares a fotografías.
- Representación robusta de texto y diseño: puede representar tipografías complejas, infografías, memes y diseños de interfaz de usufructuario con texto pequeño y inteligible, lo cual es una afición global en muchos modelos más antiguos.
- Conocimiento mundial y método espacial.: el maniquí está entrenado para una iluminación, perspectiva y composición de ambiente más fundamentadas, lo que reduce los artefactos y la apariencia sintética.


Conclusiones esencia
- FLUX.2 es un transformador de coincidencia de flujo escondido de 32B que unifica texto con imagen, tiraje de imágenes y composición de múltiples referencias en un solo punto de control.
- FLUX.2 (dev) es la modificación de peso rajado, combinada con Apache 2.0 FLUX.2 VAE, mientras que los pesos del maniquí principal utilizan la abuso no comercial FLUX.2-dev con filtrado de seguridad obligatorio.
- El sistema admite coexistentes y tiraje de hasta 4 megapíxeles, representación sólida de texto y diseño y hasta 10 referencias visuales para caracteres, productos y estilos consistentes.
- La inferencia de precisión total requiere más de 80 GB de VRAM, pero los canales cuantificados de 4 bits y FP8 con descarga hacen que FLUX.2 (dev) se pueda utilizar en GPU de 18 GB a 24 GB e incluso en tarjetas de 8 GB con suficiente RAM del sistema.
Notas editoriales
FLUX.2 es un paso importante para la coexistentes visual de peso rajado, ya que combina un transformador de flujo rectificado 32B, un maniquí de estilo de visión Mistral 3 24B y el FLUX.2 VAE en un único canal de entrada fidelidad para texto a imagen y tiraje. Los perfiles claros de VRAM, las variantes cuantificadas y las sólidas integraciones con Difusores, ComfyUI y Cloudflare Workers lo hacen práctico para cargas de trabajo reales, no solo para pruebas comparativas. Esta lectura acerca los modelos de imágenes abiertas a la infraestructura creativa de nivel de producción.
Mira el Detalles técnicos, Peso del maniquí y repositorio. No dudes en consultar nuestra Página de GitHub para tutoriales, códigos y cuadernos. Encima, no dudes en seguirnos en Gorjeo y no olvides unirte a nuestro SubReddit de más de 100.000 ml y suscríbete a nuestro boletín. ¡Esperar! estas en telegrama? Ahora igualmente puedes unirte a nosotros en Telegram.
Michal Sutter es un profesional de la ciencia de datos con una Industria en Ciencias de Datos de la Universidad de Padua. Con una pulvínulo sólida en prospección estadístico, estudios mecánico e ingeniería de datos, Michal se destaca en transfigurar conjuntos de datos complejos en conocimientos prácticos.
