FLUX.2 [dev]

Model Library/FLUX.2 [dev]

Image Gen

ComfyUI

Rectified flow transformer capable of generating, editing and combining images based on text instructions

On-Demand Dedicated 1xRTX PRO 6000 S

Details

Modalities

image

Recommended Hardware

1xRTX PRO 6000 S

Estimated Price

Provider

Black Forest Labs

Family

FLUX

License

FLUX [dev] Non-Commercial License v2.0

Overview

FLUX.2 [dev] is a 32 billion parameter rectified flow transformer developed by Black Forest Labs for text-to-image generation, editing, and composition. The model represents state-of-the-art performance in open text-to-image generation, single-reference editing, and multi-reference editing tasks.

Key Features

Unified Generation and Editing

FLUX.2 [dev] provides a unified approach to image generation and editing without requiring separate models or fine-tuning. The model can:

Generate high-quality images from text descriptions
Edit images based on single reference inputs
Combine and compose images using multiple reference inputs
Maintain consistent characters, objects, and styles across generations

Reference-Based Workflows

Users can reference specific characters, objects, and visual styles directly through the model's multi-modal input system, eliminating the need for traditional fine-tuning or LoRA adapters. This enables consistent character generation and style transfer without additional training steps.

Computational Efficiency

Built using guidance distillation techniques, FLUX.2 [dev] achieves efficient inference while maintaining high output quality. The model operates in bfloat16 precision and supports 4-bit quantization for reduced memory requirements.

Safety Measures

The model incorporates comprehensive safety features including:

Pre-training and post-training safety measures against harmful content
Third-party safety evaluations
Inference-time filtering for NSFW and IP-infringing content
C2PA content provenance metadata for generated images

Architecture

FLUX.2 [dev] is based on a rectified flow transformer architecture with 32 billion parameters. The model processes text prompts alongside optional image references to generate or edit images. Rectified flows provide a direct path between noise and image distributions, enabling efficient sampling with fewer inference steps compared to traditional diffusion models.

Use Cases

Creative and Artistic Applications

Digital art creation with precise style control
Character design with consistent appearance across generations
Concept art and illustration
Visual storytelling with coherent character and scene continuity

Content Creation

Marketing materials and advertisements
Social media content generation
Product visualization and mockups
Editorial imagery

Research and Development

Computer vision research
Image editing algorithm development
Multi-modal model research
Generative AI studies

Professional Workflows

Rapid prototyping for design projects
Reference image creation for traditional artists
Style exploration and iteration
Image composition and editing

Integration Support

FLUX.2 [dev] integrates with popular inference frameworks including Diffusers and ComfyUI, as well as custom implementations. The model typically requires 28-50 inference steps for high-quality outputs.