En collaboration avec NVIDIA, Black Forest Labs lance FLUX.2, une nouvelle génération de modèles de création d'images capable de produire localement des visuels photoréalistes en 4 mégapixels sur un simple PC muni d'une carte graphique GeForce RTX. Explications.

Faire tenir un modèle XXL dans la mémoire vidéo d'une carte graphique grand public, en voilà un défi de taille. FLUX.2, la nouvelle famille de modèles de génération d'images de Black Forest Labs, aligne en effet pas moins de 32 milliards de paramètres et réclame jusqu'à 90 Go de VRAM dans sa version brute. Pour rendre exploitable un de ces modèles sur un PC équipé d'une GeForce RTX, NVIDIA a travaillé main dans la main avec le labo allemand et l'outil ComfyUI afin de compresser, streamer et optimiser le modèle… tout en conservant une qualité très proche de la version brute.
Des images de 4 mégapixels qui ne ressemblent pas à de l'IA
La promesse de FLUX.2 est alléchante : supprimer cet aspect artificiel caractéristique qui trahit souvent les images générées par ordinateur. Les modèles délivreraient des images photoréalistes atteignant une définition de 4 mégapixels (soit du 2 048 points par 2 048, ou équivalent), avec une gestion de la physique et des éclairages nettement améliorée.
Au-delà de la simple qualité visuelle, FLUX.2 intègre des outils précieux pour les créateurs. Signalons une capacité à générer du texte propre et lisible pour les infographies, ainsi qu'un contrôle direct des poses pour spécifier la posture exacte d'un sujet. Une fonction multi-référence permet également de conserver une cohérence de style ou de sujet sur plusieurs variations, évitant ainsi les fastidieux réglages de finetuning.
40% de consommation mémoire en moins
Pour que FLUX.2 tourne vraiment sur les GPU GeForce RTX, NVIDIA et Black Forest Labs ont quantifié le modèle en FP8. Concrètement, cette compression intelligente réduirait la consommation de mémoire vidéo (VRAM) de 40% tout en boostant les performances d'autant et sans sacrifier la qualité.
L'intégration se fait directement via l'application populaire ComfyUI. NVIDIA a travaillé avec les développeurs pour améliorer le weight streaming, une fonction qui permet de délester une partie du modèle vers la mémoire système (RAM) lorsque le GPU sature. Bien que cela entraîne une légère perte de vitesse, c'est le prix à payer pour accéder à cette qualité de rendu sur du matériel grand public.
Les modèles sont disponibles dès à présent : il suffit de mettre à jour ComfyUI ou de récupérer les paramètres sur Hugging Face pour transformer votre PC en studio de création ultime. À vous de jouer.
