Flux è il tool di generazione di immagini A.I. da poco lanciato da Black Forest Labs. Black Forest Labs è una comunità di ricerca sull’intelligenza artificiale generativa, la sua missione è sviluppare e far progredire modelli di apprendimento generativo all’avanguardia per media come immagini e video. Questo team di ricercatori e ingegneri di intelligenza artificiale ha una comprovata esperienza nello sviluppo di modelli in ambienti accademici, industriali e open source. Le innovazioni apportate dalla loro ricerca per la generazione di immagini A.I. includono la creazione di modelli di diffusione latente, lo sviluppo di Stable Diffusion, Stable Diffusion XL , Stable Video Diffusion . La convinzione della community di Black Forest è che rendendo i modelli disponibili a un vasto pubblico, si possano portare vantaggi a tutti, istruire il pubblico e aumentare la fiducia nella sicurezza di questi modelli.
Black Forest Labs ha ricevuto un finanziamento da 31 milioni di $. che vede come investitore principale investitore principale Andreessen Horowitz e altri rinomati esperti nella ricerca sull’intelligenza artificiale e nella creazione di aziende. La missione è quella di portare l’intelligenza artificiale nel campo della generazione di immagini A.I. all’avanguardia dall’Europa a tutti nel mondo, quindi competere con i colossi americani conquistare l’indipendenza in questo campo.
Il comitato consultivo include il Prof. Matthias Bethge pioniere del trasferimento di stile neurale e principale esperto nella ricerca europea sull’intelligenza artificiale aperta. Come primo passo verso un modello stabile che possa fornire uno standard, è stata rilasciata la suite di modelli FLUX.1 che spinge le frontiere della sintesi testo-immagine. Flux.1 è basato su modelli di diffusione avanzati consolidati nella generazione di immagini A.I. come Stable Diffusion XL, offre una qualità delle immagini notevole e finalmente rende possibile la generazione stabile di testo come immagine. Logicamente Flux richiederà più risorse alle vostre macchine per poter funzionare, ma i miglioramenti rispetto ai precedenti modelli saranno evidenti da subito.
Per trovare un equilibrio tra accessibilità e capacità del modello, FLUX.1 è disponibile in tre varianti: FLUX.1 [pro], FLUX.1 [dev] e FLUX.1 [schnell]:
- FLUX.1 [pro]: il meglio di FLUX.1, che offre una generazione di immagini dalle prestazioni all’avanguardia con prompt following di prima qualità, qualità visiva, dettaglio delle immagini e diversità di output. Questo è utilizzabile tramite il sito di Black Forest Labs e API.
- FLUX.1 [dev]: FLUX.1 [dev] è un modello per applicazioni non commerciali. Distillato direttamente da FLUX.1 [pro], FLUX.1 [dev] ottiene qualità simile e capacità di aderenza rapida, pur essendo più efficiente di un modello standard delle stesse dimensioni. I pesi FLUX.1 [dev] sono disponibili su HuggingFace e possono essere provati direttamente su Replicate o Fal.ai.
- FLUX.1 [schnell]: il modello più veloce è pensato per lo sviluppo locale e l’uso personale. FLUX.1 [schnell] è disponibile apertamente con licenza Apache2.0. Disponibile su Hugging Face e il codice di inferenza può essere trovato su GitHub e in Diffusers di HuggingFace.
Requisiti Tecnici per Flux
I requisiti tecnici per eseguire Flux e Black Forest dipendono in gran parte dalla configurazione del proprio PC o Mac e dalla risoluzione e complessità delle immagini che si intende generare.
Requisiti minimi per PC:
- Sistema Operativo: Windows 10 (64 bit) o Linux
- CPU: Intel i5 o equivalente
- GPU: NVIDIA GTX 1060 (6GB VRAM)
- RAM: almeno 16 GB
- Spazio su Disco: almeno 20 GB per l’installazione del software e dei modelli
Requisiti minimi per Mac:
- Sistema Operativo: macOS 12.0 Monterey o successivo
- Chipset: Apple Silicon M1 o successivi
- RAM: almeno 16 GB
- Spazio su Disco: almeno 20 GB
Requisiti Raccomandati (per performance ottimali):
- GPU: NVIDIA RTX 2070 o superiore (per PC) o Apple M2 Pro (per Mac)
- RAM: 32 GB o superiore
- Spazio su Disco: 50 GB o superiore (per modelli aggiuntivi e risorse grafiche)
Interfacce GUI per Flux e Black Forest
Esistono diverse interfacce grafiche (GUI) che permettono di usare Flux e Black Forest senza dover interagire con il terminale. Alcune delle più comuni includono:
- Automatic1111: un’interfaccia avanzata e ricca di funzionalità che supporta facilmente vari modelli di intelligenza artificiale, tra cui Stable Diffusion e modelli personalizzati come Flux e Black Forest.
- InvokeAI: offre un’interfaccia utente intuitiva e un’esperienza più semplice, particolarmente adatta a chi si avvicina per la prima volta al mondo della generazione di immagini AI.
- ComfyUI: orientata a utenti esperti, questa interfaccia permette di creare flussi di lavoro personalizzati e di sfruttare la potenza di Flux e Black Forest in combinazione con altri modelli.
Risorse utili:
https://huggingface.co/