Immagini AI di te stesso in MENO DI 10 secondi Simili a InstantID (ma è FLUX) PuLID: Personalizzazione ID Pure e Lightning tramite allineamento contrastivo

Introduzione

PuLID è un innovativo metodo di personalizzazione ID senza sintonizzazione progettato per la generazione di testo in immagini. Incorporando un ramo Lightning T2I insieme a uno standard di diffusione, PuLID introduce sia la perdita di allineamento contrastivo sia la perdita di ID accurata, riducendo al minimo l'interruzione del modello originale e garantendo un'elevata fedeltà ID. Gli esperimenti dimostrano che PuLID raggiunge prestazioni superiori sia in termini di fedeltà ID che di modificabilità. Inoltre, una caratteristica degna di nota di PuLID è che gli elementi dell'immagine (ad esempio, sfondo, illuminazione, composizione e stile) rimangono il più coerenti possibile prima e dopo l'inserimento dell'ID.

Tentativo PuLID per FLUX Gratuito

Cosa sta succedendo su Twitter riguardo Pulid Flux?

Metodi

  • Allineamento contrastivo: Tramite la perdita di allineamento contrastivo e la perdita di ID, PuLID inserisce le informazioni di ID senza influenzare il comportamento del modello originale.
  • Ramo Lightning T2I: Introduce un ramo Lightning T2I che utilizza tecniche di campionamento rapido per generare immagini di alta qualità a partire da rumore puro.
  • Ottimizzazione della perdita di ID: Ottimizza la perdita di ID in un'impostazione più accurata per migliorare la somiglianza degli ID.

Esperimenti

  • Confronto quantitativo: Valuta la fedeltà dell'ID utilizzando la similarità del coseno dell'ID, dimostrando che PuLID supera i metodi esistenti in tutti i set di test e modelli di base.
  • Confronto qualitativo: PuLID consente di ottenere un'elevata somiglianza degli ID, interrompendo al contempo il modello originale e riproducendone accuratamente l'illuminazione, lo stile e il layout.

Contributi

  1. Propone un metodo senza ottimizzazione, PuLID, che preserva un'elevata similarità degli ID, mitigando al contempo l'impatto sul comportamento del modello originale.
  2. Introduce un ramo Lightning T2I accanto al ramo di diffusione regolare, incorporando la perdita di allineamento contrastivo e la perdita di ID per ridurre al minimo la contaminazione delle informazioni di ID sul modello originale, garantendo al contempo la fedeltà.
  3. Gli esperimenti dimostrano che PuLID raggiunge prestazioni all'avanguardia in termini di fedeltà dell'ID e modificabilità ed è meno invasivo per il modello, rendendolo più flessibile per le applicazioni pratiche.

Domande frequenti