KI-Bilder von sich selbst in WENIGER als 10 Sekunden Ähnlich wie InstantID (aber es ist FLUX) PuLID: Reine und blitzschnelle ID-Anpassung durch kontrastive Ausrichtung

Einführung

PuLID ist eine innovative, abstimmungsfreie ID-Anpassungsmethode, die für die Text-zu-Bild-Generierung entwickelt wurde. Durch die Einbeziehung eines Lightning T2I-Zweigs neben einem Standard-Diffusionszweig führt PuLID sowohl einen kontrastiven Ausrichtungsverlust als auch einen genauen ID-Verlust ein, wodurch Störungen des ursprünglichen Modells minimiert und eine hohe ID-Treue gewährleistet werden. Experimente zeigen, dass PuLID sowohl bei der ID-Treue als auch bei der Editierbarkeit eine überlegene Leistung erzielt. Darüber hinaus ist ein bemerkenswertes Merkmal von PuLID, dass die Bildelemente (z. B. Hintergrund, Beleuchtung, Komposition und Stil) vor und nach dem Einfügen der ID so konsistent wie möglich bleiben.

Versuchen Sie PuLID für FLUX Kostenlos

Was passiert auf Twitter über Pulid Flux?

Methoden

  • Kontrastives Ausrichten: Durch kontrastiven Ausrichtungsverlust und ID-Verlust fügt PuLID ID-Informationen ein, ohne das Verhalten des ursprünglichen Modells zu beeinträchtigen.
  • Zweigstelle Lightning T2I: Einführung eines Lightning T2I-Zweigs, der schnelle Sampling-Techniken verwendet, um aus reinem Rauschen hochwertige Bilder zu erzeugen.
  • Optimierung des ID-Verlusts: Optimiert den ID-Verlust in einer genaueren Einstellung, um die ID-Ähnlichkeit zu verbessern.

Experimente

  • Quantitativer Vergleich: Evaluiert die ID-Treue anhand der ID-Kosinusähnlichkeit und zeigt, dass PuLID die bestehenden Methoden in allen Testsätzen und Basismodellen übertrifft.
  • Qualitativer Vergleich: PuLID erreicht eine hohe ID-Ähnlichkeit bei geringerer Beeinträchtigung des Originalmodells und gibt dessen Beleuchtung, Stil und Layout genau wieder.

Beiträge

  1. schlägt eine abstimmungsfreie Methode, PuLID, vor, die eine hohe ID-Ähnlichkeit beibehält und gleichzeitig die Auswirkungen auf das Verhalten des ursprünglichen Modells abschwächt.
  2. Einführung eines Lightning T2I-Zweiges neben dem regulären Diffusionszweig, der kontrastive Ausrichtungsverluste und ID-Verluste einbezieht, um die Kontamination der ID-Informationen des ursprünglichen Modells zu minimieren und gleichzeitig die Originaltreue zu gewährleisten.
  3. Experimente zeigen, dass PuLID sowohl in Bezug auf die ID-Treue als auch auf die Editierbarkeit den neuesten Stand der Technik erreicht und weniger in das Modell eingreift, wodurch es für praktische Anwendungen flexibler ist.

FAQs