Images IA de vous-même en MOINS DE 10 secondes Similaire à InstantID (mais c'est FLUX) PuLID : Personnalisation Pure et Lightning ID via l'alignement contrasté

Introduction

PuLID est une méthode innovante de personnalisation d'ID sans réglage conçue pour la génération de texte en image. En incorporant une branche Lightning T2I à côté d'une branche de diffusion standard, PuLID introduit à la fois une perte d'alignement contrastif et une perte d'ID précise, minimisant ainsi les perturbations du modèle d'origine et garantissant une fidélité d'ID élevée. Les expériences démontrent que PuLID atteint des performances supérieures en termes de fidélité d'ID et d'éditabilité. De plus, une caractéristique notable de PuLID est que les éléments de l'image (par exemple, l'arrière-plan, l'éclairage, la composition et le style) restent aussi cohérents que possible avant et après l'insertion de l'ID.

Essayer PuLID pour FLUX Gratuit

Que se passe-t-il sur Twitter à propos de Pulid Flux ?

Méthodes

  • Alignement contrasté:Grâce à la perte d'alignement contrastive et à la perte d'ID, PuLID insère des informations d'ID sans affecter le comportement du modèle d'origine.
  • Branche Lightning T2I:Introduit une branche Lightning T2I qui utilise des techniques d'échantillonnage rapides pour générer des images de haute qualité à partir de bruit pur.
  • Optimisation de la perte d'identité:Optimise la perte d'ID dans un paramètre plus précis pour améliorer la similitude d'ID.

Expériences

  • Comparaison quantitative:Évalue la fidélité de l'ID à l'aide de la similarité cosinus de l'ID, montrant que PuLID surpasse les méthodes existantes sur tous les ensembles de tests et modèles de base.
  • Comparaison qualitative:PuLID atteint une similarité d'identification élevée tout en causant moins de perturbations au modèle d'origine, en reproduisant avec précision l'éclairage, le style et la disposition du modèle d'origine.

Contributions

  1. Propose une méthode sans réglage, PuLID, qui préserve une similarité d'ID élevée tout en atténuant l'impact sur le comportement du modèle d'origine.
  2. Introduit une branche Lightning T2I à côté de la branche de diffusion régulière, incorporant une perte d'alignement contrastée et une perte d'identification pour minimiser la contamination des informations d'identification sur le modèle d'origine tout en garantissant la fidélité.
  3. Les expériences montrent que PuLID atteint des performances de pointe en termes de fidélité d'identification et d'éditabilité et est moins invasif pour le modèle, le rendant plus flexible pour les applications pratiques.

FAQ