Imágenes de IA de ti mismo en MENOS DE 10 segundos Similar a InstantID (pero es FLUX) PuLID: personalización de identificación pura y Lightning mediante alineación contrastiva

Introducción

PuLID es un innovador método de personalización de ID sin necesidad de ajustes, diseñado para la generación de texto a imagen. Al incorporar una rama Lightning T2I junto con una de difusión estándar, PuLID introduce tanto pérdida de alineación contrastiva como pérdida de ID precisa, lo que minimiza la alteración del modelo original y garantiza una alta fidelidad de ID. Los experimentos demuestran que PuLID logra un rendimiento superior tanto en fidelidad de ID como en capacidad de edición. Además, una característica notable de PuLID es que los elementos de la imagen (por ejemplo, fondo, iluminación, composición y estilo) permanecen lo más consistentes posible antes y después de la inserción de ID.

Intentar PuLID para FLUX Gratis

¿Qué está pasando en Twitter sobre Pulid Flux?

Métodos

  • Alineación contrastiva:A través de la pérdida de alineación contrastiva y la pérdida de identificación, PuLID inserta información de identificación sin afectar el comportamiento del modelo original.
  • Sucursal Lightning T2I:Presenta una rama Lightning T2I que utiliza técnicas de muestreo rápido para generar imágenes de alta calidad a partir de ruido puro.
  • Optimización de la pérdida de identidad:Optimiza la pérdida de identificación en una configuración más precisa para mejorar la similitud de identificación.

Experimentos

  • Comparación cuantitativa:Evalúa la fidelidad de identificación utilizando la similitud del coseno de identificación, lo que demuestra que PuLID supera a los métodos existentes en todos los conjuntos de pruebas y modelos base.
  • Comparación cualitativa:PuLID logra una alta similitud de identificación al mismo tiempo que causa menos interrupciones en el modelo original, reproduciendo con precisión la iluminación, el estilo y el diseño del modelo original.

Contribuciones

  1. Propone un método sin ajuste, PuLID, que preserva una alta similitud de ID al tiempo que mitiga el impacto en el comportamiento del modelo original.
  2. Introduce una rama Lightning T2I junto con la rama de difusión regular, incorporando pérdida de alineación contrastiva y pérdida de ID para minimizar la contaminación de la información de ID en el modelo original y al mismo tiempo garantizar la fidelidad.
  3. Los experimentos muestran que PuLID logra un rendimiento de última generación en términos de fidelidad de identificación y capacidad de edición y es menos invasivo para el modelo, lo que lo hace más flexible para aplicaciones prácticas.

Preguntas frecuentes