ИИ-изображения себя за менее чем 10 секунд Аналогично InstantID (но это FLUX) PuLID: Чистая и молниеносная настройка идентификатора с помощью контрастного выравнивания

Введение

PuLID - это инновационный метод настройки идентификатора, не требующий настройки, разработанный для генерации текста в изображение. Включая ветвь Lightning T2I наряду со стандартной диффузионной ветвью, PuLID вносит как контрастные потери выравнивания, так и точные потери идентификатора, минимизируя нарушение исходной модели и обеспечивая высокую точность идентификации. Эксперименты показывают, что PuLID достигает превосходства как в точности идентификации, так и в возможности редактирования. Кроме того, примечательной особенностью PuLID является то, что элементы изображения (например, фон, освещение, композиция и стиль) остаются максимально согласованными до и после вставки идентификатора.

Попробуйте ПУЛИД ДЛЯ ФЛЮКСА Бесплатно

Что происходит в твиттере по поводу Pulid Flux?

Методы

  • Контрастное выравнивание: Благодаря контрастной потере выравнивания и потере идентификатора, PuLID вставляет информацию об идентификаторе, не влияя на поведение исходной модели.
  • Филиал "Молния Т2И: Представляет ветвь Lightning T2I, которая использует методы быстрой выборки для получения высококачественных изображений из чистого шума.
  • Оптимизация потери идентификационных данных: Оптимизирует потери идентификатора в более точных настройках для повышения сходства идентификаторов.

Эксперименты

  • Количественное сравнение: Оценивает достоверность идентификации с помощью косинусного сходства идентификаторов, показывая, что PuLID превосходит существующие методы во всех тестовых наборах и базовых моделях.
  • Качественное сравнение: PuLID достигает высокого сходства с ID при меньшем нарушении оригинальной модели, точно воспроизводя освещение, стиль и расположение оригинальной модели.

Взносы

  1. Предлагается метод PuLID, не требующий настройки, который сохраняет высокую степень сходства идентификаторов и при этом смягчает влияние на поведение исходной модели.
  2. Представляет ветвь Lightning T2I наряду с обычной диффузионной ветвью, включающую контрастные потери выравнивания и потери ID, чтобы минимизировать загрязнение ID-информации в исходной модели, обеспечивая при этом достоверность.
  3. Эксперименты показывают, что PuLID достигает лучших показателей как по точности идентификации, так и по возможности редактирования, и при этом менее инвазивен для модели, что делает его более гибким для практического применения.

Вопросы и ответы