在 10 秒内生成自己的人工智能图像 类似于 InstantID(但它是 FLUX) PuLID:通过对比对齐实现纯粹的闪电式 ID 定制

导言

PuLID 是一种创新的免调整 ID 定制方法,专为文本到图像生成而设计。PuLID 在标准扩散分支的基础上加入了闪电 T2I 分支,从而引入了对比对齐损失和精确 ID 损失,最大限度地减少了对原始模型的破坏,确保了高 ID 保真度。实验证明,PuLID 在 ID 保真度和可编辑性方面都表现出色。此外,PuLID 的一个显著特点是图像元素(如背景、照明、构图和风格)在 ID 插入前后尽可能保持一致。

尝试 用于 FLUX 的 PuLID 免费

关于 Pulid Flux 的 twitter 上发生了什么?

方法

  • 对比对齐:通过对比对齐损失和 ID 损失,PuLID 在不影响原始模型行为的情况下插入了 ID 信息。
  • 闪电 T2I 分部:引入 Lightning T2I 分支,利用快速采样技术从纯噪声中生成高质量图像。
  • 优化 ID 丢失:在更精确的设置中优化 ID 丢失,以提高 ID 相似性。

实验

  • 定量比较:使用 ID 余弦相似度评估 ID 保真度,结果表明,在所有测试集和基础模型中,PuLID 都优于现有方法。
  • 定性比较:PuLID 实现了高度的 ID 相似性,同时减少了对原始模型的干扰,准确地再现了原始模型的照明、风格和布局。

捐款

  1. 提出了一种无需调整的方法--PuLID,它既能保持较高的 ID 相似性,又能减轻对原始模型行为的影响。
  2. 在常规扩散分支的基础上引入 "闪电 T2I "分支,结合对比对齐损失和 ID 损失,在确保保真度的同时,最大限度地减少 ID 信息对原始模型的污染。
  3. 实验表明,PuLID 在 ID 保真度和可编辑性方面都达到了最先进的性能,而且对模型的侵入性较小,使其在实际应用中更加灵活。

常见问题