10 सेकंड से भी कम समय में AI द्वारा आपकी अपनी छवियां प्राप्त करें InstantID के समान (लेकिन यह FLUX है) PuLID: कंट्रास्टिव अलाइनमेंट के माध्यम से शुद्ध और लाइटनिंग ID अनुकूलन

परिचय

PuLID एक अभिनव ट्यूनिंग-मुक्त आईडी अनुकूलन विधि है जिसे टेक्स्ट-टू-इमेज जेनरेशन के लिए डिज़ाइन किया गया है। एक मानक प्रसार के साथ एक लाइटनिंग T2I शाखा को शामिल करके, PuLID विपरीत संरेखण हानि और सटीक आईडी हानि दोनों को पेश करता है, मूल मॉडल में व्यवधान को कम करता है और उच्च आईडी निष्ठा सुनिश्चित करता है। प्रयोगों से पता चलता है कि PuLID आईडी निष्ठा और संपादन योग्यता दोनों में बेहतर प्रदर्शन प्राप्त करता है। इसके अतिरिक्त, PuLID की एक उल्लेखनीय विशेषता यह है कि छवि तत्व (जैसे, पृष्ठभूमि, प्रकाश व्यवस्था, रचना और शैली) आईडी सम्मिलन से पहले और बाद में यथासंभव सुसंगत रहते हैं।

कोशिश फ्लक्स के लिए PuLID मुक्त

पुलिड फ्लक्स के बारे में ट्विटर पर क्या हो रहा है?

तरीकों

  • विपरीत संरेखणविपरीत संरेखण हानि और आईडी हानि के माध्यम से, PuLID मूल मॉडल के व्यवहार को प्रभावित किए बिना आईडी जानकारी सम्मिलित करता है।
  • लाइटनिंग T2I शाखा: एक लाइटनिंग T2I शाखा प्रस्तुत करता है जो शुद्ध शोर से उच्च गुणवत्ता वाली छवियां उत्पन्न करने के लिए तेज़ नमूनाकरण तकनीकों का उपयोग करता है।
  • आईडी हानि का अनुकूलन: आईडी समानता को बढ़ाने के लिए अधिक सटीक सेटिंग में आईडी हानि को अनुकूलित करता है।

प्रयोगों

  • मात्रात्मक तुलना: आईडी कोसाइन समानता का उपयोग करके आईडी निष्ठा का मूल्यांकन करता है, यह दर्शाता है कि PuLID सभी परीक्षण सेटों और आधार मॉडलों में मौजूदा तरीकों से बेहतर प्रदर्शन करता है।
  • गुणात्मक तुलनाPuLID मूल मॉडल में कम व्यवधान उत्पन्न करते हुए उच्च ID समानता प्राप्त करता है, तथा मूल मॉडल की प्रकाश व्यवस्था, शैली और लेआउट को सटीक रूप से पुनः प्रस्तुत करता है।

योगदान

  1. एक ट्यूनिंग-मुक्त विधि, PuLID का प्रस्ताव है, जो मूल मॉडल के व्यवहार पर प्रभाव को कम करते हुए उच्च ID समानता को संरक्षित करता है।
  2. नियमित प्रसार शाखा के साथ-साथ लाइटनिंग T2I शाखा की शुरुआत की गई है, जिसमें मूल मॉडल पर ID सूचना के संदूषण को न्यूनतम करने के लिए कंट्रास्टिव अलाइनमेंट लॉस और ID लॉस को शामिल किया गया है, साथ ही विश्वसनीयता भी सुनिश्चित की गई है।
  3. प्रयोगों से पता चलता है कि PuLID आईडी निष्ठा और संपादन योग्यता दोनों के संदर्भ में अत्याधुनिक प्रदर्शन प्राप्त करता है और मॉडल के लिए कम आक्रामक है, जिससे यह व्यावहारिक अनुप्रयोगों के लिए अधिक लचीला हो जाता है।

पूछे जाने वाले प्रश्न