• वानक्स 2.1 अलीबाबा क्लाउड द्वारा विकसित एक अत्याधुनिक एआई मॉडल है, जिसे टेक्स्ट इनपुट से उच्च-गुणवत्ता वाली छवियां और वीडियो बनाने के लिए डिज़ाइन किया गया है। यह एआई-संचालित विज़ुअल कंटेंट निर्माण में एक महत्वपूर्ण उन्नति का प्रतिनिधित्व करता है, जटिल आंदोलनों को संभालने और पिक्सेल गुणवत्ता को बढ़ाने में उत्कृष्टता प्राप्त करता है
  • Wanx 2.1 निर्देशों का पालन करने में अपनी सटीकता के लिए विख्यात है और वीडियो जेनरेटिव मॉडल के लिए VBench लीडरबोर्ड पर शीर्ष रैंकिंग हासिल की है
  • यह मॉडल चीनी और अंग्रेजी दोनों में टेक्स्ट इफ़ेक्ट का समर्थन करता है और इसे 2025 की दूसरी तिमाही में इसके प्रशिक्षण डेटासेट और एक हल्के टूलकिट के साथ ओपन-सोर्स किया जाना है

वानक्स 2.1 की मुख्य विशेषताएं

  • तकनीकी नवाचार: Wanx 2.1 एक मालिकाना VAE (वैरिएशनल ऑटोएनकोडर) और DiT (डेनॉइजिंग डिफ्यूजन ट्रांसफॉर्मर) फ्रेमवर्क का उपयोग करता है, जो वीडियो निर्माण में टेम्पोरल और स्थानिक संबंधों को बढ़ाता है। यह बेहतर टेक्स्ट-वीडियो संरेखण के लिए एक सर्व-कालिक ध्यान तंत्र और अल्ट्रा-लॉन्ग संदर्भ प्रशिक्षण का भी उपयोग करता है
  • प्रदर्शन: यह अस्थायी स्थिरता और अर्थपूर्ण संरेखण में अग्रणी है, जिससे सुचारू गति और पाठ निर्देशों का सटीक पालन सुनिश्चित होता है। Wanx 2.1 ने VBench लीडरबोर्ड पर 84.7% स्कोर किया, जो गतिशील डिग्री, स्थानिक संबंधों और बहु-ऑब्जेक्ट इंटरैक्शन में उत्कृष्ट है
  • द्विभाषी समर्थन: यह चीनी और अंग्रेजी दोनों में पाठ प्रभाव का समर्थन करने वाला पहला मॉडल है, जो विज्ञापन और लघु वीडियो उत्पादन जैसे उद्योगों में इसके अनुप्रयोग का विस्तार करता है

अन्य मॉडलों के साथ तुलना

  • मिरेकलविज़न V5: हाल ही में कुछ रैंकिंग में Wanx 2.1 से आगे निकल गया, संभावित रूप से बेहतर दृश्य सौंदर्य प्रदान करता है। हालाँकि, Wanx 2.1 अर्थपूर्ण सटीकता और गति स्थिरता में अपनी ताकत बनाए रखता है
  • गूगल वीओ 2: AI वीडियो निर्माण में अपनी प्रगति के लिए जाना जाता है, लेकिन Wanx 2.1 से इसकी विशिष्ट तुलना सीमित है। Veo 2 वीडियो निर्माण के विभिन्न पहलुओं पर अधिक ध्यान केंद्रित कर सकता है
  • ओपनएआई सोरा: प्रतिस्पर्धी वीडियो निर्माण क्षमताएं प्रदान करता है, लेकिन Wanx 2.1 के साथ विस्तृत तुलना व्यापक रूप से उपलब्ध नहीं है। सोरा कथात्मक निरंतरता या कलात्मक शैली जैसे विभिन्न आयामों में उत्कृष्टता प्राप्त कर सकता है
  • हुनयुआन वीडियो: एआई वीडियो निर्माण क्षेत्र में एक और मॉडल, लेकिन वानक्स 2.1 से सीधी तुलना दुर्लभ है। हुनयुआन विभिन्न अनुप्रयोग परिदृश्यों या तकनीकी दृष्टिकोणों पर ध्यान केंद्रित कर सकता है

ओपन-सोर्स पहल

वानक्स 2.1 की आगामी ओपन-सोर्स रिलीज़ उच्च-गुणवत्ता वाले एआई वीडियो निर्माण तक पहुंच को लोकतांत्रिक बनाएगी, जिससे डेवलपर्स को इसकी क्षमताओं का निर्माण करने और संभावित रूप से मल्टीमॉडल एआई और यथार्थवादी मानव क्रिया निर्माण में तेजी से प्रगति करने की अनुमति मिलेगी।

संक्षेप में, Wanx 2.1 अस्थायी स्थिरता, अर्थपूर्ण संरेखण और द्विभाषी समर्थन में उत्कृष्ट है, जो इसे टेक्स्ट इनपुट से सटीक वीडियो जनरेशन की आवश्यकता वाले अनुप्रयोगों के लिए एक मजबूत विकल्प बनाता है। जबकि मिरेकलविज़न V5 जैसे अन्य मॉडल बेहतर सौंदर्यशास्त्र प्रदान कर सकते हैं, Wanx 2.1 की ओपन-सोर्स पहल AI वीडियो परिदृश्य में इसके प्रभाव को और बढ़ा सकती है।