मेटा ने ओपनएआई से पहले ही अपना सोरा लॉन्च कर दिया है – मेटा मूवी जेन


मेटा मूवी जेन में वह सब कुछ है जो सोरा में है, जिसमें विभिन्न पहलू अनुपातों के साथ लंबे एचडी वीडियो बनाने की क्षमता और 1080p, 16 सेकंड और 16 फ्रेम प्रति सेकंड का समर्थन शामिल है।
यह वह कार्य भी करता है जो सोरा नहीं करता, जैसे पृष्ठभूमि संगीत और ध्वनि प्रभाव उत्पन्न करना, पाठ आदेशों के आधार पर वीडियो संपादित करना, तथा उपयोगकर्ता द्वारा अपलोड की गई छवियों के आधार पर व्यक्तिगत वीडियो तैयार करना।

आइये देखें कि मेटा क्या कर सकता है:

 कैमरा एक आदमी के पीछे है। आदमी शर्टलेस है, कमर पर हरा कपड़ा बाँधे हुए है। वह नंगे पैर है। दोनों हाथों में आग की कोई वस्तु लेकर वह व्यापक गोलाकार हरकतें कर रहा है। पृष्ठभूमि में शांत समुद्र है। आग के नृत्य के साथ माहौल मंत्रमुग्ध कर देने वाला है।

भूरे और सफ़ेद फर और गोल नाक वाला एक रोएँदार कोआला भालू पीले रंग के सर्फ़बोर्ड पर सर्फ़िंग कर रहा है। कोआला अपने पंजों से सर्फ़बोर्ड को पकड़े हुए है और लहरों पर सवारी करते हुए उसके चेहरे पर एकाग्र भाव है। सूरज चमक रहा है।
सफ़ेद फर वाला एक लाल चेहरे वाला बंदर प्राकृतिक गर्म पानी के झरने में नहाकर आनंद ले रहा है। चंचल बंदर एक छोटी लकड़ी की नाव के साथ खुद का मनोरंजन कर रहा है, जिसमें सफ़ेद पाल और एक छोटी पतवार लगी हुई है। गर्म पानी का झरना हरे-भरे पेड़ों और चट्टानों से घिरा हुआ है।

सीधे शब्दों में कहें तो "आकाश में बुलबुले पर प्रकाश डालें" सुंदर दृश्य प्रभाव पैदा कर सकता है, और साथ ही दृश्य में वस्तुओं को पूरी तरह से दिखा सकता है, और साथ ही साथ आकाश को खूबसूरती से प्रतिबिंबित कर सकता है, और अधिक अभिव्यंजक दिख सकता है।

जोर से बिजली कड़कती है, साथ में आर्केस्ट्रा का संगीत भी बजता है।

चरित्र की स्थिरता बहुत मजबूत है।

आप केवल टेक्स्ट टाइप करके सीधे वीडियो संपादित कर सकते हैं।

ध्वनि प्रभाव और साउंडट्रैक बनाएं बस पाठ इनपुट करें

अपने वीडियो के लिए ऑडियो बनाने के लिए वीडियो और टेक्स्ट इनपुट का उपयोग करें। मूवी जेन आपको ध्वनि प्रभाव, पृष्ठभूमि संगीत या संपूर्ण साउंडट्रैक बनाने और विस्तारित करने की सुविधा देता है।


मेटा का कहना है कि यह अब तक का सबसे उन्नत मीडिया फाउंडेशन मॉडल है।



कुछ लोगों का कहना है कि यह कल्पना करना कठिन है कि कुछ वर्षों में लंबे और छोटे वीडियो कैसे दिखेंगे, क्योंकि बड़ी संख्या में निर्माता एआई वीडियो संपादन टूल का उपयोग करना सीख रहे हैं।
इस बार, सोरा के विपरीत, जिसमें केवल एक डेमो और एक आधिकारिक ब्लॉग है, मेटा ने 92-पृष्ठ के पेपर में आर्किटेक्चर और प्रशिक्षण विवरण सार्वजनिक कर दिया है।

https://arxiv.org/pdf/2410.02746


लेकिन मॉडल अभी तक ओपन सोर्स नहीं है, और इसे देखकर इंजीनियरों ने अपना चेहरा हवा में उठा लिया और टिप्पणी अनुभाग में सीधे मेटा के ओपन सोर्स होमपेज का लिंक डाल दिया:
अब यहाँ आपका इंतज़ार है।


अपने पेपर में, मेटा ने विशेष रूप से इस बात पर जोर दिया है कि बड़े पैमाने पर मीडिया जनरेशन मॉडल को प्रशिक्षित करने के लिए डेटा आकार, मॉडल आकार और प्रशिक्षण अंकगणित का स्केलिंग महत्वपूर्ण है। इन आयामों में व्यवस्थित रूप से सुधार करके, ऐसा शक्तिशाली मीडिया जनरेशन सिस्टम बनाना संभव है।
सबसे अधिक चिंताजनक बात यह है कि इस बार उन्होंने प्रसार मॉडल और प्रसार हानि फ़ंक्शन को पूरी तरह से हटा दिया, तथा ट्रांसफार्मर को आधार नेटवर्क के रूप में और फ्लो मैचिंग को प्रशिक्षण लक्ष्य के रूप में उपयोग किया।




पिछले कुछ दिनों से एआई वीडियो निर्माण क्षेत्र में काफी हलचल मची हुई है।


मेटा द्वारा मूवी जेन जारी करने से कुछ समय पहले, ओपनएआई सोरा के रचनाकारों में से एक, टिम ब्रूक्स, वीडियो निर्माण और विश्व सिमुलेटर पर अपना काम जारी रखने के लिए गूगल डीपमाइंड में शामिल हो गए।
इससे बहुत से लोग सोचने लगे, ठीक वैसे ही जैसे गूगल ने बिग मॉडल ऐप को जारी करने में देरी की थी और ट्रांसफॉर्मर 8 के लेखक बड़ी संख्या में इसे छोड़ कर चले गए थे।
अब ओपनएआई सोरा को जारी करने में देरी कर रहा है, और मुख्य लेखक भी भाग गए हैं।
लेकिन अन्य लोगों का मानना है कि टिम ब्रुक्स का अभी पद छोड़ने का निर्णय यह संकेत देता है कि ओपनएआई में उनका मुख्य कार्य पूरा हो चुका है, और इससे अटकलें लगाई जाने लगी हैं:
क्या मेटा के प्रक्षेपण ने ओपनएआई को प्रतिक्रिया स्वरूप सोरा जारी करने के लिए बाध्य किया?
(इस लेखन के समय तक, सोरा के अन्य निर्माता, बिल पीबल्स ने अभी तक कुछ नहीं कहा है।)
अब मेटा ने वीडियो संपादन क्षमताओं के साथ मॉडल जारी किए हैं, साथ ही 1 अक्टूबर को पिका 1.5 अपडेट भी जारी किया है, जो वीडियो में वस्तुओं को पिघलाने, फैलाने और निचोड़ने जैसे भौतिकी प्रभावों को जोड़ने पर केंद्रित है।
यह देखना कठिन नहीं है कि एआई वीडियो निर्माण का दूसरा भाग एआई वीडियो संपादन की ओर अग्रसर होने जा रहा है।