बाइटडांस न्यू रिलीज़ एआई वीडियो मॉडल - अलविदा सोरा, आपका समय बीत चुका है।

अभी, बाइटडांस के ज्वालामुखी इंजन का लॉन्च मूल रूप से समाप्त हो गया है।
मैं इस समय कुछ ज्यादा ही उत्साहित हूं।
हालांकि लॉन्चिंग समाप्त हो गई है, लेकिन मुझे लगता है कि इस समय उद्योग में हलचल मचाने वाली एक नई शुरुआत आधिकारिक तौर पर हो चुकी है।


बाइटडांस ने आधिकारिक तौर पर अपने दो नए AI वीडियो मॉडल जारी किए हैं:


डौबाओ वीडियो जनरेशन - पिक्सेलडांस मॉडल और सीवीड मॉडल।
मैं अगली बार सीवेड मॉडल के बारे में और बात करूँगा। इस बार, मैं इस डौबाओ पिक्सेलडांस मॉडल के बारे में बात करना चाहता हूँ क्योंकि यह इतना शानदार है, इतना शानदार कि मैं इसे पूरे समय विस्मय में देखता रहा।

जिस समय उन्होंने आधिकारिक तौर पर इसकी घोषणा की, इतनी तालियां बजीं कि मुझे लगा कि मैं स्क्रीन से घर की छत उड़ा दूंगा।
वास्तव में, यदि मुझे इस डौबाओ पिक्सेलडांस मॉडल को संक्षेप में बताना हो, तो वह तीन शब्दों में होगा:
पात्रों की जटिल सतत गति, बहु-कैमरा संयोजन वीडियो, और चरम कैमरा नियंत्रण।
समझने में थोड़ा मुश्किल लग रहा है, है न? जल्दी मत करो, मैं विस्तार से समझाऊंगा।

मैंने पहले कुछ मामले रखे, ताकि इस बात का झटका महसूस किया जा सके:

वास्तव में, फिल्म और टेलीविजन उद्योग पहले, लगभग एआई का उपयोग नहीं कर सकता था, क्योंकि, चरित्र प्रदर्शन बहुत कचरा है, और दृश्य और चरित्र की स्थिरता बहुत खराब है, ईमानदार होने के लिए दर्पण का संचालन अच्छा नहीं है।

अब, बाइटडांस ने कदम बढ़ाया है और एआई वीडियो को एक नए स्तर पर ले गया है।


उद्योग जगत में उथल-पुथल की विलक्षणता आज, इसी लॉन्च के साथ आधिकारिक रूप से सामने आ गई है।
और मैं, पूरे चार दिन तक सांस रोके रखने के बाद, अंततः यह लेख भेज सकता हूँ।
हां, 4 दिन पहले, मुझे बाइटडांस द्वारा आमंत्रित किया गया था, इस डौबाओ पिक्सेलडांस मॉडल को अग्रिम रूप से मापा गया था, उस समय, मैं शब्दों से परे हैरान था, आप जानते हैं, एक ब्लॉगर के रूप में, इस तरह की अहंकारी चीज को मापने के बाद, स्वाभाविक रूप से पहली बार इसे साझा करना चाहते हैं, लेकिन गोपनीयता समझौते के कारण, मैं इसके बारे में केवल एक शब्द नहीं कह सकता।
तो आप जानते ही हैं कि इन चार दिनों में इसे रोक पाना मेरे लिए कितना कठिन था।
और अब सब ठीक हो रहा है। मैं आखिरकार बात कर सकता हूँ।
आइए वापस उन तीन सबसे महत्वपूर्ण विशेषताओं पर आते हैं:
पात्रों की जटिल सतत गतिविधियां, बहु-कैमरा संयोजन वीडियो, और चरम कैमरा नियंत्रण।

पात्र निरंतर क्रिया कर सकते हैं


अतीत में, एआई वीडियो में एक बहुत ही घातक बिंदु था, वह यह कि वे पीपीटी एनीमेशन की तरह दिखते थे।


चाहे वह सोरा का वीडियो हो, या रनवे, या केलिंग, आदि, आंदोलन का आयाम, लेकिन केवल लेंस का आयाम बड़ा है, लोगों की जटिल गति कभी नहीं होती है।
दिन के अंत में, पीछे मुड़ें, या तेज़ दौड़ें, या हाथ हिलाएँ, या गले लगें। ईमानदारी से कहूँ तो सिर्फ़ गले लगना, बहुत से AI वीडियो ऐसा नहीं कर सकते।
और यदि चित्र में दिख रही लड़की अपना चश्मा उतार दे, खड़ी हो जाए और मूर्ति की ओर चले, तो क्या होगा?


सभी एआई वीडियो, सभी एक्शन में मृत।
और इस बार डौबाओ पिक्सेलडांस ने सचमुच ऐसा कर दिखाया।


हाथ पर घड़ी की कुछ छोटी-मोटी झिलमिलाहट के अलावा, चरित्र के अनुपात, चाल, अंग, प्रकाश व्यवस्था आदि लगभग दोषरहित थे।
एक नाटक अच्छा लग रहा है, लोगों की कार्रवाई प्रदर्शन, सबसे महत्वपूर्ण है।
उदाहरण के लिए, द किंग ऑफ़ कॉमेडी में, आखिरी सीन में, स्टीफन चाउ के यिन तियान शियू, लियू पियाओ पियाओ को क्लासिक "मैं आपका समर्थन करूंगा" लाइन चिल्लाने के बाद, लियू पियाओ पियाओ प्रस्थान करने वाली टैक्सी में बैठती है और बहुत दुखी होकर रोती है, कुछ देर के लिए अपने हाथ में पैसे और घड़ी को देखती है, फिर उन्हें अपने बैग में रखती है, और "सेल्फ-कल्टीवेशन ऑफ़ एक्टर्स" पुस्तक निकालती है, जिसे वह अपना विश्वास मानती है, और बहुत दुखी होकर रोती है। सेल्फ-कल्टीवेशन ऑफ़ द एक्टर, और उसे उदास होकर अपने सीने से लगा लेती है।
यह प्रदर्शन निरंतर है। जो निरंतर है उसमें तनाव है। यह तभी संभव है जब आप इसे महसूस कर सकें, यह दर्दनाक भावना है।

और अब, एआई के साथ, ऐसे चरित्र प्रदर्शन उत्पन्न करना जो निरंतर क्रियाएं कर सकें, अब खोखली बात नहीं रह गई है।


एक अन्य मामले पर गौर करें, जहां एक पुरुष कॉफी का घूंट लेता है, फिर उसे नीचे रख देता है और एक महिला पीछे से उसके पास आती है।

इसके अलावा, चरित्र के हाव-भाव भी शानदार हैं, बूढ़ा आदमी मुस्कुराता है और हंसता है, फिर रोता है।


मैं भी सचमुच रोना चाहता हूं।
जब मैंने पिछले साल अगस्त में वांडरिंग अर्थ 3 का ट्रेलर बनाया था, तो मैंने एआई द्वारा चरित्र अभिनय की लाखों संभावनाओं के बारे में कल्पना की थी।
अब, सिर्फ एक साल बाद, डोबाओ ने मुझे इस सबसे बड़े सपने को पूरा करने में मदद की है।

मल्टी-कैमरा संयोजन वीडियो


एक ही छवि + प्रॉम्प्ट से सुसंगत शैली, दृश्य और पात्रों के साथ एक बहु-कैमरा वीडियो बनाने की क्षमता कुछ ऐसी है जिसे मैंने केवल सोरा के प्रोमो में ही देखा है।
यह वह प्रसिद्ध वीडियो है जिसमें एक भेड़िया चाँद की ओर देखकर रो रहा है।


वास्तव में, ईमानदारी से कहा जाए तो यह वीडियो उस समय देखने में बहुत चौंकाने वाला था, लेकिन अब इसे देखना वास्तव में ठीक है; शैली, पात्र और दृश्य इतने सरल हैं कि एकरूपता अच्छी तरह बनी हुई है, और इसमें कोई जटिल कहानी या उपकथानक नहीं है।
लेकिन अभी भी ऐसा कोई AI वीडियो नहीं है जो एक ही वीडियो में कई शॉट ले सके और फिर भी सही स्थिरता रख सके।
LTX स्टूडियो के बारे में तो बात ही मत करो, स्टोरीबोर्ड के लिए तो यह ठीक है, लेकिन फीचर फिल्म के लिए? अपनी बात साफ करो, दृश्यों के बारे में तो बात ही मत करो, पैनोरमिक, मीडियम और क्लोज-अप में किरदारों को एक समान रखना मुश्किल है। और यह वाकई बदसूरत है।
लेकिन अब, डोबाओ पिक्सेलडांस ने यह कर दिखाया है, और इसकी निरंतरता सचमुच अपराजेय है।
और यह केवल एक छवि + प्रॉम्प्ट लेता है।
उदाहरण के लिए, यह.

संकेत: मौत दरांती लेकर महिला के पास आती है। महिला के चेहरे का क्लोज-अप, जब वह डर के मारे चीख रही होती है।


चरम कैमरा नियंत्रण


डोबाओ पिक्सेलडांस मॉडलिंग सबसे अपमानजनक और अद्भुत है जो मैंने कभी देखा है।
अब एआई वीडियो लेंस नियंत्रण, अभी भी मूल रूप से दो कार्यों के कैमरा + गति ब्रश संयोजन पर केंद्रित है, लेकिन ईमानदार होने के लिए, ऊपरी सीमा वास्तव में सीमित है, बहुत सारे बड़े लेंस और ज़ूम, बस नहीं किया जा सकता है।
और डौबाओ पिक्सेलडांस, इसका प्रभाव सचमुच बहुत ही भयानक है।
पक्षी की आंखों के दृश्य को ज़ूम अप और घुमाएं इस तरह के आधार हेरफेर मैं नहीं कहता, कुंजी है, एक शब्द में, चारों ओर विषय के चारों ओर 360 डिग्री की एक किस्म, सामने और पीछे का दृश्य ज़ूम, पैनिंग, लक्ष्य का पालन, जो कुछ भी चीज हो सकती है उसके लेंस को ऊपर उठाना और कम करना।
प्रभाव आश्चर्यजनक रूप से अच्छा है, मैंने पहली बार देखा, एआई वीडियो में, परिवहन दर्पण इतना भयानक, इतना अच्छा हो सकता है।
सीधे मामले को देखो.

संकेत: महिला मुस्कुराती है और अपना सिर नीचे कर लेती है, कैमरा हट जाता है, और एक श्वेत व्यक्ति महिला को देखता है।


ज़ूम अत्यंत स्वाभाविक और सहज है, अजेय, बहुत अजेय।
और फिर यह एक है, 360 डिग्री का जबरदस्त रैप-अराउंड ड्रिब्लर।
संकेत: काले और सफेद शैली में, कैमरा धूप का चश्मा पहने हुए महिला के चारों ओर शूट करता है, उसकी तरफ से सामने की ओर बढ़ता है, और अंत में महिला के चेहरे के क्लोज-अप पर ध्यान केंद्रित करता है।

यह एक तस्वीर है, और फिर एक प्रॉम्प्ट, क्या आप इस पर विश्वास कर सकते हैं? गति की यह सीमा, यह स्थिरता, अपमानजनक मॉडलिंग से बाहर, मैं वास्तव में आश्वस्त हूं।
आप फोटोग्राफरों को अभी भी कैसे खेलने दे सकते हैं, पागल आह...

अंत में लिखें


सोरा एक विशाल वायदा, 2.16th से आजकल तक, किसी भी निशान को देखने के लिए देर हो चुकी है।
और फिर, 6.6, लिंग चुप कर सकते हैं, आधिकारिक तौर पर ऑनलाइन, चीन सोरा के उत्पादन की ओर से।
और आज, 9.24, बाइटडांस फिर से एआई वीडियो, एक नए स्तर पर धकेल दिया, सोरा के प्रचार वीडियो में एक है, ऊंचाई नहीं देख सकता है।
अभी तक चीन को सोरा की जरूरत नहीं है, दोबाओ मॉडल ही आकाश है।
डौबाओ पिक्सेलडांस को भी सोरा के उपनाम के किसी चीनी संस्करण की आवश्यकता नहीं है, डौबाओ पिक्सेलडांस डौबाओ पिक्सेलडांस है, वह अब एआई वीडियो के दिन हैं।
इस बिंदु पर भी, एआई वीडियो अब एक खिलौना नहीं है, बल्कि एक वास्तविक, फिल्म और टेलीविजन, विज्ञापन, एनीमेशन वर्कफ़्लो में प्रवेश कर सकता है, कुछ नई कल्पना ला सकता है।
यह गोली हमने चलाई थी।
आज यह डौबाओ पिक्सेलडांस मॉडल, उद्यम को परीक्षण के लिए निमंत्रण खोलने के लिए प्राथमिकता देगा, कुछ दिनों में ज्वालामुखी सन्दूक पर, जब सी-उपयोगकर्ता के लिए सपना देखने वाली लाइन पर पूरी तरह से खुला हो, तो कुछ समय तक इंतजार करना पड़ सकता है, आखिरकार, बहुत नया है, उन्होंने कहा कि वे अभी भी मॉडल की क्षमता को अनुकूलित करना चाहते हैं, स्थिर, फिर सीधे उस लाइन पर सपना देखते हैं, पूरी तरह से खुला।
वास्तव में, कभी कोई चमत्कार नहीं हुआ है, सब कुछ कई वर्षों की वर्षा का संचय है, सब कुछ वादे के अनुसार है।
आज, मैं भी यह पंक्ति चिल्ला सकता हूँ:

पिक्सेलडांस द्वारा निर्मित अन्य वीडियो:

अंत में : अब पिक्सेलडांस के लिए आवेदन कैसे करें?

https://console.volcengine.com/ark/region:ark+cn-beijing/experience/vision?type=GenVideo

सबसे पहले अपना खाता पंजीकृत करें:

账号登录-火山引擎 (volcengin.com)

अपने मोबाइल फोन से लॉगिन करें।

यहां पहुंच के लिए आवेदन करें:

अब आपने काम कर दिया है, कृपया उत्तर की प्रतीक्षा करें