ByteDance 最新發布 AI 視頻模型 - 再見 Sora,您的時光已逝。

就在剛才,ByteDance 的 Volcano Engine 發佈會基本上已經結束了。
我現在有點興奮過頭了。
儘管發佈會已經結束,但我覺得,一個顛覆產業的全新開始,在這一刻,已經正式來臨。


ByteDance 正式發佈了他們的兩款全新 AI 視訊模型:


豆寶視訊產生器 - PixelDance 模型和 Seaweed 模型。
下次我會再談談海藻模型。這一次,我想談談這個豆寶 PixelDance 機型,因為它真的太炫、太炫了,我真的是全程都看得目瞪口呆。

當他們正式宣佈這件事的那一刻,全場掌聲雷動,我覺得我要從螢幕上把屋頂給掀翻了。
真的,如果要我總結這個 Doubao PixelDance 機型,那就是三個字:
複雜的角色連續移動、多攝影機組合視訊,以及極端的攝影機控制。
聽起來有點難以理解,不是嗎?不用急,我會詳細解釋。

我先放了幾個箱子,感受一下這東西的震撼:

真的,以前的影視行業,幾乎用不到 AI,就是因為,人物表現太垃圾,場景和人物一致性太差,操作鏡頭說實話也不好。

現在,ByteDance 已經介入,並將 AI 視訊提升到一個全新的層次。


產業顛覆的奇點今天正式來臨,就在這場發佈會上。
而我,在憋了整整 4 天氣之後,終於可以把這篇文章寄出去了。
是的,4天前,我受ByteDance之邀,提前測量了這款豆寶PixelDance機型,當時,我的震撼無以言表,要知道,作為一個博主,測量了這麼屌的東西,自然想第一時間分享出來,但礙於保密協議,我只能隻字不提。
所以你就知道這四天我有多難撐了。
現在我終於明白了我終於可以說話了
回到這三個最重要的功能:
角色的複雜連續動作、多攝影機組合影片,以及極端的攝影機控制。

角色可以進行連續動作


以往的 AI 影片有一個很致命的重點,就是看起來像 PPT 動畫。


無論是 Sora 的影片,還是天橋,或是 Keling 等人的動作幅度,不過是鏡頭幅度大而已,從來沒有複雜的人物動作。
頂峰時刻,轉身,或快跑,或揮手,或擁抱。老實說,光是這個擁抱,就沒有幾個 AI 影片可以做到。
如果你讓照片中的女孩摘下太陽眼鏡,站起來走向雕像呢?


所有的 AI 視訊,都在行動中死亡。
而這次 Doubao PixelDance 真的做到了。


除了手錶有些輕微的閃爍之外,人物的比例、動作、肢體、光線等幾乎完美無瑕。
一出戲好看,人的動作表現,才是最重要的啊。
例如,在《喜劇之王》中,最後一幕,周星馳扮演的尹天仇在對柳飘飘喊出那句經典的 「我養你 」之後,柳飘飘坐在離去的計程車上很傷心地哭了起來,她看了好一會兒手中的錢和手錶,然後把它們放進包裡,又掏出那本被她視為信仰的《演員的自我修養》,很傷心地哭了起來。演員的自我修養》,悲傷地抱在胸前。
這個表演是連續的。連續的才有張力。只有當你能感受到它,那種疼痛的情感。

而現在有了 AI,產生能做連續動作的角色表演不再是空談。


再看另一個案例,一個男人喝了一口咖啡,然後放了下來,一個女人從後面走過來。

此外,人物的表情也很精彩,老頭子笑著笑著就哭了。


我也想哭,真的。
去年八月我為《流浪地球 3》製作預告片時,我幻想了無數種 AI 扮演角色的可能性。
一年後的今天,豆寶幫我實現了這個最大的夢想。

多攝影機組合視訊


從單張圖片 + Prompt 就能產生風格、場景和角色一致的多攝影機影片,我只在 Sora 的宣傳片中見過。
就是那段著名的狼對月嚎叫的影片。


事實上,老實說,這部影片在當時看起來非常震撼,但現在看起來其實也沒什麼問題;影片的風格、人物和場景都非常簡單,一致性保持得很好,也沒有複雜的故事或支線情節。
但就是這樣,現在,仍沒有任何 AI 視訊可以在單一視訊中完成多個鏡頭的拍攝,而且還能保持完美的一致性。
別讓我開始談 LTX 工作室的東西,那用在故事板上還行,但故事片?洗洗你的屁股吧,別說場景了,全景、中景和特寫的人物都很難保持統一。而且真的很難看。
但現在,豆寶 PixelDance 做出來了,一致性簡直無與倫比,真的。
而且只需要一張圖片 + 提示。
例如,這個。

提示:拿著鐮刀的死神走近女人。女人驚恐尖叫時的臉部特寫。


極致的攝影機控制


豆寶 PixelDance 建模是我見過最離譜和最棒的。
現在的AI視頻鏡頭控制,基本上還是集中在攝像頭+動態刷兩種功能的組合上,但說實話,上限真的很有限,很多大鏡頭和變焦,根本做不到。
還有豆寶 PixelDance,效果真他媽的離譜。
什麼鳥瞰放大、旋轉這種基礎操作我就不說了,關鍵是,一句話,各種360度環繞被攝物體、前後景放大、平移、目標跟蹤、升降鏡頭什麼的都可以。
效果出乎意料的好,我第一次看到,在 AI 視訊中,運輸鏡頭可以這麼帥、這麼酷。
直接看箱子。

提示:女人微笑著低下頭,鏡頭拉遠,一個白人男子凝視著女人。


變焦極為自然流暢,無敵,太無敵了。
還有這個 360 度大幅度繞身運球。
提示:黑白風格,攝影機圍著戴太陽眼鏡的女人拍攝,從她的側面移到正面,最後對焦在女人的臉部特寫上。

這是一張圖片,然後是一個提示,你能相信嗎?這個動作範圍,這個穩定性,比他媽的建模出來的還離譜,我真是服了。
你怎麼能讓攝影師還在玩,瘋了啊...

寫在最後


Sora 巨人期貨,從 2.16 日到如今,遲遲未見蹤影。
然後,6.6,可玲沉默了,正式上線,代表中國索拉的輸出。
而今天,9.24,ByteDances 再次將 AI 視頻,推到了一個全新的高度,是一個在 Sora 的宣傳視頻,看不到的高度。
到目前為止,中國不需要索拉,豆寶模式就是天。
豆寶 PixelDance 也不需要任何中文版 Sora 的暱稱,豆寶 PixelDance 就是豆寶 PixelDance,他現在就是 AI 視訊的天。
也正因如此,AI 視訊不再是玩具,而是實實在在的,可以進入影視、廣告、動畫的工作流程,帶來一些新的想像空間。
這槍是我們開的
今天這款豆寶 PixelDance 的機型,會優先向企業開放測試邀請,過幾天就可以上火山方舟了,至於什麼時候上線,夢想向 C 端用戶全面開放,可能還要等一段時間,畢竟太新了,他們表示還要優化優化機型能力,穩定之後,就直接上線,夢想,向全面開放。
真的,從來沒有什麼奇蹟,一切都是多年沉澱的累積,一切如約而至。
今天,我也可以喊出這句話:

由 PixelDance 生成的其他視訊:

At Last : 如何立即申請 PixelDance?

https://console.volcengine.com/ark/region:ark+cn-beijing/experience/vision?type=GenVideo

首先註冊您的帳號 :

帳號登入-火山引擎 (volcengine.com)

使用手機登入。

在此申請存取權限:

現在您已完成,請等待回覆。