Meta imezindua Sora yake kabla ya OpenAI - Meta Movie Gen


Meta Movie Gen ina kila kitu ambacho Sora anacho, ikijumuisha uwezo wa kuunda video ndefu za HD zenye uwiano tofauti wa vipengele na usaidizi wa 1080p, sekunde 16 na fremu 16 kwa sekunde.
Pia hufanya kile ambacho Sora haifanyi, kuzalisha muziki wa usuli unaoandamana na athari za sauti, kuhariri video kulingana na maagizo ya maandishi, na kutoa video zilizobinafsishwa kulingana na picha zilizopakiwa na mtumiaji.

Wacha tuone nini kinaweza kufanya meta:

 Kamera iko nyuma ya mtu. Mwanaume hana shati, amevaa kitambaa cha kijani kiunoni. Hana viatu. Akiwa na kitu chenye moto katika kila mkono, huunda mwendo wa mviringo mpana. Bahari tulivu iko nyuma. Mazingira ni ya kustaajabisha, pamoja na ngoma ya moto.

Dubu wa koala mwenye manyoya ya kijivu na meupe na pua ya pande zote anateleza kwenye ubao wa kuteleza wa manjano. Koala ameshikilia ubao wa kuteleza kwa mawimbi kwa makucha yake na ana sura ya uso iliyolengwa anapopanda mawimbi. Jua linawaka.
Tumbili mwenye uso nyekundu na manyoya meupe anafurahia kuloweka kwenye chemchemi ya asili ya maji moto. Tumbili anayecheza anajiburudisha kwa mashua ndogo ya mbao, iliyo na tanga nyeupe na usukani mdogo. Chemchemi ya maji ya moto iko katikati ya kijani kibichi, ikizungukwa na mawe na miti.

Kuweka tu "kuweka mwanga juu ya Bubbles mbinguni" inaweza kuunda athari nzuri za kuona, na wakati huo huo kuonyesha kikamilifu vitu vilivyo kwenye eneo, na wakati huo huo inaweza kutafakari kwa uzuri anga, kuangalia zaidi kuelezea.

Ngurumo hupasuka kwa sauti kubwa, ikifuatana na wimbo wa muziki wa orchestra.

Uthabiti wa tabia ni nguvu sana.

Unaweza kuhariri video moja kwa moja, kwa kuandika tu maandishi.

Unda athari za sauti na nyimbo za sauti Ingiza maandishi tu

Tumia ingizo la video na maandishi kutengeneza sauti ya video yako. Movie Gen hukuwezesha kuunda na kupanua madoido ya sauti, muziki wa usuli, au nyimbo zote za sauti.


Meta inasema ni Miundo ya juu zaidi ya Media Foundation hadi sasa'.



Wengine wanasema ni vigumu kufikiria jinsi video ndefu na fupi zitakavyokuwa katika miaka michache kwani idadi kubwa ya watayarishi hujifunza kutumia zana za kuhariri video za AI.
Wakati huu, tofauti na Sora, ambayo ina onyesho na blogi rasmi pekee, Meta imeweka hadharani maelezo ya usanifu na mafunzo katika karatasi yenye kurasa 92.

https://arxiv.org/pdf/2410.02746


Lakini modeli yenyewe bado haijawa wazi, na ilikutana na wahandisi wenye uso wa kukumbatiana wakiweka nyuso zao hewani na kuacha kiunga cha ukurasa wa nyumbani wa chanzo wazi wa Meta moja kwa moja kwenye sehemu ya maoni:
Hapa tunakusubiri sasa.


Katika karatasi yake, Meta inasisitiza haswa kwamba kuongeza ukubwa wa data, saizi ya kielelezo, na hesabu ya mafunzo ni muhimu kwa kufunza miundo mikubwa ya uzalishaji wa media. Kwa kuboresha vipimo hivi kwa utaratibu, inawezekana kutengeneza mfumo wa kizazi wa vyombo vya habari wenye nguvu.
Mojawapo ya hoja zinazohusika zaidi ni kwamba wakati huu walitupilia mbali kabisa modeli ya uenezaji na kazi ya kupoteza uenezaji, kwa kutumia Transformer kama mtandao wa uti wa mgongo na Flow Matching kama lengo la mafunzo.




Nafasi ya kutengeneza video ya AI imekuwa na shughuli nyingi katika siku chache zilizopita.


Muda mfupi kabla ya Meta kuzindua Movie Gen, Tim Brooks, mmoja wa waundaji wa OpenAI Sora, aliruka Google DeepMind ili kuendelea na kazi yake ya kutengeneza video na viigaji vya ulimwengu.
Hili lilifanya watu wengi wafikirie, kama vile tu wakati Google ilipochelewa kutoa programu ya Big Model na waandishi wa Transformer 8 waliondoka kwa wingi.
Sasa OpenAI imechelewa kuachilia Sora, na waandishi wakuu pia wamekimbia.
Lakini wengine wanaamini kuwa chaguo la Tim Brooks kuondoka sasa linaweza kuonyesha kuwa kazi yake kuu huko OpenAI imekamilika, na imesababisha uvumi:
Uzinduzi wa Meta ulilazimisha OpenAI kumwachilia Sora ili kujibu?
(Kufikia hili, muundaji mwingine wa Sora, Bill Peebles, bado hajazungumza.)
Sasa Meta imetoa miundo yenye uwezo wa kuhariri video, pamoja na sasisho la Oktoba 1 Pika 1.5, ambalo linalenga katika kuongeza athari za fizikia kama vile kuyeyuka, kupanua, na kubana kwa vitu kwenye video.
Si vigumu kuona kwamba nusu ya pili ya utengenezaji wa video za AI itaanza kuelekea kwenye uhariri wa video wa AI.