- Wanx 2.1 ni muundo wa kisasa wa AI uliotengenezwa na Alibaba Cloud, iliyoundwa kwa ajili ya kutoa picha na video za ubora wa juu kutoka kwa maandishi. Inawakilisha maendeleo makubwa katika uundaji wa maudhui ya kuona yanayoendeshwa na AI, bora katika kushughulikia mienendo tata na kuimarisha ubora wa pikseli.
- Wanx 2.1 inajulikana kwa usahihi wake katika kufuata maagizo na imepata viwango vya juu kwenye ubao wa wanaoongoza wa VBench kwa miundo ya kuzalisha video.
- Muundo huu unaauni madoido ya maandishi katika Kichina na Kiingereza na umewekwa wazi katika robo ya pili ya 2025, pamoja na mkusanyiko wake wa data wa mafunzo na zana nyepesi ya zana.
Sifa Muhimu za Wanx 2.1
- Ubunifu wa Kiufundi: Wanx 2.1 hutumia mfumo wa umiliki wa VAE (Variational Autoencoder) na DiT (Denoising Diffusion Transformer), kuimarisha uhusiano wa muda na anga katika uzalishaji wa video. Pia hutumia utaratibu wa umakini wa muda wote na mafunzo ya muktadha wa muda mrefu zaidi kwa upangaji bora wa maandishi na video.
- Utendaji: Inaongoza kwa utulivu wa muda na usawa wa semantic, kuhakikisha mwendo laini na kuzingatia kwa usahihi maagizo ya maandishi. Wanx 2.1 ilipata 84.7% kwenye ubao wa wanaoongoza wa VBench, ilifanya vyema katika kiwango kinachobadilika, uhusiano wa anga na mwingiliano wa vitu vingi.
- Usaidizi wa Lugha Mbili: Ni mtindo wa kwanza kusaidia athari za maandishi katika Kichina na Kiingereza, kupanua matumizi yake katika tasnia kama vile utangazaji na utengenezaji wa video fupi.
Kulinganisha na Miundo mingine
- MiracleVision V5: Iliipita Wanx 2.1 hivi majuzi katika viwango vingine, ambayo inaweza kutoa urembo bora zaidi wa kuona. Hata hivyo, Wanx 2.1 hudumisha nguvu zake katika usahihi wa kisemantiki na uthabiti wa mwendo
- Google Veo 2: Inajulikana kwa maendeleo yake katika utengenezaji wa video za AI, lakini ulinganisho mahususi kwa Wanx 2.1 ni mdogo. Veo 2 inaweza kuzingatia zaidi vipengele tofauti vya uundaji wa video
- OpenAI Sora: Hutoa uwezo wa kuzalisha video wa ushindani, lakini ulinganisho wa kina na Wanx 2.1 haupatikani kwa wingi. Sora inaweza kufaulu katika vipimo tofauti kama vile mwendelezo wa simulizi au mtindo wa kisanii
- Video ya Hunyuan: Mfano mwingine katika nafasi ya uzalishaji wa video ya AI, lakini ulinganisho wa moja kwa moja na Wanx 2.1 ni haba. Hunyuan inaweza kuzingatia hali tofauti za utumaji au mbinu za kiufundi
Mpango wa Open-Chanzo
Toleo lijalo la chanzo-wazi la Wanx 2.1 litaweka demokrasia ufikiaji wa uzalishaji wa video wa AI wa hali ya juu, kuruhusu wasanidi programu kujenga juu ya uwezo wake na uwezekano wa kuendeleza maendeleo ya haraka katika AI ya aina nyingi na kizazi cha vitendo cha binadamu.
Kwa muhtasari, Wanx 2.1 ina ubora katika uthabiti wa muda, upatanishi wa kisemantiki, na usaidizi wa lugha mbili, na kuifanya kuwa chaguo dhabiti kwa programu zinazohitaji uundaji sahihi wa video kutoka kwa maandishi. Ingawa miundo mingine kama MiracleVision V5 inaweza kutoa urembo wa hali ya juu, mpango wa chanzo huria wa Wanx 2.1 unaweza kuongeza athari zake katika mandhari ya video ya AI.