• Wanx 2.1 adalah model AI mutakhir yang dikembangkan oleh Alibaba Cloud, yang dirancang untuk menghasilkan gambar dan video berkualitas tinggi dari input teks. Model ini merupakan kemajuan signifikan dalam pembuatan konten visual berbasis AI, unggul dalam menangani gerakan kompleks dan meningkatkan kualitas piksel.
  • Wanx 2.1 terkenal karena ketepatannya dalam mengikuti instruksi dan telah mencapai peringkat teratas di papan peringkat VBench untuk model generatif video
  • Model ini mendukung efek teks dalam bahasa Mandarin dan Inggris dan akan menjadi sumber terbuka pada kuartal kedua tahun 2025, bersama dengan kumpulan data pelatihan dan perangkat ringan.

Fitur Utama Wanx 2.1

  • Inovasi Teknis: Wanx 2.1 menggunakan kerangka kerja VAE (Variational Autoencoder) dan DiT (Denoising Diffusion Transformer) yang eksklusif, yang meningkatkan hubungan temporal dan spasial dalam pembuatan video. Ia juga menggunakan mekanisme perhatian omni-temporal dan pelatihan konteks yang sangat panjang untuk penyelarasan teks-video yang lebih baik.
  • Pertunjukan: Ini memimpin dalam stabilitas temporal dan penyelarasan semantik, memastikan gerakan halus dan kepatuhan yang tepat terhadap instruksi teks. Wanx 2.1 mencetak skor 84.7% pada papan peringkat VBench, unggul dalam derajat dinamis, hubungan spasial, dan interaksi multi-objek.
  • Dukungan Bilingual:Ini adalah model pertama yang mendukung efek teks dalam bahasa Mandarin dan Inggris, memperluas aplikasinya dalam industri seperti periklanan dan produksi video pendek

Perbandingan dengan Model Lain

  • Visi Keajaiban V5: Baru-baru ini melampaui Wanx 2.1 dalam beberapa peringkat, berpotensi menawarkan estetika visual yang lebih unggul. Namun, Wanx 2.1 mempertahankan kekuatannya dalam presisi semantik dan stabilitas gerakan
  • Google Veo 2: Dikenal karena kemajuannya dalam pembuatan video AI, tetapi perbandingan spesifik dengan Wanx 2.1 terbatas. Veo 2 mungkin lebih fokus pada berbagai aspek pembuatan video
  • OpenAI Sora: Menawarkan kemampuan pembuatan video yang kompetitif, tetapi perbandingan terperinci dengan Wanx 2.1 tidak tersedia secara luas. Sora mungkin unggul dalam dimensi yang berbeda seperti kontinuitas naratif atau gaya artistik
  • Video Hunyuan: Model lain dalam ruang pembuatan video AI, tetapi perbandingan langsung dengan Wanx 2.1 masih jarang. Hunyuan mungkin fokus pada skenario aplikasi atau pendekatan teknis yang berbeda

Inisiatif Sumber Terbuka

Rilisan sumber terbuka Wanx 2.1 yang akan datang akan mendemokratisasi akses ke pembuatan video AI berkualitas tinggi, yang memungkinkan pengembang untuk membangun kemampuannya dan berpotensi mendorong kemajuan pesat dalam AI multimodal dan pembuatan tindakan manusia yang realistis.

Singkatnya, Wanx 2.1 unggul dalam stabilitas temporal, penyelarasan semantik, dan dukungan dwibahasa, menjadikannya pilihan yang tangguh untuk aplikasi yang memerlukan pembuatan video yang presisi dari masukan teks. Sementara model lain seperti MiracleVision V5 mungkin menawarkan estetika yang lebih unggul, inisiatif sumber terbuka Wanx 2.1 dapat lebih meningkatkan dampaknya dalam lanskap video AI.