• Wanx 2.1 هو نموذج ذكاء اصطناعي متطور تم تطويره بواسطة Alibaba Cloud، وهو مصمم لإنشاء صور ومقاطع فيديو عالية الجودة من مدخلات النص. إنه يمثل تقدمًا كبيرًا في إنشاء المحتوى المرئي الذي يعتمد على الذكاء الاصطناعي، ويتفوق في التعامل مع الحركات المعقدة وتحسين جودة البكسل
  • تتميز Wanx 2.1 بدقتها في اتباع التعليمات وحققت أعلى التصنيفات على لوحة صدارة VBench لنماذج توليد الفيديو
  • يدعم النموذج تأثيرات النص باللغتين الصينية والإنجليزية ومن المقرر أن يكون مفتوح المصدر في الربع الثاني من عام 2025، إلى جانب مجموعة بيانات التدريب ومجموعة أدوات خفيفة الوزن

الميزات الرئيسية لبرنامج Wanx 2.1

  • الابتكارات التقنية:يستخدم Wanx 2.1 إطار عمل VAE (Variational Autoencoder) وDiT (Denoising Diffusion Transformer) الخاصين به، مما يعزز العلاقات الزمنية والمكانية في إنشاء الفيديو. كما يستخدم آلية انتباه متعددة الأزمنة وتدريب سياقي طويل للغاية لتحسين محاذاة النص والفيديو
  • أداء:إنه رائد في الاستقرار الزمني والمحاذاة الدلالية، مما يضمن الحركة السلسة والالتزام الدقيق بإرشادات النص. حصل Wanx 2.1 على 84.7% على لوحة المتصدرين في VBench، متفوقًا في الدرجة الديناميكية والعلاقات المكانية والتفاعلات بين الكائنات المتعددة
  • دعم ثنائي اللغة:إنه أول نموذج يدعم تأثيرات النص باللغتين الصينية والإنجليزية، مما أدى إلى توسيع نطاق تطبيقه في الصناعات مثل الإعلان وإنتاج مقاطع الفيديو القصيرة

مقارنة مع نماذج أخرى

  • ميراكل فيجن V5:لقد تجاوز مؤخرًا Wanx 2.1 في بعض التصنيفات، مما قد يوفر جماليات بصرية متفوقة. ومع ذلك، يحتفظ Wanx 2.1 بقوته في الدقة الدلالية واستقرار الحركة
  • جوجل فيو 2:يشتهر بتطوراته في إنشاء مقاطع الفيديو باستخدام الذكاء الاصطناعي، ولكن المقارنات المحددة مع Wanx 2.1 محدودة. قد يركز Veo 2 بشكل أكبر على جوانب مختلفة من إنشاء مقاطع الفيديو
  • أوبن إيه آي سورا:يوفر إمكانيات تنافسية لإنشاء مقاطع الفيديو، ولكن المقارنات التفصيلية مع Wanx 2.1 غير متاحة على نطاق واسع. قد يتفوق Sora في أبعاد مختلفة مثل استمرارية السرد أو الأسلوب الفني
  • فيديو هونيوان:نموذج آخر في مجال توليد الفيديو بالذكاء الاصطناعي، لكن المقارنات المباشرة مع Wanx 2.1 نادرة. قد تركز Hunyuan على سيناريوهات تطبيق مختلفة أو مناهج تقنية

مبادرة المصدر المفتوح

سيعمل الإصدار المفتوح المصدر القادم من Wanx 2.1 على إضفاء الطابع الديمقراطي على الوصول إلى إنشاء مقاطع فيديو عالية الجودة باستخدام الذكاء الاصطناعي، مما يسمح للمطورين بالبناء على قدراته ودفع التقدم السريع في الذكاء الاصطناعي المتعدد الوسائط وإنشاء أفعال بشرية واقعية

باختصار، يتميز Wanx 2.1 بالاستقرار الزمني والمحاذاة الدلالية والدعم ثنائي اللغة، مما يجعله خيارًا قويًا للتطبيقات التي تتطلب إنشاء فيديو دقيق من مدخلات النص. وفي حين قد تقدم نماذج أخرى مثل MiracleVision V5 جماليات متفوقة، فإن مبادرة Wanx 2.1 مفتوحة المصدر قد تعزز تأثيرها في مجال الفيديو بالذكاء الاصطناعي.