• Wanx 2.1 เป็นโมเดล AI ล้ำสมัยที่พัฒนาโดย Alibaba Cloud ออกแบบมาเพื่อสร้างรูปภาพและวิดีโอคุณภาพสูงจากการป้อนข้อความ นับเป็นความก้าวหน้าครั้งสำคัญในการสร้างเนื้อหาวิดีโอที่ขับเคลื่อนด้วย AI ซึ่งโดดเด่นในการจัดการการเคลื่อนไหวที่ซับซ้อนและปรับปรุงคุณภาพพิกเซล
  • Wanx 2.1 โดดเด่นในเรื่องความแม่นยำในการปฏิบัติตามคำแนะนำ และได้รับอันดับสูงสุดในกระดานผู้นำ VBench สำหรับโมเดลสร้างวิดีโอ
  • โมเดลนี้รองรับเอฟเฟกต์ข้อความทั้งในภาษาจีนและภาษาอังกฤษ และมีกำหนดเป็นโอเพ่นซอร์สในไตรมาสที่สองของปี 2025 พร้อมด้วยชุดข้อมูลฝึกอบรมและชุดเครื่องมือน้ำหนักเบา

คุณสมบัติหลักของ Wanx 2.1

  • นวัตกรรมทางเทคนิค:Wanx 2.1 ใช้กรอบงาน VAE (Variational Autoencoder) และ DiT (Denoising Diffusion Transformer) ที่เป็นกรรมสิทธิ์ ซึ่งช่วยปรับปรุงความสัมพันธ์เชิงเวลาและเชิงพื้นที่ในการสร้างวิดีโอ นอกจากนี้ยังใช้กลไกการให้ความสนใจแบบรอบด้านและการฝึกบริบทที่ยาวนานเป็นพิเศษเพื่อการจัดตำแหน่งข้อความและวิดีโอที่ดีขึ้น
  • ผลงาน:เป็นผู้นำในด้านเสถียรภาพทางเวลาและการจัดตำแหน่งทางความหมาย ช่วยให้เกิดการเคลื่อนไหวที่ราบรื่นและการปฏิบัติตามคำสั่งข้อความอย่างแม่นยำ Wanx 2.1 ได้คะแนน 84.7% บนกระดานผู้นำ VBench โดดเด่นในด้านระดับไดนามิก ความสัมพันธ์เชิงพื้นที่ และการโต้ตอบระหว่างวัตถุหลายรายการ
  • การสนับสนุนสองภาษา:เป็นโมเดลแรกที่รองรับเอฟเฟกต์ข้อความทั้งภาษาจีนและภาษาอังกฤษ ขยายการใช้งานในอุตสาหกรรมต่างๆ เช่น การโฆษณาและการผลิตวิดีโอสั้น

การเปรียบเทียบกับรุ่นอื่น ๆ

  • มิราเคิลวิชั่น V5:ล่าสุดแซง Wanx 2.1 ในการจัดอันดับบางรายการ ซึ่งอาจนำเสนอความสวยงามทางภาพที่เหนือกว่า อย่างไรก็ตาม Wanx 2.1 ยังคงรักษาจุดแข็งในด้านความแม่นยำทางความหมายและความเสถียรของการเคลื่อนไหว
  • กูเกิล วีโอ 2:เป็นที่รู้จักในด้านความก้าวหน้าในการสร้างวิดีโอด้วย AI แต่การเปรียบเทียบเฉพาะกับ Wanx 2.1 นั้นมีจำกัด Veo 2 อาจเน้นในด้านต่างๆ ของการสร้างวิดีโอมากขึ้น
  • โอเพ่นเอไอ โซระ:มีความสามารถในการสร้างวิดีโอที่สามารถแข่งขันได้ แต่การเปรียบเทียบอย่างละเอียดกับ Wanx 2.1 นั้นยังไม่มีให้ใช้กันทั่วไป Sora อาจโดดเด่นในมิติต่างๆ เช่น ความต่อเนื่องของเรื่องราวหรือรูปแบบทางศิลปะ
  • วิดีโอฮันหยวน:อีกโมเดลหนึ่งในพื้นที่การสร้างวิดีโอด้วย AI แต่การเปรียบเทียบโดยตรงกับ Wanx 2.1 นั้นยังค่อนข้างหายาก Hunyuan อาจเน้นไปที่สถานการณ์การใช้งานที่แตกต่างกันหรือแนวทางทางเทคนิค

โครงการริเริ่มโอเพนซอร์ส

การเปิดตัวโอเพ่นซอร์สที่กำลังจะมาถึงของ Wanx 2.1 จะทำให้การเข้าถึงการสร้างวิดีโอ AI คุณภาพสูงเป็นประชาธิปไตย ช่วยให้นักพัฒนาสามารถพัฒนาขีดความสามารถของมัน และอาจขับเคลื่อนความก้าวหน้าอย่างรวดเร็วใน AI หลายโหมดและการสร้างการกระทำของมนุษย์ที่สมจริง

โดยสรุป Wanx 2.1 โดดเด่นในด้านเสถียรภาพทางเวลา การจัดตำแหน่งความหมาย และการรองรับสองภาษา ทำให้เป็นตัวเลือกที่มั่นคงสำหรับแอปพลิเคชันที่ต้องการการสร้างวิดีโอที่แม่นยำจากการป้อนข้อความ แม้ว่าโมเดลอื่นๆ เช่น MiracleVision V5 อาจนำเสนอสุนทรียศาสตร์ที่เหนือกว่า แต่โครงการโอเพนซอร์สของ Wanx 2.1 อาจเพิ่มผลกระทบต่อภูมิทัศน์วิดีโอ AI ได้อีก