- Wanx 2.1 เป็นโมเดล AI ล้ำสมัยที่พัฒนาโดย Alibaba Cloud ออกแบบมาเพื่อสร้างรูปภาพและวิดีโอคุณภาพสูงจากการป้อนข้อความ นับเป็นความก้าวหน้าครั้งสำคัญในการสร้างเนื้อหาวิดีโอที่ขับเคลื่อนด้วย AI ซึ่งโดดเด่นในการจัดการการเคลื่อนไหวที่ซับซ้อนและปรับปรุงคุณภาพพิกเซล
- Wanx 2.1 โดดเด่นในเรื่องความแม่นยำในการปฏิบัติตามคำแนะนำ และได้รับอันดับสูงสุดในกระดานผู้นำ VBench สำหรับโมเดลสร้างวิดีโอ
- โมเดลนี้รองรับเอฟเฟกต์ข้อความทั้งในภาษาจีนและภาษาอังกฤษ และมีกำหนดเป็นโอเพ่นซอร์สในไตรมาสที่สองของปี 2025 พร้อมด้วยชุดข้อมูลฝึกอบรมและชุดเครื่องมือน้ำหนักเบา
คุณสมบัติหลักของ Wanx 2.1
- นวัตกรรมทางเทคนิค:Wanx 2.1 ใช้กรอบงาน VAE (Variational Autoencoder) และ DiT (Denoising Diffusion Transformer) ที่เป็นกรรมสิทธิ์ ซึ่งช่วยปรับปรุงความสัมพันธ์เชิงเวลาและเชิงพื้นที่ในการสร้างวิดีโอ นอกจากนี้ยังใช้กลไกการให้ความสนใจแบบรอบด้านและการฝึกบริบทที่ยาวนานเป็นพิเศษเพื่อการจัดตำแหน่งข้อความและวิดีโอที่ดีขึ้น
- ผลงาน:เป็นผู้นำในด้านเสถียรภาพทางเวลาและการจัดตำแหน่งทางความหมาย ช่วยให้เกิดการเคลื่อนไหวที่ราบรื่นและการปฏิบัติตามคำสั่งข้อความอย่างแม่นยำ Wanx 2.1 ได้คะแนน 84.7% บนกระดานผู้นำ VBench โดดเด่นในด้านระดับไดนามิก ความสัมพันธ์เชิงพื้นที่ และการโต้ตอบระหว่างวัตถุหลายรายการ
- การสนับสนุนสองภาษา:เป็นโมเดลแรกที่รองรับเอฟเฟกต์ข้อความทั้งภาษาจีนและภาษาอังกฤษ ขยายการใช้งานในอุตสาหกรรมต่างๆ เช่น การโฆษณาและการผลิตวิดีโอสั้น
การเปรียบเทียบกับรุ่นอื่น ๆ
- มิราเคิลวิชั่น V5:ล่าสุดแซง Wanx 2.1 ในการจัดอันดับบางรายการ ซึ่งอาจนำเสนอความสวยงามทางภาพที่เหนือกว่า อย่างไรก็ตาม Wanx 2.1 ยังคงรักษาจุดแข็งในด้านความแม่นยำทางความหมายและความเสถียรของการเคลื่อนไหว
- กูเกิล วีโอ 2:เป็นที่รู้จักในด้านความก้าวหน้าในการสร้างวิดีโอด้วย AI แต่การเปรียบเทียบเฉพาะกับ Wanx 2.1 นั้นมีจำกัด Veo 2 อาจเน้นในด้านต่างๆ ของการสร้างวิดีโอมากขึ้น
- โอเพ่นเอไอ โซระ:มีความสามารถในการสร้างวิดีโอที่สามารถแข่งขันได้ แต่การเปรียบเทียบอย่างละเอียดกับ Wanx 2.1 นั้นยังไม่มีให้ใช้กันทั่วไป Sora อาจโดดเด่นในมิติต่างๆ เช่น ความต่อเนื่องของเรื่องราวหรือรูปแบบทางศิลปะ
- วิดีโอฮันหยวน:อีกโมเดลหนึ่งในพื้นที่การสร้างวิดีโอด้วย AI แต่การเปรียบเทียบโดยตรงกับ Wanx 2.1 นั้นยังค่อนข้างหายาก Hunyuan อาจเน้นไปที่สถานการณ์การใช้งานที่แตกต่างกันหรือแนวทางทางเทคนิค
โครงการริเริ่มโอเพนซอร์ส
การเปิดตัวโอเพ่นซอร์สที่กำลังจะมาถึงของ Wanx 2.1 จะทำให้การเข้าถึงการสร้างวิดีโอ AI คุณภาพสูงเป็นประชาธิปไตย ช่วยให้นักพัฒนาสามารถพัฒนาขีดความสามารถของมัน และอาจขับเคลื่อนความก้าวหน้าอย่างรวดเร็วใน AI หลายโหมดและการสร้างการกระทำของมนุษย์ที่สมจริง
โดยสรุป Wanx 2.1 โดดเด่นในด้านเสถียรภาพทางเวลา การจัดตำแหน่งความหมาย และการรองรับสองภาษา ทำให้เป็นตัวเลือกที่มั่นคงสำหรับแอปพลิเคชันที่ต้องการการสร้างวิดีโอที่แม่นยำจากการป้อนข้อความ แม้ว่าโมเดลอื่นๆ เช่น MiracleVision V5 อาจนำเสนอสุนทรียศาสตร์ที่เหนือกว่า แต่โครงการโอเพนซอร์สของ Wanx 2.1 อาจเพิ่มผลกระทบต่อภูมิทัศน์วิดีโอ AI ได้อีก

 Thai
Thai				 English
English					           Japanese
Japanese					           Korean
Korean					           French
French					           German
German					           Chinese (China)
Chinese (China)					           Chinese (Taiwan)
Chinese (Taiwan)					           Portuguese
Portuguese					           Italian
Italian					           Swedish
Swedish					           Russian
Russian					           Hindi
Hindi					           Arabic
Arabic					           Spanish
Spanish					           Czech
Czech					           Swahili
Swahili					           Romanian
Romanian					           Indonesian
Indonesian					           Norwegian
Norwegian					           Norwegian
Norwegian