- Wanx 2.1 je špičkový model umělé inteligence vyvinutý společností Alibaba Cloud, určený pro generování vysoce kvalitních obrázků a videí z textových vstupů. Představuje významný pokrok ve vytváření vizuálního obsahu řízeného umělou inteligencí, vyniká ve zvládání složitých pohybů a zlepšuje kvalitu pixelů
- Wanx 2.1 je známý svou přesností v následujících instrukcích a dosáhl nejvyššího umístění v žebříčku VBench pro video generativní modely
- Model podporuje textové efekty v čínštině i angličtině a je nastaven jako open source ve druhém čtvrtletí roku 2025, spolu s jeho školicí datovou sadou a odlehčenou sadou nástrojů.
Klíčové vlastnosti Wanx 2.1
- Technické inovace: Wanx 2.1 používá vlastní rámec VAE (Variational Autoencoder) a DiT (Denoising Diffusion Transformer), který zlepšuje časové a prostorové vztahy při generování videa. Využívá také omni-časový mechanismus pozornosti a ultra dlouhé kontextové školení pro lepší zarovnání textu a videa
- Výkon: Vede k časové stabilitě a sémantickému zarovnání, zajišťuje hladký pohyb a přesné dodržování textových pokynů. Wanx 2.1 dosáhl skóre 84,7% na žebříčku VBench, vyniká dynamickým stupněm, prostorovými vztahy a interakcí s více objekty
- Dvojjazyčná podpora: Je to první model, který podporuje textové efekty v čínštině i angličtině a rozšiřuje své uplatnění v odvětvích, jako je reklama a produkce krátkých videí
Srovnání s jinými modely
- MiracleVision V5: Nedávno v některých žebříčcích překonal Wanx 2.1 a potenciálně nabízí vynikající vizuální estetiku. Wanx 2.1 si však zachovává svou sílu v sémantické přesnosti a stabilitě pohybu
- Google Veo 2: Známý pro své pokroky v generování videa AI, ale konkrétní srovnání s Wanx 2.1 jsou omezená. Veo 2 se může více zaměřit na různé aspekty tvorby videa
- OpenAI Sora: Nabízí konkurenceschopné možnosti generování videa, ale podrobné srovnání s Wanx 2.1 není široce dostupné. Sora může vynikat v různých dimenzích, jako je narativní kontinuita nebo umělecký styl
- Hunyuan Video: Další model v prostoru generování videa AI, ale přímé srovnání s Wanx 2.1 je vzácné. Hunyuan se může zaměřit na různé aplikační scénáře nebo technické přístupy
Open-Source iniciativa
Nadcházející open source verze Wanx 2.1 demokratizuje přístup k vysoce kvalitnímu generování AI videa, což vývojářům umožní stavět na jeho schopnostech a potenciálně řídit rychlý pokrok v multimodální AI a realistické generování lidských akcí.
Stručně řečeno, Wanx 2.1 vyniká časovou stabilitou, sémantickým zarovnáním a dvojjazyčnou podporou, což z něj činí robustní volbu pro aplikace vyžadující přesné generování videa z textových vstupů. Zatímco jiné modely, jako je MiracleVision V5, mohou nabídnout vynikající estetiku, iniciativa Wanx 2.1 s otevřeným zdrojovým kódem by mohla dále zvýšit svůj dopad na prostředí AI videa.