نموذج تحويل النص إلى صورة CogView3-الصيني ليس سيئاً

كانت التطورات الحديثة في توليد تحويل النص إلى صورة مدفوعة بنماذج الانتشار، ولكن تواجه النماذج أحادية المرحلة تحديات في الكفاءة الحسابية وتنقيح تفاصيل الصورة. ولمعالجة ذلك، يقترح المؤلفون CogView3، وهو إطار عمل متسلسل يعزز انتشار النص إلى صورة من خلال إنشاء صور منخفضة الدقة أولاً ثم تطبيق دقة فائقة قائمة على الترحيل. وينتج عن هذا النهج مخرجات تنافسية من النص إلى الصورة بينما...