CogView3-Chinese 文本到图像模型还不错

文本到图像生成的最新进展是由扩散模型推动的,但单级模型在计算效率和图像细节细化方面面临挑战。为了解决这个问题,作者提出了 CogView3,这是一个级联框架,通过首先创建低分辨率图像,然后应用基于中继的超分辨率来增强文本到图像的扩散。这种方法能产生有竞争力的文本到图像输出,同时...

肖像权

肖像权

多模态生成先验赋予人像视频编辑功能 传统的人像视频编辑方法往往在三维效果和时间一致性方面存在问题,在渲染质量和效率方面也表现不佳。为了解决这些问题,PortraitGen 将人像视频的每一帧提升为统一的动态 3D 高斯场,从而确保了结构和时间上的一致性。