CogView3-chinese text-to-image Model 還不賴

文字到影像產生的最新進展是由擴散模型所推動,但單階段模型在計算效率和影像細節精細度方面面臨挑戰。為了解決這個問題,作者提出了 CogView3,這是一個串聯框架,可先建立低解析度影像,然後應用基於中繼的超解析度來增強文字到影像的擴散。此方法可產生具有競爭力的文字到影像輸出,同時...

PortraitGen:

PortraitGen:

傳統的人像視訊編輯方法常有 3D 效果和時間一致性的問題,而且在渲染品質和效率方面表現不佳。為了解決這些問題,PortraitGen 將人像視訊的每一格提升為統一的動態 3D 高斯場,以確保結構與時間上的一致性。