博客-8PixLabs.com

CogView3-Chinese 文本到图像模型还不错

文本到图像生成的最新进展是由扩散模型推动的，但单级模型在计算效率和图像细节细化方面面临挑战。为了解决这个问题，作者提出了 CogView3，这是一个级联框架，通过首先创建低分辨率图像，然后应用基于中继的超分辨率来增强文本到图像的扩散。这种方法能产生有竞争力的文本到图像输出，同时...

未分类

肖像权

多模态生成先验赋予人像视频编辑功能传统的人像视频编辑方法往往在三维效果和时间一致性方面存在问题，在渲染质量和效率方面也表现不佳。为了解决这些问题，PortraitGen 将人像视频的每一帧提升为统一的动态 3D 高斯场，从而确保了结构和时间上的一致性。

文本到视频模式|像素舞

PixelDance 是最佳文本到视频模式

ByteDance 新发布的人工智能视频模型 - 再见索拉，你的时代已经过去。刚才，ByteDance 的 Volcano Engine 发布会已经基本结束了。我现在有点兴奋过头了。虽然发布会已经结束，但我觉得一个颠覆行业的全新开端已经在这一刻正式到来。ByteDance 正式发布了...

文本到文本模式|Qwen

Qwen2.5 免费在线测试优于 Llama3.1 和 GPT4o

同人千千Q文下载量突破4000万，"催生 "5万多童模。这里没有BS让首测Qwen：云计算 "春晚 "云栖大会开幕，通证Qwen大模型再次引爆全场！智东西9月19日杭州报道，今天，阿里云推出全球最强开源大模...

音频生成

笔记本LLM-免费在线

使用 NotebookLLM-Goolge 以自己的方式学习李笑来曾经说过，学习英语的最好方法是使用英语。 NotebookLLM-Goolge 可以制作自己的播客自己制作的播客是练习英语听力的最佳材料之一，因此您可以同时学习和练习听力。但是英语……

人工智能图像生成

FLUX AI 免费图像生成器

在线试用 Flux.1 DEV 由 Flux AI 生成的免费图像 FLUX.1 [dev] 简介你知道 FLUX.1 [dev] 吗？它由黑森林实验室最新的人工智能奇迹创造，是一个 120 亿参数的模型，绝对重新定义了文本到图像生成的可能性。这个 SOTA 模型不仅是技术上的飞跃，而且标志着文字到图像生成技术的飞速发展。

人工智能图像生成