部落格 - 8PixLabs.com

CogView3-chinese text-to-image Model 還不賴

文字到影像產生的最新進展是由擴散模型所推動，但單階段模型在計算效率和影像細節精細度方面面臨挑戰。為了解決這個問題，作者提出了 CogView3，這是一個串聯框架，可先建立低解析度影像，然後應用基於中繼的超解析度來增強文字到影像的擴散。此方法可產生具有競爭力的文字到影像輸出，同時...

未分類

PortraitGen：

傳統的人像視訊編輯方法常有 3D 效果和時間一致性的問題，而且在渲染品質和效率方面表現不佳。為了解決這些問題，PortraitGen 將人像視訊的每一格提升為統一的動態 3D 高斯場，以確保結構與時間上的一致性。

文字轉影片模式 | PixelDance

PixelDance 是最佳的文字轉影片模式

ByteDance 最新發布 AI 視頻模型 - 再見 Sora，你的時代已經過去。剛才，ByteDance 的 Volcano Engine 發佈會基本上已經結束了，我現在有點興奮過頭了，雖然發佈會結束了，但我覺得，一個顛覆產業的全新開始，在這一刻，正式來臨了。ByteDance 正式發佈了...

文字對文字模式 | Qwen

Qwen2.5 線上免費測試優於 Llama3.1 和 GPT4o

統一千千Qwen下載量突破4000萬，「催生」5萬多個兒童模型。無BS讓首測Qwen在這裡：雲計算「春晚」雲栖大會開幕，通益Qwen大模型再次引爆全場！智事9月19日杭州報道，今天，阿里雲推出全球最強大模型開源...

音訊世代

NotebookLLM-Free 線上

使用 NotebookLLM-Goolge 以自己的方式學習李笑來曾說過，學習英文最好的方法就是使用英文。NotebookLLM-Goolge可以自己製作播客，自己製作的播客是練習英語聽力的最佳材料之一，可以一邊學習一邊練習聽力。但英文...

AI 影像產生

FLUX AI 免費影像產生器

線上試用 Flux.1 DEV 由 Flux AI 所產生的免費圖片 FLUX.1 [dev] 介紹您知道 FLUX.1 [dev] 嗎？由 Black Forest Labs 最新的 AI 奇蹟所創造，是一個 120 億個參數的模型，絕對重新定義了文字到圖片產生的可能性。這個 SOTA 模型不僅是技術上的躍進，也顯示了文字轉圖像的速度有多快。

AI 影像產生