Nedávné pokroky v generování textu na obrázek byly řízeny difúzními modely, ale jednofázové modely čelí výzvám v oblasti výpočetní efektivity a zpřesňování detailů obrazu. K vyřešení tohoto problému autoři navrhují CogView3, kaskádový rámec, který zlepšuje šíření textu do obrázku tím, že nejprve vytvoří obrázky s nízkým rozlišením a poté použije super-rozlišení založené na přenosu. Tento přístup vede ke konkurenceschopným výstupům z textu na obrázek a zároveň výrazně snižuje náklady na školení a odvození. Experimentální výsledky ukazují, že CogView3 překonává současný nejmodernější open-source model difúze textu do obrázku, SDXL, o 77,0% v lidských hodnoceních a jeho destilovaná varianta dosahuje srovnatelného výkonu při použití pouze 1/10 inferenčního času.
Umělá inteligence kreslí stále větší objem, komplexní upgrade efektu cogview-3 Plus
Původní poznámky k algoritmu sáčku Poznámky k algoritmu sáčku
27. září 2024 10:01 Peking
Můj kamarád ze Smart Spectrum mi řekl, že jejich nedávný model Vincennes byl znovu a znovu iterován, upgradován z modelu cogview na cogview-3 Plus a tentokrát je naprosto špičkový.
Cogview je podle mého názoru produktem éry předvelkých modelů, před zrodem LLM to modely cogview reprezentované SD zabíjely, ale Čína začíná a navazuje pozdě, často čínský model nerozumí Číňanům a dělá hodně harmonického terénu.
Například 'Squirrel Mandarin Fish

Obrázky jako 'Buddha skáče přes zeď

Obrázky jako 'Oslí maso Hotcakes

Obrázky jako Beer Duck

Kámo řekl, tentokrát je to opravdu jiné, dovolte mi ukázat vám dámu, kterou jsem vytvořil jako první.

Opravdu je takový pocit, z detailů, tahů štětcem, vnímání obrazu, jsou stále lepší a lepší. případě často říkají spoustu nesmyslů, ale konkrétní použití účinku je, jak ze všech dimenzí různých scénářů četných výsledků testů pečlivě zvážit.
Řekl jsem, nechlubte se první, mám také sadu testů předků, ze scény, obsahu, objektivu, stylu, tahů štětcem pokrývají mnoho úhlů, dovolte mi některé mučit.
Oil Painting Prompt: klasická olejomalba zobrazující blonďatou šlechtičnu v nádherných modrých šatech ve stylu olejomalby.
Obrázek
Photo Prompt: klidné horské jezero v černobílém stylu Ansela Adamse, s jezerem odrážejícím okolní borový les. Ranní mlha, zvlněné kopce v dálce a slabé ranní světlo na obloze.

Výzva akvarelu: Hnědé kotě spící tiše schoulené s měkkou nadýchanou srstí, velmi roztomilé, akvarel.

Sketch Prompt: detailní skica tužkou impozantního tygra, stojícího na travnaté pláni, s hustým lesem a horami v pozadí, každá svalová linie zvířete je vyleptaná v živých detailech.

Výzva pastelkou : Dětská kresba rodiny pastelkou, červený dům obklopený zelenou loukou, slunce vysoko na obloze a čtyři usměvavé postavy stojící přede dveřmi a držící se za ruce jako děti.

Výzva k dětské obrázkové knize: stránka dětské obrázkové knihy ilustrace malého chlapce sedícího na Měsíci s otevřenou knihou v ruce, obklopeného oblohou plnou hvězd, noční obloha odhaluje teplo a klid. obrázky
Výzva k návrhu známky: Návrh známky zobrazující orla na lovu s rozlehlou oblohou v pozadí a majestátně rozprostřenými orlími křídly.
