Chcete-li generovat obrázky z textových zadání pomocí umělé inteligence Stable Diffusion (SD AI), tento článek vám nabídne snadný a srozumitelný návod, jak na to krok za krokem.
V dnešní době, kdy umělá inteligence zažívá rozmach, by vytváření působivých vizuálů pro blogy, videa, webové stránky a aplikace mělo být cenově dostupné a rychlé. Už není potřeba být profesionálním grafikem nebo umělcem, abyste mohli vytvářet úžasné obrázky, které zaujmou čtenáře, zvýší návštěvnost webu nebo obohatí uživatelský zážitek vašich aplikací.
Technologie generování obrázků pomocí AI může také výrazně zefektivnit vývoj webových a mobilních aplikací, které se zaměřují na grafický design a úpravu obrázků.
Přečtěte si tento článek a zjistěte, jak pohodlně spouštět populární generativní model umělé inteligence pro tvorbu obrázků, Stable Diffusion AI, na vašem počítači s operačním systémem macOS nebo Windows.
Co je to Stable Diffusion AI?
Stable Diffusion AI je pokročilý model umělé inteligence, který se specializuje na zpracování obrazu. Na základě textového zadání dokáže generovat obrázky pomocí různých difuzních modelů. Využívá proces difuze pro iterativní tvorbu obrazových výstupů.
Na rozdíl od jiných generativních AI, které generují obrázky přímo z trénovacích dat, Stable Diffusion používá postupný difuzní proces, kdy se obraz postupně vylepšuje v jednotlivých krocích.
Pokud máte zkušenosti s nástroji AI jako MidJourney, DALL-E, CLIP (Contrastive Language-Image Pre-Training) nebo Playground AI, tak vás Stable Diffusion nadchne. Umožňuje vám vytvářet vizuální obsah od samého základu. Výsledné obrázky dosahují vysoké kvality a jsou vhodné pro použití na webových stránkách, v aplikacích i v marketingových materiálech.
Proč spouštět Stable Diffusion AI lokálně?
Stable Diffusion AI je nástroj s otevřeným zdrojovým kódem. To znamená, že si kdokoliv může stáhnout její model z veřejných úložišť a generovat obrázky samostatně. K dispozici jsou dva způsoby, jak tento nástroj využít:
- Používání online aplikací, které jsou často finančně náročné
- Lokální spouštění na vašem PC nebo Mac, což vám ušetří peníze
Zde jsou hlavní důvody, proč byste měli zvážit spouštění Stable Diffusion AI na vlastním počítači:
- Získáte plnou kontrolu nad autorskými právy k vygenerovanému obsahu. Není potřeba uvádět žádné nástroje ani organizace.
- Můžete vytvářet tisíce obrázků pro komerční i osobní použití, a to zcela zdarma.
- Vyhnete se placení za drahé online služby pro generování obrázků pomocí AI.
- Můžete detailně nastavit konečný vzhled obrázku pomocí mnoha parametrů.
- Obrázky můžete generovat offline, bez nutnosti připojení k internetu.
Snad nejdůležitějším důvodem pro lokální spouštění SD AI je možnost přizpůsobit si trénovací model a ovlivnit výstup. Můžete například využít následující nastavení:
- Zvýšení rozlišení obrázku
- Experimentování s různými možnostmi
- Obnova detailů obličeje
- Vlastní trénování AI modelu
- Nastavení parametrů samplingu
- Generování obrázku z textu
- Transformace obrázku na základě jiného obrázku
- Sloučení několika modelů
- Jemné doladění rozlišení, šířky, výšky a dalších parametrů obrázku
Nyní, když máte základní přehled o SD AI a výhodách lokálního spouštění, podívejme se na návod, jak ji spustit na počítačích s Windows a macOS.
Jak spustit Stable Diffusion AI ve Windows
Nejjednodušší způsob, jak spustit SD AI na vašem PC, je instalace potřebného softwaru a stažení nejnovějšího kontrolního bodu nebo trénovacího modelu AI z veřejného úložiště.
Po získání kontrolního bodu jej propojíte s grafickým uživatelským rozhraním pro Stable Diffusion a můžete začít vytvářet obrázky. Následuje podrobný popis celého procesu, který vám pomůže úspěšně spustit SD AI na první pokus.
Požadavky na PC
Vzhledem k náročnosti generování obrázků pomocí AI, která vyžaduje provádění obrovského množství výpočtů, je nutné používat výkonný počítač. Pro bezproblémový provoz SD AI doporučujeme následující hardwarové specifikace:
- Windows 8, Windows 10 nebo Windows 11
- Vícejádrový 64bitový procesor, například Intel Core i7 12. generace nebo lepší
- 16 GB nebo více RAM typu DDR4 nebo DDR5
- Rychlý NVMe SSD disk pro rychlejší načítání kódu
- Dedikovaná grafická karta NVIDIA nebo Radeon s 8 GB VRAM nebo více
- 4 GB VRAM postačí, ale rychlost zpracování může být nižší
- Připojení k internetu pro aktualizace softwaru
- Účinný systém chlazení procesoru, protože generování a vylepšování obrazu pomocí AI jsou náročné procesy, které produkují velké množství tepla
Stáhněte a nainstalujte Git
Nejprve je potřeba stáhnout a nainstalovat systém pro správu verzí Git. Postupujte podle následujících kroků:
- Přejděte na portál pro stahování Gitu pro Windows.
- Kliknutím na 64bitové nastavení Gitu pro Windows stáhněte instalační soubor.
- Přejděte do složky se staženými soubory a dvakrát klikněte na soubor Git-2.41.0-64-bit.
- Klikněte na tlačítko Spustit a poté na tlačítko Další ve všech oknech dialogu.
- Nechte instalaci dokončit.
- Po dokončení instalace klikněte na tlačítko Dokončit.
Stáhněte a nainstalujte Python
Stable Diffusion používá knihovny Pythonu pro běh svých modelů AI a provádění složitých matematických výpočtů. Proto je nezbytné nainstalovat si nejnovější verzi Pythonu. Postupujte podle následujících kroků:
- Navštivte stránku pro stahování Pythonu pro Windows.
- Klikněte na tlačítko Stáhnout Python 3.XX.X.
- Po dokončení stahování přejděte do složky se staženými soubory.
- Dvakrát klikněte na instalační soubor a zaškrtněte políčko „Add Python.exe to PATH“.
- Klikněte na tlačítko Install Now.
- Po dokončení instalace zavřete okno instalačního programu.
Klonujte Stable Diffusion WebUI do PC
Pro spuštění SD AI na PC potřebujete grafické uživatelské rozhraní (GUI), které usnadňuje tvorbu obrázků a nevyžaduje znalost složitých příkazů Pythonu. S GUI můžete generovat textové obrázky, transformovat obrázky na základě jiných obrázků a upravovat nastavení modelu AI.
Nejprve si vytvořte adresář na disku, kam chcete importovat Stable Diffusion WebUI z GitHubu. Tento adresář bude také sloužit pro ukládání kontrolních bodů SD AI a trénovacích modelů. Přejděte na libovolný disk, klikněte pravým tlačítkem myši a vyberte možnost Nová složka. Přejmenujte ji například na StableDiffusionAI.
Nyní jste připraveni naklonovat webové rozhraní SD AI do této složky pomocí klienta Git a úložiště GitHub. Postupujte následovně:
- V adresáři StableDiffusionAI klikněte pravým tlačítkem a v kontextovém menu zvolte „Git-Bash Here“.
- Tím se otevře okno příkazového řádku klienta Git.
- Přejděte na stránku projektu AUTOMATIC1111/stable-diffusion-webui na GitHubu a klikněte na tlačítko Kód.
- V zobrazeném kontextovém menu klikněte na kartu Lokální a poté na ikonu pro zkopírování do schránky pod kartou HTTPS.
Zkopírovali jste adresu URL projektu webového rozhraní SD AI. Nyní podle následujících kroků naklonujte tento projekt do vašeho PC pomocí klienta Git:
- Přejděte do okna Git-Bash CLI v adresáři StableDiffusionAI.
- Zkopírujte a vložte následující příkaz:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- Stiskněte klávesu Enter. Klient Git začne importovat komponenty webového rozhraní SD AI do vámi vybraného adresáře.
Tím jste úspěšně vytvořili soubory potřebné ke spuštění Stable Diffusion AI pomocí grafického rozhraní.
Stáhněte si modely AI nebo kontrolní body
Nyní potřebujete získat nejnovější trénovací model nebo kontrolní bod Stable Diffusion AI.
- Navštivte oficiální portál kontrolních bodů Stable Diffusion AI na Hugging Face.
- Přejděte dolů do sekce „Download weights“.
- Zde byste měli vidět tyto soubory:
- sd-v1-4.ckpt
- sd-v1-4-full-ema.ckpt
- Klikněte na „sd-v1-4.ckpt“ a stahování začne automaticky.
- Stahování může chvíli trvat, protože model má velikost 4 GB.
- Po dokončení stahování přejděte do adresáře se staženými soubory.
- Zkopírujte soubor „sd-v1-4“ a vložte jej do tohoto adresáře:
StableDiffusionAI > stable-diffusion-webui > models > Stable-diffusion
V tomto okamžiku máte vše připravené ke spuštění Stable Diffusion AI. Dále postupujte podle uvedených kroků pro spuštění webového uživatelského rozhraní a vygenerování prvního obrázku.
Spusťte Stable Diffusion AI
Pro spuštění webového rozhraní SD AI a generování obrázků pomocí difuzních modelů postupujte následovně:
- Přejděte do složky StableDiffusionAI.
- Vyhledejte soubor „webui-user.bat“ a klikněte na něj pravým tlačítkem myši.
- Z nabídky zvolte „Edit“ pro otevření dávkového souboru v programu Poznámkový blok.
- Do souboru v Poznámkovém bloku přidejte následující řádek nad „@echo off“:
git pull
- V menu „Soubor“ zvolte „Uložit“.
- Nyní dvakrát klikněte na soubor „webui-user.bat“ pro otevření příkazového řádku.
- WebUI nyní začne stahovat PyTorch, framework pro hluboké učení.
- Počkejte, dokud se tento proces nedokončí.
- Po dokončení uvidíte v CLI výpis s adresou URL.
- Přejděte v CLI na část s textem „Running on local URL“.
- Zkopírujte zobrazenou IP adresu a vložte ji do adresního řádku webového prohlížeče.
- Stiskněte klávesu Enter pro otevření webového rozhraní SD AI.
Nyní můžete zadat textový příkaz do pole „prompt“ v sekci „txt2img“ a kliknout na „Generate“ pro vygenerování obrázku. Například jsem zadal následující příkaz:
vytvoř obrázek počítače s Windows 11 na stole
Výsledek:
Pro spuštění Stable Diffusion AI je potřeba pokaždé spustit soubor „webui-user.bat“.
Jak spustit Stable Diffusion AI na Macu
Stejný postup lze použít i pro lokální spouštění SD AI na Macu. Nicméně existuje aplikace pro macOS, kterou můžete použít k jednoduššímu spuštění SD AI, a to bez nutnosti provádět všechny kroky, které jsme dělali na PC s Windows. Touto aplikací je DiffusionBee.
Požadavky na Mac
Pro spuštění SD AI na Macu jsou doporučené následující hardwarové konfigurace:
- macOS Monterey (macOS 12.5.1) nebo novější operační systém
- Apple Silicon Mac s čipem M1 nebo M2
- 8 GB nebo více sjednocené paměti
- 8 GB nebo více volného místa na disku pro modely AI a další zpracování souborů
Můžete použít i Mac s procesorem Intel, ale může se objevit snížená rychlost zpracování.
Stáhněte a nainstalujte DiffusionBee
Následuje podrobný návod ke stažení a spuštění DiffusionBee na Macu:
- Otevřete webový prohlížeč Safari a navštivte portál pro stahování DiffusionBee.
- Zobrazí se dvě možnosti ke stažení: macOS Apple Silicon a macOS Intel 64-Bit.
- Vyberte správnou možnost podle konfigurace vašeho Macbooku nebo iMacu.
- V oznámení „Povolit stahování“ klikněte na Povolit.
- Po dokončení stahování klikněte na ikonu Stahování v Safari.
- Dvakrát klikněte na soubor DiffusionBee ve složce Stahování pro otevření instalačního rozhraní.
- Přesuňte ikonu DiffusionBee z levé strany do složky Aplikace na pravé straně.
- V upozornění klikněte na Otevřít.
- DiffusionBee se spustí a začne stahovat potřebné balíčky a soubory.
Po dokončení stahování můžete začít používat SD AI v aplikaci DiffusionBee stejně jako jakoukoli jinou aplikaci na vašem Macu. Toto je jednorázový proces a vyžaduje připojení k internetu. Po stažení všech potřebných balíčků můžete aplikaci DiffusionBee používat offline.
Spusťte Stable Diffusion AI přes DiffusionBee
Když je DiffusionBee připravena přijímat textové nebo obrazové vstupy, zobrazí se následující okno:
Klikněte na kartu „Text to Image“ a zadejte textový příkaz do vstupního pole. Například jsem zadal tento příkaz:
Vytvořte obrázek kočky ležící na klávesnici
Kliknutím na tlačítko „Options“ upravíte parametry výstupního obrázku, jako například:
- Počet obrázků
- Rozlišení
- Seed
- Počet kroků
- Sampler
- A mnoho dalších možností
Po dokončení nastavení klikněte na tlačítko „Generate“. Zobrazí se ukazatel průběhu generování. Po dokončení se zobrazí obrázek, jako je ten níže:
Alternativně můžete AI generátoru obrázků poskytnout trénovací obrázek a textové příkazy pro jeho úpravu. Po kliknutí na „Generate“ získáte kreativní dílo vytvořené pomocí Stable Diffusion AI. Výsledný obrázek se bude lišit od vstupního obrázku, což předchází problémům s autorskými právy při publikování nebo zpeněžování vygenerovaného obsahu.
Závěrečná slova
Nyní už víte, jak lokálně spustit Stable Diffusion AI na počítači s Windows nebo macOS. Tento pokročilý model umělé inteligence můžete použít k vytváření působivých obrázků pro vaše projekty. V dnešní době je obtížné najít bezplatné obrázky pro publikační činnost.
Stable Diffusion vám může pomoci tento problém překonat. Vygenerované obrázky můžete volně používat pro osobní i komerční účely, aniž byste museli kohokoliv uvádět jako autora. Pokud pracujete jako grafik, můžete ušetřit spoustu peněz díky lokálnímu spouštění SD AI a nemusíte platit drahá předplatná webových aplikací.
Další článek se věnuje porovnání MidJourney, Stable Diffusion a Bing Image Creator.