Fooocus-Tutorial: Vereinfachte stabile Diffusion

Ist einEin kostenloser und Open Source KI-Bildgenerator. Er versucht, stabile Diffusion undVorteile: Open Source, offline, kostenlos, einfach zu bedienen. Fooocus optimiert die Stable Diffusion-Pipeline für exzellente Bilder. Sie sparen Zeit beim Anpassen von Einstellungen und können sich mehr auf die Erstellung Ihrer Wunschbilder konzentrieren.

In diesem Artikel stellen wir vor

  • Vor- und Nachteile von Fooocus
  • So installieren Sie Fooocus
  • Grundlegende Verwendung
  • Den Stil festlegen
  • Upgrade
  • Reparatur und Restaurierung
  • Verwenden von Bildhinweisen

Vor- und Nachteile von Fooocus

Fooocus-Vorteile:

  • Fokus auf Bildoptimierung: Fooocus konzentriert sich auf die Bereitstellung der besten Bildoptimierung und verwendet verschiedene Techniken, um die Bilddateigröße zu reduzieren und gleichzeitig eine hohe Qualität beizubehalten.
  • Mehrere Optimierungsoptionen: Fooocus bietet eine breite Palette an Optimierungsoptionen, darunter verlustbehaftete und verlustfreie Komprimierung, Größenänderung, Zuschneiden und Wasserzeichen.
  • Stapeloptimierung: Mit Fooocus können Benutzer mehrere Bilder stapelweise optimieren, was Zeit spart und die Effizienz steigert.
  • Einfach zu verwenden: Fooocus verfügt über eine benutzerfreundliche Oberfläche, die selbst Anfänger problemlos verwenden können.
  • Optimiert für Web und Mobilgeräte: Fooocus ist für Web und Mobilgeräte optimiert und stellt sicher, dass Bilder auf allen Geräten schnell geladen werden.
  • Unterstützung für mehrere Bildformate: Fooocus unterstützt verschiedene Bildformate, darunter JPEG, PNG, GIF und WebP.
  • Cloud-Hosting: Fooocus ist ein in der Cloud gehosteter Dienst, sodass Benutzer keine Software installieren oder warten müssen.

Fooocus Nachteile:

  • Zahlungspflichtig: Fooocus ist ein kostenpflichtiger Dienst, bietet jedoch eine kostenlose Testversion an.
  • Eingeschränkte Bildbearbeitungsfunktionen: Fooocus konzentriert sich hauptsächlich auf die Bildoptimierung und bietet keine erweiterten Bildbearbeitungsfunktionen.
  • Abhängigkeit von der Internetverbindung: Da es sich bei Fooocus um einen in der Cloud gehosteten Dienst handelt, ist für die Nutzung eine stabile Internetverbindung erforderlich.
  • Leichter Verlust der Bildqualität: In einigen Fällen kann es durch verlustbehaftete Komprimierung zu einem leichten Verlust der Bildqualität kommen.
  • Von Zeit zu Zeit können technische Probleme auftreten: Wie bei jedem Cloud-Dienst können auch bei Fooocus gelegentlich technische Probleme auftreten.

So installieren Sie Fooocus

Mindestsystemanforderungen

Sie benötigen eine Nvidia-Karte mit 8 GB VRAM. Andere Konfigurationen können ebenfalls funktionieren.Mindestanforderungen anzeigenEine vollständige Liste

Windows

Bitte befolgen Sie die nachstehenden Schritte, um Fooocus unter Windows zu installieren.

  1. Auf dieser SeiteLaden Sie die ZIP-Datei herunter.
  2. Legen Sie die Zip-Datei in den Ordner, in dem Sie Fooocus installieren möchten
  3. Klicken Sie mit der rechten Maustaste auf die ZIP-Datei und wählen SieAlles extrahieren...um die Dateien zu extrahieren.
Fooocus-Tutorial: Vereinfachte stabile Diffusion-1

Doppelklickrun.batStarten Sie Fooocus.

Beim ersten Ausführen wird das Modell heruntergeladen.

AMD-GPUs, Mac, Linux und Colab

Sie können auch AMD-GPUs verwenden,Mac,LinuxUndZusammenarbeitInstallieren Sie Fooocus auf.

Fooocus verwenden

Fooocus ist super einfach zu bedienen. Im Standardmodus geben Sie die Eingabeaufforderung ein und drücken"erzeugen". (Strg+Eingabe unter Windows. Cmd+Eingabe auf dem Mac)

ein Drache, Schnee, Mond

Fooocus-Tutorial: Vereinfachte stabile Diffusion-2

Es verwendet das Standardmodell, dasJuggernautXL, eine fein abgestimmteStabile Diffusion XLModell. Es handelt sich um ein Universalmodell, mit dem verschiedene Stile hergestellt werden können.

Schnelle Tipps

Sie müssen keine langen und komplizierten Hinweise wie auf beliebten Bild-Sharing-Seiten schreiben. Fooocus verwendet eine auf GPT-2 basierende Hinweis-Engine.Erweitern Sie Ihre Tipps.

Geben Sie beispielsweise Folgendes ein:

Drache, Schnee, Mond

ein Drache, Schnee, Mond

Unter der Haube erweitert sich die Eingabeaufforderung um die folgende.

Drache, Schnee, Mond, Licht, kompliziert, elegant, scharfer Fokus, schöne Dynamik, sehr detailliert, sehr stilvoll, professionelle feine Details, filmisch, dramatische Umgebung, helle Farben, perfekt, warme Farben, epische Komposition, auffällig, mutig, attraktiv, Elite, am besten, lebendig, klar, stimmig, fortgeschritten, kreativ, schön, künstlerisch, stilvoll, cool, großartig, fantastisch

ein Drache, Schnee, Mond, Licht, kompliziert, elegant, scharfer Fokus, schöne Dynamik, sehr detailliert, sehr glatt, professionelle feine Details, filmisch, dramatische, leuchtende Umgebungsfarben, perfekt, warme Farbe, epische Komposition, auffallend, mutig, attraktiv, Elite, am besten, lebendig, klar, stimmig, fortgeschritten, kreativ, süß, künstlerisch, trendig, cool, großartig, fantastisch

Erweiterte Einstellungen

wählenfortschrittlichDurch das Kontrollkästchen wird das Menü „Erweiterte Einstellungen“ angezeigt.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-3

Leistungseinstellungen

Getreu seiner Designphilosophie sind selbst erweiterte Einstellungen leicht verständlich.

LeistungTeil.

  • Geschwindigkeit: Gut ausbalanciert, es werden 30 Abtastschritte durchgeführt.
  • Qualität: Führen Sie doppelt so viele Sampling-Schritte durch.
  • Extreme Geschwindigkeit:verwendenLCM LoRAReduzieren Sie die Sampling-Schritte.

Wie vom Setup erwartet,GeschwindigkeitUndQualitätDer Unterschied ist nicht signifikant. Beim SDXL-Modell gibt es abnehmende Erträge bei der Ausführung von mehr als 30 Schritten.

Extreme GeschwindigkeitDie Einstellung führt zu Bildern von geringerer Qualität. Dies ist für das LCM-LoRA-Modell zu erwarten.

Nachfolgend finden Sie einen Vergleich der Build-Zeiten auf einem Windows-System mit einer RTX4090-GPU-Karte.

Geschwindigkeit17,3 Sek. (1x)
Qualität25,2 Sekunden (1,5-mal)
Extreme Geschwindigkeit10,4 Sekunden (0,6x)
Zeit zum Generieren von zwei 1024 × 1024-Bildern.

Mir gefällt die Benutzerfreundlichkeit des LCM-LoRA (Extreme Speed). Die Verwendung von LCM-LoRA in .NET erfordert die Änderung der CFG-Skala und des Sampling-Schritts. Und das kann leicht vergessen werden. Fooocus löst all diese Probleme mit einer einzigen Auswahl.

Seitenverhältnis

Fooocus bietet eine umfangreiche Liste mit Bildgrößen zur Auswahl. Interessanterweise gibt es keine Möglichkeit, Bildgrößen in der GUI einzugeben.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-7

Es gibt viele Gründe, warum Sie eine bestimmte Bildgröße verwenden möchten, beispielsweise die Kompatibilität mit stabilen Diffusionsmodellen und Veröffentlichungsanforderungen.

Um Bildauflösungen zur Liste hinzuzufügen, geben Sie einSuchen Sie den Ordner mit dem Namen Fooocus inconfig_modification_tutorial.txtDateien.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-8

Dies ist die Konfigurationsdatei config.txtVorlage.

config.txtUmbenennen inconfig.txt.original.

Kopieren von Dateienconfig_modification_tutorial.txtund benennen Sie es um inconfig.txt.

In einem Texteditor bearbeitenconfig.txt (ich verwende Notepad++).

Die Erläuterung oben streichen.

Fügen Sie die neue Auflösung zur Liste „available_aspect_ratios“ hinzu. Beispiel:

"verfügbare_Seitenverhältnisse": [ "704*1408", "704*1344", "768*1344", "768*1280", "832*1216", "832*1152", "896*1152", "896*1088", "960*1088", "960*1024", "1024*1024", "1024*960", "1088*960", "1088*896", "1152*896", "1152*832", "1200*800", "1216*832", "1280*768", "1344*768", "1344*704", "1408*704", "1472*704", "1536*640", "1600*640", "1664*576", "1728*576" ],

Starten Sie Fooocus neu und Sie sollten die neue Auflösung sehen.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-9

Stil

In Fooocus brauchen Sie nichtDesigntippsum einen bestimmten Stil zu erreichen. Sie erreichen dies über das Menü „Stil“.

Viele voreingestellte Stile!Weitere Informationen finden Sie im SDXL Style GuideViele davon können Sie intuitiv im sehen.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-10

Sie können mehrere Stile kombinieren. Viele davon funktionieren jedoch nur, wenn der Standardstil nicht ausgewählt ist.

Sie können auch hinzufügenNegative Tippsum das Bild zu optimieren. Fügen Sie beispielsweise Schwarzweiß zum Negative Cue hinzu (unter Einstellungen > Negative Cue), um ein Farbbild zu erzeugen.

Modell

Du kannst"Modell"TabCheckpoint-ModellUndLoRA.

Der Modellpfad befindet sich im Ordner Fooocusconfig.txt.

Aktualisieren von Images

So aktualisieren Sie ein Bild in Fooocus:

  1. wählenEingabebildKontrollkästchen.
  2. existieren„Upscale“ oder „Variante“, wählen Sie die gewünschteHigh-End-Optionen.
  3. entsprechenderzeugen.
Fooocus-Tutorial: Vereinfachte stabile Diffusion-16

Bildänderungen

Wie mit den V1/V2/V3/V4-Funktionen von Midjourney können Sie Variationen Ihrer Bilder generieren.

  1. wählenEingabebildKontrollkästchen.
  2. existieren„Upgrade“ oder „Ändern“, wählen Sie die gewünschteOption „Variation“.
  3. entsprechenderzeugen.
Fooocus-Tutorial: Vereinfachte stabile Diffusion-17

Das Folgende sind "subtile Änderungen"Und„Die Veränderungen sind stark“Die Optionen machen einen Unterschied. Es gibt nicht so viele davon.

HINWEIS: Sie können zusätzliche Samen von AUTOMATIC1111 verwendenMöglichkeit zum Erstellen von Bildvarianten.

Bildtipps

Als zusätzliche Hinweise können Sie Bilder verwenden.Beispiel: AUTOMATIC1111Im Gegensatz zu AUTOMATIC1111 müssen Sie die Erweiterung jedoch nicht installieren. Sie ist Teil der Grundfunktionen von Fooocus.

Um einen Bildhinweis zu verwenden, wählen SieEingabebildAktivieren Sie das Kontrollkästchen und wählen SieBildtippsTab.

Laden Sie ein Bild in einen der Bild-Slots hoch.

Möglicherweise müssen Sie auswählenErweitertes Kontrollkästchen, um die Bearbeitung weiterer Einstellungen zu ermöglichen.

Bildtipps

Die Standardoptionen für Bildhinweise sindBildeingabeaufforderung.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-21

Wenn Sie AUTOMATIC1111 verwendet habenControlNet , diese Einstellungen sollten Ihnen bekannt vorkommen.

  • Stoppen Sie bei: Stoppen Sie die Bildaufforderungssteuerung bei bestimmten Abtastschritten. 0,5 bedeutet 30 Abtastschritte, Stopp nach 15 Schritten.
  • Gewicht: Die Stärke der Bildhinweissteuerung.

Durch Erhöhen eines dieser Werte kann die Wirkung der Bildhinweise verbessert werden.

Anwendungstipps:

ein Stuhl, der einer Katze ähnelt

Gewichtungen in Bildhinweisen ändern

Pira Canni

PyraCannyEs handelt sich um eine pyramidenbasierte Canny-Kantenkontrolle. Die hohe Auflösung von SDXL-Bildern kann dazu führen, dass der Standard-Canny-Algorithmus einige Details übersieht. Diese Methode erkennt Kanten in Ebenen mit mehreren Auflösungen.

Wie Canny ControlNetVerwenden Sie PyraCanny, um Kompositionen oder menschliche Posen zu replizieren.

Schnell:

Eine Frau

Laden Sie ein Bild hoch und wählen Sie PyraCanny.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-25

CPDS

CPDSEs handelt sich um eine tiefenbasierte Methode zur Strukturerkennung. Sie repliziert die 3D-Komposition des Bildes, jedoch nicht die Linien.TiefenkontrollnetzEbenso verändert es das Bild stärker.

Siehe das CPDS-Beispiel unten. Es kopiert die Komposition, aber nicht die Gesichtsdetails wie die Frisur und die Blickrichtung.

Gesichtstausch

Face Swap ist wie dieIP-Adapterfläche. Es kopiert das Gesicht im Referenzbild.

Hier ist ein Beispiel. Die Eingabeaufforderung lautet:

eine betende Frau

Mehrere Bildaufforderungen

und ControlNet in AUTOMATIC1111Ebenso können Sie in Fooocus mehrere Bildaufforderungen verwenden.

Verwenden wir eine Eingabeaufforderung mit zwei BildernEin Beispiel zur Veranschaulichung:

  • FaceSwap – Gewicht 0,5, Stopp bei 0,9: Duplizieren Sie das Gesicht.
  • PyraCanny – Gewicht 0,5, Stopp bei 0,5: Kopieren Sie die Pose.
Fooocus-Tutorial: Vereinfachte stabile Diffusion-31
Fooocus-Tutorial: Vereinfachte stabile Diffusion-32

Wenn Sie mehrere Bildhinweise verwenden, sollten Sie die Gewichtungen im Allgemeinen niedrig einstellen. Andernfalls können Artefakte wie beispielsweise seltsame Farben auftreten.

PyraCannyDie Pose lässt sich gut reproduzieren. Das geringere Gewicht und die Stopps machen die Steuerung lockerer. Es hilft, einen anderen Hintergrund zu schaffen.

FaceSwapDie Gesichtsreplikation ist gut. Durch Hinzufügen von Gewicht und Stoppen können Sie einen stärkeren Effekt erzielen.

reparieren

reparierenwird einen Teil des Eingabebildes regenerieren. Dies ist in Fooocus sehr einfach.

prüfenEingabebildund wählen SieReparieren oder beheben.

Laden Sie das Bild hoch, das Sie reparieren möchten.

Verwenden Sie das Pinselwerkzeug, um die Bereiche zu maskieren, die Sie regenerieren möchten.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-33

Dies ist ein Ergebnis.

verbessernDetailBei dieser Methode bleibt das Eingabebild mehr oder weniger unverändert, die feinen Details werden jedoch verbessert.

ÜberarbeitenInhaltMit dieser Methode können Sie den Maskenbereich durch Hinweise ändern. Dies ähnelt dem Inpainting mit hoher Rauschunterdrückungsstärke.

Weitere Tipps zur Reparatur:

eine Frau mit Sonnenbrille

Zusätzlicher Bildschirm

Zusätzlicher BildschirmErweitert ein Bild in eine oder mehrere Richtungen.

prüfenEingabebildund wählen SieReparieren oder beheben.

Laden Sie das Bild hoch, das Sie reparieren möchten.

existieren"Verfahren"Wählen Sie im Dropdown-Menü„Reparieren“ oder „Reparieren“ (Standard).

Wählen Sie die gewünschteOutpaint-Richtung.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-38

Unten sehen Sie ein Beispiel für das Zeichnen eines Bildes im Querformat.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-34
Fooocus Tutorial: Vereinfachte stabile Diffusion-39

beschreiben

EingabebildInbeschreibenDie Funktion errät den Bildhinweis. Sie ähnelt der Schaltfläche „CLIP fragen“ in AUTOMATIC1111.

Laden Sie das Bild hoch auf"beschreiben"und drücken Sie dannBeschreiben Sie dieses Bild in einem Hinweis.

Die Vermutung wird im Hinweisfeld angezeigt.

Fooocus-Tutorial: Vereinfachte stabile Diffusion-40

Modelle mit AUTOMATIC1111 teilen

Wenn Sie installiert habenAUTOMATIC1111oder andere stabile Diffusions-GUIs verwenden, möchten Sie möglicherweise Modelle zwischen ihnen teilen, um Speicherplatz zu sparen.

Dies kann durch Bearbeiten derconfig.txt-Datei zum Abschließen.Oben in der Datei können Sie „path_checkpoints“, „path_loras“ usw. ändern, um auf den vorhandenen Speicherort Ihres Modells zu verweisen.

Alternativen zu Fooocus

Sie können die folgenden Alternativen in Betracht ziehen:

  • AUTOMATIC1111: Die vielseitigste stabile Diffusions-GUI. Der De-facto-Standard.
  • SD.Next: AUTOMATIC1111vonEine kuratiertere Version. Viele vorinstallierteWesentliche Erweiterung.
  • Bequeme Benutzeroberfläche: Eine knotenbasierte GUI für stabile Verbreitung. Die Lernkurve ist etwas steil, aber das Verständnis wird Ihnen viel bringen.

Fooocus und Midjourney

Mitten auf der Reiseist ein beliebter und proprietärer KI-Bildgenerator. Sie können stabile Diffusion verwenden, umKopieViele Features auf halbem Weg.

Fooocus ist dafür konzipiert,Mitten auf der Reise vonWenn Ihnen die Einfachheit von MidJourney gefällt, könnte Ihnen auch Fooocus gefallen. Midjourney ist ein Ich würde sagen, Fooocus hat eine bessere Benutzeroberfläche.

Sehen Sie den Unterschied zwischen Fooocus und MidjourneyFunktionsvergleich.

Gedanken zu Fooocus

Ich bin Stabile Diffusion, Midjourney undIch habe immer die stufenlose Einstellbarkeit der stabilen Diffusion, die Qualität des mittleren Bereichs und die Genauigkeit, mit der DALLE seinen Anweisungen folgt, geschätzt.

Fooocus schließt die Lücke zwischen Einfachheit und Benutzerfreundlichkeit.

Manchmal zögere ich, Midjourney zu verwenden, weil die Discord-Oberfläche umständlich ist. Das Anpassen von Eingabeaufforderungen und Einstellungen ist etwas schwierig.

Fooocus bietet ein durchschnittliches Erlebnis mit dem zusätzlichen Vorteil, lokal betrieben, unzensiert und kostenlos zu sein. Als Bonus gibt es eine gut gestaltete Benutzeroberfläche!

Ich verwende Fooocus, um schnell qualitativ hochwertige Bilder zu erhalten, beispielsweise das Titelbild für diesen Beitrag.

5/5 - (1 Stimme)

Das ist eine gute Idee

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * Mark