精品軟體與實用教程
Fooocus是一款基於Stable Diffusion的免費開源人工智慧圖像產生器。它試圖結合Stable Diffusion和Midjourney的優點:開源、離線、免費、易用。 Fooocus優化了Stable Diffusion管道,以提供出色的影像。您可以花更少的時間調整設置,而將更多的時間花在創建所需的圖像上。
在這篇文章中,我們將介紹
- Fooocus的優點和缺點
- 如何安裝Fooocus
- 基本用法
- 設定樣式
- 升級
- 修復和修復
- 使用圖像提示
Fooocus的優點和缺點
Fooocus優點:
- 專注於圖像優化:Fooocus 專注於提供最佳的圖像優化,它採用各種技術來減小圖像檔案大小,同時保持高品質。
- 多種最佳化選項:Fooocus 提供廣泛的最佳化選項,包括有損和無損壓縮、調整大小、裁剪和浮水印。
- 大量最佳化:Fooocus 允許使用者批量優化多個影像,從而節省時間並提高效率。
- 易於使用:Fooocus 具有用戶友好的介面,即使是初學者也可以輕鬆使用。
- 針對Web 和行動裝置最佳化:Fooocus 針對Web 和行動裝置進行了最佳化,可確保影像在所有裝置上快速載入。
- 支援多種圖片格式:Fooocus 支援各種影像格式,包括JPEG、PNG、GIF 和WebP。
- 雲端託管:Fooocus 是一款雲端託管服務,因此使用者無需安裝或維護任何軟體。
Fooocus缺點:
- 需要付費:Fooocus 是一款付費服務,儘管它提供免費試用。
- 有限的影像編輯功能:Fooocus 主要專注於影像優化,不提供進階影像編輯功能。
- 依賴網路連線:由於Fooocus 是一款雲端託管服務,因此需要穩定的網路連線才能使用。
- 影像品質輕微損失:在某些情況下,有損壓縮可能會導致影像品質輕微損失。
- 有時會出現技術問題:像任何雲端服務一樣,Fooocus 偶爾也可能遇到技術問題。
如何安裝Fooocus
最低系統需求
您需要具有8GB VRAM 的Nvidia 卡。其他設定也可能有效。請參閱最低要求的完整清單。
Windows
請依照以下步驟在Windows 上安裝Fooocus。
- 在此頁面下載zip 檔案。
- 將zip 檔案放入您要安裝Fooocus 的資料夾中
- 右鍵單擊zip 檔案並選擇全部提取...以提取文件。

按兩下run.bat啟動Fooocus。
它將在您第一次運行時下載模型。
AMD GPU、Mac、Linux 與Colab
您也可以在AMD GPU、Mac、Linux和Colab上安裝Fooocus 。
使用Fooocus
Fooocus 超級容易使用。在預設模式下,您輸入提示並按“生成”。 (Windows 上為Ctrl+Enter。Mac 上為Cmd+Enter)
a dragon, snow, moon

它使用預設模型,即juggernautXL,一個經過微調的Stable Diffusion XL模型。它是一種通用模型,能夠生產各種款式。
快速提示詞
您不需要像流行的圖像共享網站上那樣編寫又長又複雜的提示。 Fooocus 將使用基於GPT-2 的提示引擎擴展您的提示。
例如提示:
龍、雪、月
a dragon, snow, moon
在引擎蓋下擴展為以下提示。
龍,雪,月亮,光,錯綜複雜,優雅,銳利的焦點,美麗的動態,高度詳細,非常時尚,專業精細的細節,電影,戲劇性的環境明亮的色彩,完美,溫暖的色彩,史詩般的構圖,引人注目,勇敢,有吸引力,精英、最佳、生動、清晰、連貫、先進、創意、可愛、藝術、時尚、酷、華麗、真棒
a dragon, snow, moon, light, intricate, elegant, sharp focus, beautiful dynamic, highly detailed, very sleek, professional fine detail, cinematic, dramatic ambient bright colors, perfect, warmet, eivematic, dramatic ambient bright colors, perfect, warm-color, eivepic, picel, stract, picr. vivid, clear, coherent, advanced, creative, cute, artistic, trendy, cool, gorgeous, awesome
進階設定
選擇進階複選框將顯示高級設定選單。

性能設定
秉承其設計理念,即使是高級設定也很容易理解。
表演部分。
- 速度:良好的平衡,執行30 個採樣步驟。
- 品質:執行兩倍的採樣步驟。
- 極速:使用LCM LoRA減少採樣步驟。



正如設置所預期的那樣,速度和品質差別不大。對於SDXL 模型,執行超過30 個步驟的報酬率會遞減。
極速設定會產生較低品質的影像。這是LCM-LoRA 模型的預期。
以下是使用RTX4090 GPU 卡的Windows 系統上的產生時間比較。
速度 | 17.3 秒(1x) |
品質 | 25.2 秒(1.5 倍) |
極速 | 10.4 秒(0.6x) |
我喜歡LCM-LoRA(極速)的易用性。在 AUTOMATIC1111 中使用LCM-LoRA 需要更改CFG 比例和取樣步驟。而且很容易忘記。 Fooocus 透過一次選擇即可解決所有這些問題。
縱橫比
Fooocus 提供了廣泛的圖像尺寸清單供您選擇。有趣的是,無法在GUI 中輸入影像大小。

您想要使用特定影像大小的原因有很多,例如與穩定擴散模型的兼容性以及發布需求。
若要將影像解析度新增至清單中,請在Fooocus資料夾中尋找名為config_modification_tutorial.txt的文件。

這是設定檔config.txt的模板。
將config.txt重新命名為config.txt.original。
複製文件config_modification_tutorial.txt並將其重命名為config.txt。
在文字編輯器中 編輯config.txt (我使用Notepad++)。
刪除頂部的說明性註釋。
將新解析度新增至「available_aspect_ratios」清單。例如:
"available_aspect_ratios": [ "704*1408", "704*1344", "768*1344", "768*1280", "832*1216", "832*1152", "896*1152"" "960*1024", "1024*1024", "1024*960", "1088*960", "1088*896", "1152*896", "1152*832", "1200*800" "1216" "1344*768", "1344*704", "1408*704", "1472*704", "1536*640", "1600*640", "1664*576", "1728*576" ],
重新啟動Fooocus,您應該會看到新增的新解析度。

風格
在Fooocus 中,您不需要設計提示來實現某種風格。您可以使用“樣式”選單到達那裡。
預設樣式超多!您可以在SDXL 風格指南中直觀地看到其中的許多內容。

您可以組合多種樣式。但其中許多僅在未選取預設樣式時才有效。




您也可以新增負面提示來撥入圖像。例如,在否定提示中新增「黑白」(在「設定」>「否定提示」中)以產生彩色影像。


模型
您可以在“模型”選項卡中指定檢查點模型和LoRA。
模型的路徑可以在Fooocus資料夾中的config.txt中找到或更改。
升級影像
要在Fooocus 中升級影像:
- 選擇輸入影像複選框。
- 在“高檔”或“變體”下,選擇所需的高檔選項。
- 按產生。

影像變化
與Midjourney 的V1/V2/V3/V4 功能一樣,您可以產生影像的變體。
- 選擇輸入影像複選框。
- 在“升級”或“變化”下,選擇所需的“變化”選項。
- 按產生。

以下是“變化微妙”和“變化強烈”選項所產生的變化。他們沒有那麼多。



注意:您可以使用AUTOMATIC1111 中的額外種子選項建立影像變體。
圖片提示
您可以使用圖像作為附加提示,例如AUTOMATIC1111。但與AUTOMATIC1111 不同的是,您不需要安裝擴充功能。它是Fooocus 基本功能的一部分。
若要使用圖像提示,請選中輸入影像複選框並選擇影像提示選項卡。
將圖像上傳到圖像槽之一。
您可能需要選取頁面底部的進階複選框以啟用編輯更多設定。
影像提示
預設圖像提示選項是ImagePrompt。

如果您在AUTOMATIC1111 中使用過ControlNet ,這些設定應該看起來很熟悉。
- 停止於:在某些取樣步驟停止影像提示控制項。 0.5 表示30 個採樣步驟,15 個步驟後停止。
- 權重:影像提示控制項的強度。
增加其中任何一個都可以增強影像提示的效果。
使用提示:
a chair that resembles a cat
更改影像提示中的權重



皮拉·坎尼
PyraCanny是一種基於金字塔的Canny 邊緣控制方法。 SDXL 影像的高解析度可能會導致標準Canny 演算法遺漏一些細節。該方法以多種分辨率分層檢測邊緣。
像Canny ControlNet一樣使用PyraCanny來複製構圖或人體姿勢。
迅速的:
A woman
上傳圖像並選擇 PyraCanny。



CPDS
CPDS是一種基於深度的結構檢測方法。它複製影像的3D 構圖,但不複製線條。與Depth ControlNet類似,它對圖像的改變更多。
請參閱下面的CPDS 範例。它複製構圖,但不複製臉部細節,例如髮型和她看著的方向。


換臉
Face Swap 就像ControlNet 中的IP 適配器Face。它複製參考影像中的臉部。
這是一個例子。這個提示是:
a woman, praying


多圖像提示
與AUTOMATIC1111 中的ControlNet一樣,您可以在Fooocus 中使用多個圖像提示。
讓我們用一個使用兩個圖像提示的例子來說明:
- FaceSwap – 權重0.5,停止於0.9:複製臉部。
- PyraCanny – 權重0.5,停止於0.5:複製姿勢。


使用多個影像提示時,您通常需要將權重設定得較低。否則,您可能會看到諸如奇怪顏色之類的偽影。
PyraCanny在複製姿勢方面做得很好。較低的重量和停止使控制變得寬鬆。它有助於產生不同的背景。
FaceSwap在複製臉部方面做得很好。您可以透過增加重量並停止來獲得更強的效果。
修復
修復會重新產生部分輸入影像。在Fooocus 中這很簡單。
檢查輸入影像並選擇修復或修復。
上傳您想要修復的圖像。
使用畫筆工具遮蓋要重新產生的區域。

這是一個結果。


改進細節方法使輸入影像或多或少保持相同,但改進了精細細節。


修改內容方法可讓您透過提示修改遮罩區域。它類似於具有高去噪強度的修復。
修復附加提示:
a woman with sunglasses


額外的畫面
額外的畫面在一個或多個方向上擴展影像。
檢查輸入影像並選擇修復或修復。
上傳您想要修復的圖像。
在“方法”下拉式選單中,選擇“修復”或“修復”(預設)。
選擇所需的Outpaint Direction。

下面是橫向繪製影像的範例。


描述
輸入影像中的描述函數猜測圖像的提示。它類似於AUTOMATIC1111 中的詢問CLIP按鈕。
將圖像上傳到“描述”選項卡的畫布,然後按“在提示中描述此圖像”。
猜測的提示會出現在提示輸入框中。

與AUTOMATIC1111 共享模型
如果您已安裝AUTOMATIC1111或其他穩定擴散GUI,您可能希望在它們之間共用模型以節省磁碟空間。
可以透過編輯Fooocus 資料夾中的config.txt檔案來完成。在文件頂部,您可以修改“path_checkpoints”、“path_loras”等以指向模型的現有位置。
Fooocus 的替代品
您可以考慮以下替代方案:
- AUTOMATIC1111:功能最多的穩定擴散GUI。事實上的標準。
- SD.Next:AUTOMATIC1111的更精心策劃的版本。預先安裝了許多必備擴展。
- ComfyUI:基於節點的穩定擴散GUI。學習曲線有點陡峭,但了解它會有很長的路要走。
Fooocus 和Midjourney
Midjourney是一款流行且專有的人工智慧影像產生器。您可以使用穩定擴散來複製中途的許多功能。
Fooocus 被設計為Midjourney 的替代品。如果您喜歡MidJourney 的簡單性,您可能也會喜歡Fooocus。 Midjourney 是一個基於 Discord 的圖像生成器。我想說Fooocus 有更好的使用者介面。
請參閱Fooocus 和Midjourney 之間的功能比較。
對Fooocus的思考
我是Stable Diffusion、Midjourney 和DALLE的常規用戶。我一直欣賞穩定擴散的無限調整能力、中途的品質以及DALLE 遵循提示的準確程度。
Fooocus 填補了簡單易用的空白。
有時我不願意使用Midjourney,因為處理Discord 介面很麻煩。調整提示和設定有點困難。
Fooocus 試圖提供中途體驗,並具有本地運行、不受審查且免費的額外優勢。作為獎勵,它有一個設計合理的GUI!
我將使用Fooocus 快速獲得高品質的圖像,例如這篇文章的封面圖片。