優れたソフトウェアと実用的なチュートリアル
遊ぶAI描画今はもう心配する必要はありません黄老ナイフのテクニックは「背後から刺す」!必要なのは4年前のGTX 1650(4GBビデオメモリ)、AI画像出力は最高のオープンソースモデルSDXLに匹敵します。GitHub数日連続でトップに立った新規プロジェクトフーカス、星評価は3日間で4Kを超えました。コントロールネット著者制作しました。

GitHub プロジェクト アドレス:https://github.com/lllyasviel/Fooocus
それが出てくる前は、誰もがスムーズに実行したいと考えていました。安定拡散最新の XL モデルには、16G ビデオ メモリを搭載した 4060ti が搭載されている必要があります (12G ビデオ メモリを搭載したネイティブ 3060 は実行するのが非常に困難です)。
他のオープンソース AI ツールとは異なり、Fooocus は「生成そのもの」に重点を置いており、ハードウェア要件が低いだけでなく、使いやすいのも特徴です。とてもフレンドリー——
プロセス全体を通してパラメータを調整する必要はなく、マウスをクリックするだけです。3ステップで画像を生成する。

△写真出典 Twitter @Photogenic Weekend
一部のネットユーザーは「これはまさに『安定的拡散』と『中間旅程』の集大成だ」とコメントした。
手動パラメータ調整に別れを告げましょうオフライン、オープンソース、無料。言葉と絵を入力するだけで魔法が起こります!

一部のネットユーザーも嘆いています。「初心者でも、Stable Diffusion XL モデルの効果をうまく活用できます。」

では、この新しい画像AIツールは実際にどのような成果を生み出すのでしょうか?実際に試してみました。
Colabは30秒で画像を生成し、その効果はSDに匹敵します
操作インターフェースから、Fooocusには合計100以上の組み込みスタイルお選びいただけます。

△写真出典 Twitter @camenduru
については効率Fooocus は描画も非常に高速です。Colab では、速度優先モードで 1 枚の絵を描画するのに約 30 秒しかかかりません。

まずは描いてみましょう。漫画ぜひ試してみて、「マザ戦争」がAIの視点からどのように見えるか見てみましょう。(このマザハではありません)

AIを使って直接肖像画を生成する場合、手作業による処理にはまだ問題が残るため、マスク氏とザッカーバーグ氏には手袋を着用させるだけにした。

かなりうまくいっているみたいですね。賭けがあるのかどうかは分かりませんが、負けた人は女装させればいいんじゃないでしょうか?
(注意:戦いに勝者はいない)

最後に二人は「握手して和解」するのですが、この貴重なシーンもカメラマンが撮影していました。全体像にもそんな雰囲気が漂っているのでしょうか?

「マザの戦い」が終わった後、馬氏は素直に会社に戻り、テスラの販売を開始しました。
無視ロゴもしポスターデザインセンスもかなりオンラインっぽいです。

実際、Fooocus に組み込まれているスタイルはどれも興味深いものなので、ぜひ見てみてください。さまざまなスタイルライブ写真:
有名な作品を模倣する場合、サイバーパンクバージョン、ゼルダバージョン、マインクラフトバージョン、あるいはポケモンマスクのバージョンは閲覧可能です。

他の芸術形式としては、ピクセルそしてローポリスタイル、そしてねんどろいどそして切り絵バージョン……
もちろん、例は無限にあり、読者は自らさらに多くのスタイルを体験することができます。
(AI生成画像内のテキストは、単なる幽霊画ではないと言わざるを得ません)

皆さんもぜひプレイしてみませんか?さっそくFooocusのゲームプレイをご紹介していきます!
Fooocus のインターフェースは次のようになります。非常にシンプルだと言えます。
単に試してみたいだけで、特別な要件がない場合は、このプロンプトボックスは完全に十分です。。
作者が多くの複雑な技術をプログラムに組み込んだため、パラメータ調整などの操作を手動で行う必要がなくなりました。

下のボックスに「Prompt」と入力し、「生成」ボタンをクリックして、画像が表示されるまで待ちます。
(デフォルトでは2枚同時出力、サイズは1152×896、スタイルはシネマティックデフォルト、速度優先)
詳細設定が必要な場合は、左下の「詳細設定」にチェックを入れてください。設定情報はページの右側に3つのタブに分かれて表示されます。

調整できる項目は以下のとおりです。サイズ、量、スタイル、パフォーマンス等
プロのプレイヤーであれば、モデルのバージョンを選択したり、LoRA パラメータを調整したりすることもできます。

さらに、シャープネスを調整するこれはハイエンドのゲームプレイです。
次のアニメーション画像は、同じコンテンツに対して、シャープネスを 2 から 10、そして 20 へと変化させたものです。シャープネスが増加するにつれて、画像の詳細がより豊かになっていることがわかります。

しかし、Fooocusがサポートしているかどうか中国語私たちも試してみましたが、残念ながら今は動作しません。
たとえば、「apple」というプロンプトワードを入力すると、表示される画像は女の子です。
これは...「あなたは私にとって大切な存在です」という意味ですか?

Fooocus の遊び方はもうお分かりでしょうが、どのように設定するのでしょうか?
Nvidiaグラフィックカードをお持ちの場合ウィンドウズデバイスをお持ちでない場合は、そのまま使えるバージョンをご利用ください。(Lao Huangの優勝はおそらく114,514回目です)
同時に、ハードウェアは最小構成要件(4GB のビデオ メモリ + 8GB のメモリ)を満たしている必要があります。
まずここから直接ダウンロードしてください:
https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_1-1-10.7z
解凍後、run.bat をダブルクリックして実行してください。システムが自動的にモデルをダウンロードし、デプロイします。設定が完了したら、すぐに使用できます。

リナックスこのバージョンの構成要件は Windows と同じですが、構成プロセスはより複雑です。
(Jupyterをお持ちの方はColabで使用しているノートファイルも参照できます)
まず、環境の依存関係をインストールします。
<span class="hljs-attr">ギット</span> <span class="hljs-string">https://github.com/lllyasviel/Foocus.git をクローンします</span> <span class="hljs-attr">CD</span> <span class="hljs-string">フーカス</span> <span class="hljs-attr">コンダ</span> <span class="hljs-string">env create -f 環境.yaml</span> <span class="hljs-attr">コンダ</span> <span class="hljs-string">フォーカスをアクティブにする</span> <span class="hljs-attr">ピップ</span> <span class="hljs-string">インストール -r requirements_versions.txt</span>
次に、モデル ファイルをダウンロードし、指定されたディレクトリに保存します。

△詳細はGitHubページをご覧ください
もちろん、システムにモデルを自動的にダウンロードさせることもできます。
<span class="hljs-selector-tag">パイソン</span> <span class="hljs-selector-tag">打ち上げ</span><span class="hljs-selector-class">.py</span>
使用している場合マック、またはハードウェア構成が要件を満たしていない場合は、Colab を使用して直接実行することもできます。
(ポータル: https://colab.research.google.com/github/lllyasviel/Foocus/blob/main/colab.ipynb)
しかし、Colab バージョンでは、自動的に停止したり、メモリがオーバーフローしたりして、時々クラッシュするという不満がまだ残っています...

Mac または AMD コンピューターで Fooocus をよりスムーズに実行したい場合は、作者のアップデートを待つことができます。
全体的に、Fooocus のグラフィック出力は良好です。プロンプトワードを適切に選択すれば、Stable Diffusion としても使用できます。重要なのは、ハードウェア構成の要件がそれほど高くないことです。
これはどのように達成されるのでしょうか?
ControlNetの著者による最新プロジェクト
アーキテクチャ設計の面では、Fooocus は主にインタラクティブ インターフェースと AI モデルの 2 つの部分に分かれています。
で、インタラクティブインターフェース2つのプロジェクトが参照されました。安定拡散ウェブUIそしてComfyUI。
stable-diffusion-webui は主にインタラクティブ インターフェースのフロントエンド デザインです。

ComfyUI は、Stable Diffusion の GUI とバックエンド デザインを組み合わせています。

についてはAIモデル安定拡散の新しいSDXLモデルが使用されていることがわかります。

これは現在、安定拡散の最高のバージョンの 1 つであり、以前の 1.5 バージョンと比較して生成効果が大幅に改善されています。
ただし、Fooocus のモデルと UI デザインは既存の Stable Diffusion オープンソース プロジェクトに基づいていますが、作成者は制作過程で独自の最適化設計を多数取り入れ、モデルの実行をよりスムーズにしています。
たとえば、著者は、Fooocus で自ら設計した高度な k 拡散サンプリング法を慎重に採用しました。これにより、サンプリングの連続性が向上し、パフォーマンスの損失が軽減され、サンプリングの効率が向上しました。
さらに、作者はサンプラーのパラメータを慎重に調整し、オリジナルバージョンに基づいて映画スタイルを含むいくつかの新しい設定を変更および追加しました。
Fooocus に LoRA オプションが追加された理由は、著者のテストで、LoRA を使用した SDXL モデル (重み設定が 0.5 未満) が、LoRA を使用しない SDXL モデルよりもほぼ常に優れたパフォーマンスを発揮することがわかったためです。
Fooocusプロジェクトを開発した著者は張龍敏は、2021年に東呉大学で学士号を取得し、現在はスタンフォード大学で博士課程に在籍しています。
ControlNet や style2paints など、彼のプロジェクトのいくつかは人気を博しています。

さて、最新のプロジェクトである Fooocus も同様に人気があるようです。
ソーシャルメディアでは、一部のネットユーザーがさまざまなスタイルのFooocusプロンプトのコレクションを自発的にまとめています。エクセル。
どのような種類の画像を生成すればよいかわからない場合は、このドキュメントの指示を参照してください。

Fooocus でどのような画像を生成したいかは決まりましたか?
プロジェクトアドレス:
参考リンク:
- https://twitter.com/lvminzhang/status/1690118840326524928
- プロンプト単語集: https://docs.google.com/spreadsheets/d/1AF5bd-fALxlu0lguZQiQVn1yZwxUiBJGyh2eyJJWl74/edit
- https://twitter.com/narrativenavi/status/1691235126045552645
- https://twitter.com/kiyoshi_shin