たねやつの木

Photographs, Keyboards and Programming

Qwen-Image-EditをComfyUIでRTX3060と共に試してみた

こんにちは、たねやつです。

最近、Alibaba Cloudが開発した画像編集モデル「Qwen-Image-Edit」がリリースされ、早くもComfyUIで対応ワークフローが公開されました。

従来のモデルと比較して、より高速かつ高精度な画像編集が可能になっているとのことで、早速試してみました。本記事では、その導入方法と簡単な使用感について紹介します。

この記事でできること

  • Qwen-Image-Editの概要がわかる
  • ComfyUIでQwen-Image-Editを動かすための環境構築方法がわかる
  • 公開されているワークフローを使って、実際に画像編集を試せるようになる

事前に必要なもの

ComfyUI (Git版)

今回のワークフローは最新のComfyUI機能を必要とするため、Gitを使用してインストールしたComfyUI環境が推奨されます。 Windows向けのインストーラー版では、本記事執筆時点(2025年8月20日)ではまだ対応していないため注意が必要です。

NVIDIA製グラフィックボード

画像生成にはNVIDIA製のグラフィックボードが必要です。 今回はRTX 3060 (VRAM 12GB) を使用しましたが、後述する4stepLoRAを適用することで、数分で画像を生成することができました。

導入手順

ComfyUIを最新版にアップデート

まずは、お使いのComfyUIを最新の状態にアップデートします。 ComfyUIがインストールされているディレクトリで、以下のコマンドを実行してください。

git pull

or 

comfy install --version nightly

nightlyバージョンをインストールすることで、最新の機能が利用可能になります。

ワークフローのダウンロードと適用

次に、公式で公開されているワークフローをダウンロードします。

上記リンク先にワークフローのJSONファイルが添付されています。 ダウンロードしたJSONファイルを、起動したComfyUIの画面にドラッグ&ドロップするだけで、自動的にワークフローが読み込まれます。

必要なモデルが不足している場合は、ComfyUI Managerが自動で検出してくれるので、指示に従ってインストールしてください。

高速化のためのLoRAを適用

そのままでも画像生成は可能ですが、RTX 3060のようなミドルレンジのグラフィックボードでは少し時間がかかります。 そこで、4stepLoRAを適用することで、生成速度を大幅に向上させることができます。デフォルトは無効化されているのでCtrl Bで有効にします。

これにより、私の環境では1-2分程度で画像が生成されるようになりました。

ジブリ風の画像を生成してみる

せっかくなので、簡単なプロンプトでジブリ風の画像を生成してみました。 入力画像とプロンプト(指示文)を用意し、ワークフローを実行します。

プロンプト:

studio Ghibli style,
lush green scenery, soft lighting, warm sunlight, whimsical atmosphere,
beautifully detailed background, hand-drawn animation, watercolor painting,
dreamy, nostalgic, serene, masterpiece, best quality, 4k.

自分の子の画像ですが、ここまで高精度に抽象度高ければSNSでも使えそうですね。

Flux Kontextなどの他のモデルと比較しても、かなり高速かつ高精度に指示を反映した画像を生成できている印象です。これはかなり画期的ですね!

最後に

今回は、リリースされたばかりの画像編集モデル「Qwen-Image-Edit」をComfyUIで試してみました。 環境構築に少しだけ注意が必要ですが、それを乗り越えれば非常に強力な画像編集ツールとして活用できそうです。 特に、4stepLoRAを組み合わせることで、多くのユーザーが快適に利用できるのではないでしょうか。

皆さんもぜひ、この新しい画像編集の世界を体験してみてください。

参考・引用