たねやつの木

Photographs, Keyboards and Programming

ComfyUIで「Qwen-Image-Edit-2509」を試す!RTX3060でも余裕で動く nano-banana相当のオープンモデル

こんにちは、たねやつです。

先日ご紹介した多機能な画像編集モデル「Qwen-Image-Edit-2509」ですが、今回はその中でも特にComfyUIでの利用に焦点を当てて、その驚くべき手軽さと具体的な活用法を深掘りしていきます。

特筆すべきは、この高度なモデルがNVIDIA RTX 3060のようなコンシューマ向けGPUでも十分に動作するという点です。さらに、人物と服装の画像を組み合わせて着せ替えを実現する、まるで「nano-banana」のような編集が可能な点も大きな魅力です。

この記事では、ComfyUIを使って「Qwen-Image-Edit-2509」の真価を引き出す方法を、具体的な作例とともに解説します。

RTX3060でも動く!驚きの軽量さ

まず最も伝えたいのが、このモデルのアクセシビリティの高さです。AIモデル、特に画像編集に関するものは高いGPUスペックを要求すると思われがちですが、「Qwen-Image-Edit-2509」は非常に効率的に動作します。

実際に、VRAM 12GBのRTX 3060環境で、1000px四方の画像を約1分ほどで処理可能です。これにより、多くのクリエイターが自身のローカル環境で、この最先端のAI技術を試すことができます。

ComfyUIでのセットアップ

ComfyUIでは公式にサポートされているため、セットアップは非常に簡単です。

  1. ComfyUIを最新版にアップデートします。
  2. ComfyUIのトップ画面でテンプレートの参照をクリックし、画像 -> Qwen Image Edit 2509を選択します。

これだけで、すぐに使える公式のワークフローが読み込まれます。

Qwen-Image系のモデルやテンプレートも豊富になってきましたね!

実践1:複数画像を合成してシーンを作成

このモデルは最大3枚の画像を組み合わせて、一貫性のあるシーンを生成できます。

公式テンプレートでは、画像入力ノードが紫色で非アクティブになっている場合があります。その際は、ノードを選択してCtrl+Bを押すことで有効化できます。

今回は、ソファの画像と人物の画像をインプットし、「彼をソファに座らせて」というプロンプトを与えてみます。

  • プロンプト: let him sit on the sofa

すると、それぞれの画像の情報が統合され、自然に人物がソファに座っている画像が生成されます。

さらに、この状態から「彼のシャツを赤いものに変えて」といった追加の指示を出すことで、連続した編集も可能です。

  • 追加プロンプト: let him sit on the sofa, change his shirt to red one

実践2:「nano-banana」のような着せ替え編集

このモデルのもう一つの強力な機能が、人物と服装の画像を組み合わせて、バーチャルな着せ替え(試着)を実現できる点です。これは、Googleのnano-bananaでも流行っているような使い方ですね。

人物の画像と、着せたいスーツ(アウトフィット)の画像をそれぞれ入力し、以下のプロンプトを与えます。

  • プロンプト: let the man wear the outfit

生成結果を見ると、人物のポーズや体型に合わせて、自然な形でスーツが着せられているのがわかります。まさに「着せ替え人形」のように、様々なファッションを試すことが可能です。

まとめ

「Qwen-Image-Edit-2509」は、その高度な機能だけでなく、RTX 3060という身近な環境で動作する軽量さも兼ね備えた、画期的なモデルです。ComfyUIとの公式連携により、そのハードルはさらに低くなりました。

複雑なシーンの合成から、「nano-banana」のようなバーチャル試着まで、これまで専門的な技術が必要だった画像編集が、誰でも手軽に試せる時代の到来です。ぜひ、ご自身のPCでこの未来の技術を体験してみてください。

次の記事

実際にGoogleのX上のポストで使用されているnano-banana用のプロンプトを拝借していろいろと試してみます。

www.taneyats.com

実際に自分の作っている自作キーボードの適当な写真一枚からECサイト用の写真を作成してみる記事はこちらです!

www.taneyats.com