こんにちは、たねやつです。
先日、その基本機能を紹介した画像編集AI「Qwen-Image-Edit-2509」ですが、今回はさらに一歩踏み込んで、よりクリエイティブで高度な使い方、いわば「nano-banana」的な活用法を試してみました。
ペットの写真をミニチュアフィギュア化したり、指示だけで双子の画像を生成したり、さらには食べかけのケーキの復元は可能なのか?など、様々な実験を行いました。
この記事では、実際に使用したプロンプトを全て公開し、その成功例と失敗例から見えてきた「Qwen-Image-Edit-2509」を使いこなすためのコツを共有します。
- 前の記事
- はじめに:プロンプトは「英語」がおすすめ
- 実践1:写真を「ミニチュアフィギュア化」する
- 実践2:写真に写っていない「下半身」を補完してアクリルスタンド化する
- 実践3:指示だけで「双子」を生成し、服装も変える
- 失敗例:食べかけのケーキは復元できるか?
- nano-bananaと比較して
- まとめ
前の記事
はじめに:プロンプトは「英語」がおすすめ
本題に入る前に、重要なポイントを一つ。今回の検証で、日本語のプロンプトでは意図通りに動作しないケースが多く見られました。一方で、英語で詳細な指示を与えることで、驚くほど高品質な結果が得られました。
複雑でニュアンスの細かい編集を行いたい場合は、プロンプトを英語で記述することを強く推奨します。
実践1:写真を「ミニチュアフィギュア化」する
最初の挑戦は、手持ちの写真をまるで市販のフィギュアのように加工することです。今回はペットの写真を元に、デスクの上に飾られたスケールフィギュア風の画像を生成してもらいます。

使用したプロンプト
以下が実際に使用したプロンプトです。ライティングや背景、台座の素材まで細かく指定しているのがポイントです。
A hyperrealistic 1/7 scale character model, designed as a finished commercial product. It is displayed on an iMac computer desk with a white keyboard. The model stands on a clean, round, transparent acrylic base, with no labels or text. Professional studio lighting highlights the intricate sculptural details of the model. In the background, the iMac screen displays the ZBrush modeling process of the exact same character model. Beside the model, there is a retail packaging box with a clear transparent window on its front, showing only the clear plastic inner shell. The box is slightly taller than the model and is reasonably sized to contain it. Photorealistic, high quality, ultra detailed, 8k, product photography, sharp focus, soft shadows, sophisticated studio setup.
結果

結果はご覧の通り、まさに「こういうのが欲しかった」というイメージ通りの出力でした。光の当たり方や背景のボケ具合など、まるで本物の製品写真のようなクオリティです。
欲を言えばもう少しプロダクト感を出した感じに抑えることができれば見た目の違和感が少なくなるのかなと思います。
実践2:写真に写っていない「下半身」を補完してアクリルスタンド化する
次に、キャラクターの上半身しか写っていない画像を元に、全身を補完してアクリルスタンド(アクスタ)風に加工してもらいます。さらに、パッケージに特定の文字を書き込んでもらうという、テキスト生成能力も試します。

使用したプロンプト
A hyperrealistic 1/7 scale merchandise figure of the character from the input image. The figure is rendered in a realistic style, standing on a clean, round, transparent acrylic base, with no text or labels, placed on a modern, well-lit desk. Beside the figure, there is a retail toy packaging box with an original artwork print of the character (from the input image) on its front. At the very bottom of the box, in a small, elegant font, it explicitly says: "Made with Qwen-Image-Edit-2509". The background features a stylish and aesthetically pleasing living room, slightly out of focus with shallow depth of field, illuminated by soft ambient light. Photorealistic, high quality, ultra detailed, 8k, product photography, sharp focus on the figure and box, soft shadows, sophisticated studio lighting, minimalist commercial style.
結果

驚くべきことに、元画像にはなかった下半身が違和感なく補完され、自然な立ち姿になっています。
さらに、指示通りパッケージの下部に「Made with Qwen-Image-Edit-2509」という文字が正確にレンダリングされており、このモデルの汎用性の高さが伺えます。
実践3:指示だけで「双子」を生成し、服装も変える
テキストプロンプトだけでどこまで複雑なシーンを生成できるかも試してみました。「一卵性双生児が、それぞれ違う服装で仲良く自撮りをしている」という、少し意地悪な設定です。

使用したプロンプト
A selfie of identical twin sisters, both looking directly at the camera with warm, gentle smiles. They are posing cheek-to-cheek, their faces close together, clearly showing their identical features. One twin is wearing a casual, light blue denim jacket over a white t-shirt, while the other is dressed in a soft, pastel pink cardigan over a floral print blouse. Their hairstyles are similar but subtly different (e.g., one with straight hair, the other with soft waves). The setting is a cozy, brightly lit cafe or a stylish living room with soft, blurred background elements like warm wooden shelves or a large window. Soft, natural daylight from a window illuminates their faces evenly, creating a flattering glow. Close-up to medium shot, captured from a slightly high angle as if holding a smartphone, conveying a genuine and affectionate bond. Photorealistic, high quality, ultra detailed skin and hair, 8k, bokeh, vibrant colors, authentic moment, mirror reflection.
結果

結果は素晴らしいものでした。「一卵性双生児」という指示を正確に理解し、非常によく似た顔立ちの二人を生成。さらに、デニムジャケットとピンクのカーディガンという、それぞれ異なる服装も完璧に描き分けています。
失敗例:食べかけのケーキは復元できるか?
最後に、このモデルの限界を探る実験も行いました。半分食べられたケーキの写真を渡し、「食べる前の状態に戻して」と指示してみます。

使用したプロンプト
Make this half-eaten cake into its pre-eaten state.
結果

残念ながら、こちらに関してはほとんど変化が見られませんでした。どうやら、「食べる前の状態」といった抽象的・概念的な指示を理解するのは苦手なようです。
プロンプトをより具体的に「欠けている部分を同じ質感のスポンジとクリームで埋めて」のように記述すれば、また違う結果になったかもしれません。今後の研究課題です。
nano-bananaと比較して
nano-bananaと比較してみると、しっかりとプロンプトの内容を作りこまないと表現してくれない印象です。逆に言えば勝手に想像せずにこちらの指示にしか動かないというメリットでもあるかもしれません。最後のケーキの例は簡素なプロンプトを使用してみましたが、nano-bananaでは補完することができるようなので一長一短というところでしょうか。
まとめ
今回の検証から、「Qwen-Image-Edit-2509」は、具体的で詳細な描写(シーンベース)のプロンプトを与えることで、その真価を発揮するモデルだということが分かりました。特に、フィギュア化やアクスタ化のようなクリエイティブなタスクや、双子の生成のような複雑な指示への対応能力は驚異的です。
一方で、抽象的な指示には弱いという側面も見えました。このモデルを使いこなす鍵は、いかに「AIが理解しやすい言葉で、完成形を具体的に描写するか」にありそうです。そして、その際は英語を使うのが現状ではベストプラクティスと言えるでしょう。
なお、今回は入力画像としてAIで生成した画像を使用しましたが、次回は実際の写真を使ってどこまで高品質な編集ができるか、さらに検証してみたいと思います。