画像から Flux プロンプト生成

画像をアップロードすると、約5秒で Flux 用の自然言語プロンプトが生成されます。T5 エンコーダーが本当に求める 30〜80 語の散文スタイル。タグも重み構文も --ar もなし。Flux 1.1 Pro、Flux Dev、Schnell に対応。毎日2回まで無料、登録不要。

Drop an image here to generate a Flux prompt

Max 5MB · PNG, JPG, WEBP · takes about 5 seconds

Open workspace

Flux のプロンプトはなぜ完全に違うのか

Flux は T5 テキストエンコーダーを中心に設計されており、GPT-4 のように完全な文を理解します。だからこそ Midjourney や SDXL の習慣が Flux の出力を積極的に悪化させます。このツールは Flux ネイティブの 3 段構造でプロンプトを生成します:被写体とシーン → 写真的ディテール → ムードとスタイル。

  1. 1. 被写体とシーン(最初の文)

    A woman in a red silk dress standing barefoot on a sandy beach at sunset

    Flux は早いトークンほど重視します。誰が・何を・どこで を 1 つのまとまった文で冒頭に置きます。

  2. 2. 写真的な具体性

    shot on Hasselblad X2D, 85mm lens, shallow depth of field, soft bokeh across the water

    Flux の T5 エンコーダーは実在のカメラ / レンズ名を認識し、センサーサイズ・ダイナミックレンジ・色彩科学などの美的特徴を適用します。

  3. 3. 光の相互作用(条件ではなく動作)

    warm golden sunset light streaming low across the scene, casting long shadows, dust particles visible in the beam

    『ゴールデンアワー』と書く代わりに、光が何を『する』かを描写します。方向・質・表面との相互作用 — ここで Flux は他モデルを凌駕します。

  4. 4. ムード / スタイル(任意の締め)

    cinematic, moody, editorial fashion photography

    文脈フラグは最後に。Flux はシーンが設定された後のスタイルアンカーとして使います。先頭に置くと抽象表現に注意が浪費されます。

  5. 5. 入れてはいけないもの

    --ar 16:9 不要。(beautiful:1.4) 不要。8k, masterpiece, best quality タグ不要。Negative prompt 不要。

    これらはすべて Midjourney / SDXL の構文です。Flux は最良で無視し、最悪で(特に Flux Dev で --flags として)文字通りそのまま画像に描きます。

Real image, real prompt

The prompt below is the raw output of this tool on the image shown — not hand-written samples.

インテリアシーン → Flux プロンプト
インテリアシーン → Flux プロンプト
A man with dark hair wearing a cap, facing away, sitting at a table, looking at a laptop screen. Cafe interior: gray concrete floor, white walls, black chalkboard menu with white text, wooden bar with bottles, white chairs with orange pillows, large green potted plant, hanging pendant lights, other patrons in the background. Soft diffused light, warm color temperature, shadows are soft.

Things most beginners miss

  1. 1. カメラマンに伝えるつもりで書く

    撮りたいショットを人間のカメラマンに説明するように書きましょう。被写体、場所、光、雰囲気を伝えること。これは Flux の T5 エンコーダーが入力を処理する方法にそのまま対応します。

  2. 2. 実在のカメラ名で実在の質感を引き出す

    『shot on Hasselblad X2D』と『shot on iPhone 15 Pro』では出力が異なります。Flux はこれらのセンサーの色彩科学を知っています。具体的な機材 > 抽象的な『プロ用カメラ』。

  3. 3. Negative prompt なし — ポジティブで書く

    Flux Dev / Schnell は negative prompt 非対応です。背景をすっきりさせたい場合、ネガティブで『cluttered』と書かず、ポジティブで『minimal, empty background』と書きます。

  4. 4. Flux Dev は『white background』を嫌う

    既知の Flux Dev の癖:単に『white background』と書くと平坦で不明瞭な出力になります。代わりに環境の詳細を追加:『seamless studio backdrop under soft key light』や『pure white cyclorama』。Pro / Schnell にはこの問題はありません。

  5. 5. Flux Dev はガイダンス 3.0〜3.8、Pro は既定

    Flux Dev をローカルで動かす場合:ステップ 24〜32、ガイダンス 3.0〜3.8、解像度 768〜1024。Flux 1.1 Pro の API はこれらを自動処理するので、幅・高さとオプションの seed だけ渡せば OK です。

Flux と他モデルの比較

CapabilityFluxMidjourneySDXL
プロンプトのスタイル自然言語(散文)文 + --flags文 + タグ + negative
テキスト描画✅ クラス最強✅ 良好⚠️ 改善中
ローカル実行✅ Dev(12GB 以上)/ Schnell✅ 8GB 以上❌ クラウド専用
Negative prompt❌ 非対応✅ フル対応❌ 非対応

Frequently asked questions

Flux 1.1 Pro、Dev、Schnell の違いは?

Pro は API 専用(クラウド)で Ultra と Raw モードがあり、最速・最高品質で、単純なプロンプトでも対応します。Dev はオープン重み(非商用ライセンス)で 12GB 以上の VRAM が必要、詳細なプロンプトが必要です。Schnell は Dev の 4 ステップ蒸留版でオープン重み(Apache 2.0)、イテレーションに向きます。3 つともプロンプトスタイルは同じ(自然言語、タグなし)。

なぜ Midjourney のように --ar 16:9 を出さないのですか?

Flux は Midjourney のフラグを使わないからです。width と height を別々の API パラメータ(Pro)または ComfyUI ノード設定(Dev/Schnell)として渡します。プロンプト文中の --ar は生成画像に文字通り現れます。

Flux は画像内テキストを正しく描けますか?

はい — これは Flux が Midjourney や SDXL と決定的に違う強みです。きれいなテキストを得るには、自然言語内で引用符で囲みます:『a sign reading "OPEN" in red neon letters』。Flux 1.1 Pro は約 10 語までのテキストブロックを綺麗に処理でき、Flux Dev はやや劣ります。

プロンプト長のスイートスポットは?

30〜80 語です。30 語未満だと Flux が推測に走り、平均的な解釈で埋めます。100 語を超えると早いトークン(Flux は先頭を重視)の重要性が薄まります。ツールは既定で約 60 語を目標にします。

Flux に negative prompt は必要?

いいえ。Flux Dev と Schnell は negative prompt 非対応です。Flux 1.1 Pro の API には negative prompt フィールドの萌芽的な実装がありますが、ドキュメントが不十分でほとんどの実務家は使いません。欲しいものをポジティブに書くのが原則です。

Flux Pro vs Flux Dev、プロンプトのアプローチは?

構造は同じ(自然言語、30〜80 語、被写体先頭)ですが、Dev の方が雑なプロンプトに厳しく反応します。Pro は短く単純なプロンプトでも対応しますが、Dev は 3 部構造(被写体・シーン / 写真的ディテール / 光・ムード)をすべて揃えないと最高の出力になりません。

Other model guides

  • 画像から Midjourney プロンプトフォトリアルよりスタイライズされた美学を好む場合、または --sref でスタイル一貫性を取りたい場合、Midjourney V7 は依然スタイルの王様です。
  • 画像から SDXL プロンプト12GB ではなく 8GB VRAM でローカル実行したい場合、SDXL が Flux Dev のハード要件を下回る現実的な選択肢です。

Ready to generate your Flux prompt? Open the workspace and drop an image — first two runs each day are free.

画像から Flux プロンプト生成 | imgtoprompt