画像から SDXL プロンプト生成

画像をアップロードすると、約5秒で SDXL 用プロンプトと軽量な negative prompt が生成されます。G エンコーダー向けの自然言語と L エンコーダー向けのタグを両立し、解像度バケットは自動で最適値にマッチ。AUTOMATIC1111・ComfyUI・Forge・Fooocus にそのまま貼り付け可能です。毎日2回まで無料、登録不要。

Drop an image here to generate a SDXL prompt

Max 5MB · PNG, JPG, WEBP · takes about 5 seconds

Open workspace

なぜ SDXL のプロンプトは SD 1.5 と違うのか

SDXL は 2 つのテキストエンコーダを並列に使います:CLIP ViT-L(タグ向き)と OpenCLIP ViT-bigG(自然言語向き)。両方が同時にプロンプトを読みます。最良の SDXL プロンプトは、頭に自然言語の文、続いてタグの列を置いて両方を満たします。このツールの出力もこの構造です。

  1. 1. 自然言語の冒頭文

    a close-up macro photograph of a dewdrop on a green leaf at sunrise

    OpenCLIP bigG エンコーダーを整えます。シーンの物語を人間の言葉で伝えるパートです。

  2. 2. 構造化タグ

    masterpiece, best quality, 8k uhd, sharp focus, shallow depth of field, soft morning light

    CLIP L エンコーダーを駆動します。自然文では効率よく運べない技術語彙をタグで補強します。

  3. 3. 軽量な negative prompt

    text, watermark, bad anatomy, blurry, low quality, cropped

    SDXL は SD 1.5 ほど negative prompt に敏感ではありません。2026 年の目安は 5〜7 語で始め、具体的な失敗が見えた時だけ追加すること。

  4. 4. 解像度バケット

    1024×1024(横長は 1216×832)

    SDXL は特定サイズのバケットで訓練されています。512×512 のような任意サイズはコンポジションの崩れや解剖学的破綻を起こします。

  5. 5. CFG Scale

    6〜8(スイートスポットは 7)

    プロンプトへの従順さ。10 超は色飽和と歪みが出やすく、5 未満はプロンプトが無視されがちです。

  6. 6. サンプラー + ステップ

    DPM++ 2M Karras, 25〜30 ステップ

    標準的な SDXL ワークフロー。30 ステップを超えても品質向上は微小で、生成時間が 3 倍以上になります。

Real image, real prompt

The prompt below is the raw output of this tool on the image shown — not hand-written samples.

動物写真 → SDXL プロンプト
動物写真 → SDXL プロンプト
best quality, Australian Shepherd dog with brown and white fur, looking forward with mouth open, one ear up, set against outdoors, tan sand, blurred blue water, blurred light blue sky, shown in a close-up portrait, eye-level angle, with soft natural light, diffused light, minimal shadows

Negative: text, watermark, blurry, low quality, oversaturated, plastic, cartoon, cgi, 3d render

Things most beginners miss

  1. 1. SD 1.5 の negative prompt をそのまま貼らない

    SD 1.5 で効いていた 50 語のネガティブが、SDXL ではむしろ品質を落とすことがあります。2026 年のベストプラクティス:5〜7 語から始め、具体的な失敗が見えた時だけ追加。

  2. 2. SDXL の解像度バケットを使う

    1024×1024(正方)、1152×896(4:3)、1216×832(3:2)、1344×768(16:9)、1536×640(21:9)。他のサイズは解剖学的な問題を起こします。ツールは入力画像のアスペクトを最寄りのバケットに自動マッチします。

  3. 3. 重み構文は SDXL では弱い

    (keyword:1.4) の効きは SD 1.5 より弱まっています。プレーンテキストの方が効くケースも多く、重みは最大 1.4 程度に抑えるのが安全。高すぎると色飛びを起こします。

  4. 4. Refiner は大抵の用途で不要

    ベースモデルのプロンプトがしっかり書けていれば、SDXL Refiner は多くの場合不要です。生成時間が約 40% 増えますが、A1111/ComfyUI の最新ワークフローでは効果が限定的です。

  5. 5. ポートレートの解剖は負のプロンプトで狙い撃ち

    手が崩れ続ける場合は (bad hands:1.4), (missing fingers:1.3) を negative に追加。全網打尽ではなく、見えている失敗だけを狙うのがコツです。

SDXL と他モデルの比較

CapabilitySDXLFlux DevMidjourney
ローカル実行(8GB 以上)✅ オープン重み✅ 12GB 以上必要❌ クラウド専用
Negative prompt 対応✅ フル対応❌ 非対応⚠️ --no は使える
画像 1000 枚あたりのコスト〜$0(GPU 後)〜$40($0.04/枚)〜$40($10/月 ≈ 250 枚)
画像内テキスト描画⚠️ 弱め✅ 優秀✅ 良好

Frequently asked questions

AUTOMATIC1111 / ComfyUI / Forge で使えますか?

はい。出力は任意の SDXL UI にそのまま貼れるプレーンテキストです。ComfyUI のワークフロー JSON の場合は、positive / negative フィールドを対応する CLIPTextEncode ノードにコピーするだけ。構文は全 UI で同一です。

SDXL Turbo で使えますか?

はい。ただしステップを 1〜4、CFG を 1.0〜2.0 に下げてください。プロンプト構造は同一です。SDXL Turbo は SDXL 1.0 の蒸留版で推論が速くなっています。出力は無調整で使え、サンプラー設定だけ調整します。

CFG とステップはどの値を使うべき?

SDXL 1.0:CFG 6〜8(7 が無難)、ステップ 25〜30、DPM++ 2M Karras。SDXL Turbo:CFG 1.0〜2.0、ステップ 1〜4。SDXL Lightning:CFG 1.0〜2.0、ステップ 2〜8。

なぜ (keyword:1.3) のような重み構文を出さないのですか?

SDXL(および Pony や Juggernaut XL などの派生)は SD 1.5 ほど重み構文に敏感ではないからです。自然言語だけで同じ結果が出て、アーティファクトも減ります。重みは具体的な失敗に対処する時だけ手動で追加してください。

Pony Diffusion や Juggernaut XL で使えますか?

はい、これらは SDXL ベースです。ただし Pony Diffusion は `score_9, score_8_up, score_7_up` のようなスコアタグをプロンプト冒頭に置くと強く反応します。手動で追加してください。ツール側はモデル非依存の SDXL 構文を出力します。

実際どの解像度で生成すべき?

必ず SDXL バケット(1024×1024, 1216×832, 1152×896, 1344×768, 1536×640)を使ってください。512×512 は SD 1.5 用で、SDXL では構図が崩れます。小さい出力が必要ならバケットサイズで生成してから縮小してください。

Other model guides

Ready to generate your SDXL prompt? Open the workspace and drop an image — first two runs each day are free.

画像から SDXL プロンプト生成 | imgtoprompt