SDXL 提示词指南:控制技术手册
Stable Diffusion XL (SDXL) 不是玩具;它是工作室。与其他猜测你想要什么的模型不同,SDXL 需要精确的工程设计。学习如何控制它的双文本编码器,掌握特定分辨率“桶”的语法,并使用提示词权重来强制 AI 专注于重要内容。
上传图片 → 获取 SDXL 提示词幕后:CLIP G+L 架构

SDXL 的独特之处在于它同时使用两个文本编码器(CLIP ViT-L 和 OpenCLIP ViT-bigG)。可以把它想象成有两个大脑并行工作:一个专注于对主体的简单、自然语言描述,另一个专注于抽象概念、关键词和艺术风格。
这意味着你的提示词需要同时满足这两者。一个简短有力的句子安抚 'G' 编码器,而一系列特定标签安抚 'L' 编码器。与想要故事的 Flux 不同,SDXL 想要结构化的规格说明。它还严格遵守语法:使用 (parentheses:1.2) 来增加关注度不是建议——它是给模型的数学指令。
控制板设置
| 设置 | 推荐值 | 重要性 |
|---|---|---|
| 分辨率 (Buckets) | 1024x1024, 1152x896, 896x1152 | SDXL 是在特定的“桶”上训练的。偏离这些比例会导致图像烧毁/裁剪。坚持使用标准比例。 |
| 步数 (Steps) | 30-50 | 例如:30 用于速度,50 用于最大细节。超过 50 很少能增加价值,只会增加时间。 |
| CFG 比例 (CFG Scale) | 7.0 - 8.0 | 它听你话的程度。太高 (>9) 会烧毁图像。太低 (<5) 会让它忽略你的提示词。 |
| 采样器 (Sampler) | DPM++ 2M Karras | SDXL 的黄金标准。快速且详细。Euler a 更柔和/更快,但细节较少。 |
工作流:工程师管道
- 基础提示词(主体):用自然语言清晰定义核心主体。例如 'A robot barista pouring coffee'。
- 修饰符堆栈(风格):添加逗号分隔的标签给第二个编码器。例如 'cyberpunk, neon lights, 8k, octane render'。
- 权重控制:识别最重要的元素并提升它。如果咖啡缺失,将其改为 '(pouring coffee:1.3)'。
- 负向提示词盾牌:SDXL 需要被告知不要做什么。添加你的标准负向嵌入或列表:'text, watermark, blurry, deformed hands'。
工程化提示词模板
权重黑客(聚焦增强器)
Positive
Formula: (Main Subject:1.2), [Action], [Context], [Style Tags] 原理:有时 SDXL 会忽略你提示词的一部分。将其放在 (parentheses) 中会将其注意力分数乘以 1.1。添加数字 :1.2 或 :1.5 会强制模型将该 token 优先于所有其他 token。 Example: '(Red sports car:1.3) drifting on a racetrack, smoke, motion blur, 8k uhd, dslr'
Negative
blue car, slow, parked, cartoon
“打断”技术(概念混合)
Positive
Formula: [Concept A] BREAK [Concept B] 原理:如果你想混合两个独特的颜色或概念而不让它们相互渗透(比如蓝衬衫和红裤子),请使用关键词 BREAK。它会重置上下文窗口,强制模型独立处理下一个块,然后再合并。 Example: 'A woman with blue hair BREAK wearing a red dress'
Negative
purple dress, green hair
“负向盾牌”(质量增强器)
Positive
Formula: [Prompt] ... Negative: text, watermark, bad anatomy, blurry, low quality, cropped 原理:SDXL 没有像 DALL-E 3 那样的内置“质量过滤器”。你必须提供负向提示词来过滤掉其庞大训练集中包含的“垃圾”数据(水印、模糊照片)。 Example: 'An astronaut on mars. Negative: helmet reflection, text, nasa logo, malformed limbs'
Negative
text, watermark, bad anatomy, blurry, low quality, cropped
案例研究:SDXL 精度
案例研究 1:超现实主义构图
SDXL 能完美处理抽象概念。注意“蒸汽朋克城市”和“鲸鱼”是如何自然融合的,没有旧模型中常见的伪影。

a giant whale floating in the sky above a steampunk city, golden clouds, dreamlike atmosphere, surrealism, intricate details, oil painting style --w 1024 --h 1024
案例研究 2:构图控制(“打断”技术)
通过使用 BREAK 关键词,我们可以将主体描述与风格/氛围设置分离,确保艺术风格不会干扰主体细节(例如,眼镜和帽子保持清晰)。

a white fluffy dog wearing round glasses and a blue cap BREAK artistic painting style, warm color palette, simple background, soft lighting, shallow depth of field
SDXL 疑难解答
为什么我的图像被裁剪或重复了?
你可能使用了错误的分辨率。SDXL 讨厌随机尺寸(如 512x512)。始终使用“桶”:1024x1024, 1152x896, 1216x832, 1344x768, 1536x640。坚持使用这些比例以获得连贯的图像。
什么是“精炼器 (Refiner)”?
精炼器是设计用于在基础模型之后运行以清理噪点的第二个模型。然而,许多现代工作流(以及 ImgtoPrompt)对基础模型提示词的优化非常好,以至于精炼器通常是不必要的。我们专注于把基础提示词做对。
我可以使用“Danbooru”标签吗?
可以!与 Midjourney 不同,SDXL 识别流行的图像板标签(如 1girl, upper_body, looking_at_viewer)。将这些与自然语言混合通常是最强大的提示方式。
继续探索
工程化你的 SDXL 提示词
不要浪费积分去猜测权重和语法。上传你的参考图片,让我们为你构建完美的、权重平衡的 SDXL 提示词。
自动生成 SDXL 提示词