SDXL 提示词指南：控制技术手册

Stable Diffusion XL (SDXL) 不是玩具；它是工作室。与其他猜测你想要什么的模型不同，SDXL 需要精确的工程设计。学习如何控制它的双文本编码器，掌握特定分辨率“桶”的语法，并使用提示词权重来强制 AI 专注于重要内容。

上传图片 → 获取 SDXL 提示词

幕后：CLIP G+L 架构

SDXL 的独特之处在于它同时使用两个文本编码器（CLIP ViT-L 和 OpenCLIP ViT-bigG）。可以把它想象成有两个大脑并行工作：一个专注于对主体的简单、自然语言描述，另一个专注于抽象概念、关键词和艺术风格。

这意味着你的提示词需要同时满足这两者。一个简短有力的句子安抚 'G' 编码器，而一系列特定标签安抚 'L' 编码器。与想要故事的 Flux 不同，SDXL 想要结构化的规格说明。它还严格遵守语法：使用 (parentheses:1.2) 来增加关注度不是建议——它是给模型的数学指令。

控制板设置

设置	推荐值	重要性
分辨率 (Buckets)	1024x1024, 1152x896, 896x1152	SDXL 是在特定的“桶”上训练的。偏离这些比例会导致图像烧毁/裁剪。坚持使用标准比例。
步数 (Steps)	30-50	例如：30 用于速度，50 用于最大细节。超过 50 很少能增加价值，只会增加时间。
CFG 比例 (CFG Scale)	7.0 - 8.0	它听你话的程度。太高 (>9) 会烧毁图像。太低 (<5) 会让它忽略你的提示词。
采样器 (Sampler)	DPM++ 2M Karras	SDXL 的黄金标准。快速且详细。Euler a 更柔和/更快，但细节较少。

工作流：工程师管道

基础提示词（主体）：用自然语言清晰定义核心主体。例如 'A robot barista pouring coffee'。
修饰符堆栈（风格）：添加逗号分隔的标签给第二个编码器。例如 'cyberpunk, neon lights, 8k, octane render'。
权重控制：识别最重要的元素并提升它。如果咖啡缺失，将其改为 '(pouring coffee:1.3)'。
负向提示词盾牌：SDXL 需要被告知不要做什么。添加你的标准负向嵌入或列表：'text, watermark, blurry, deformed hands'。

工程化提示词模板

权重黑客（聚焦增强器）

Positive

Formula: (Main Subject:1.2), [Action], [Context], [Style Tags] 原理：有时 SDXL 会忽略你提示词的一部分。将其放在 (parentheses) 中会将其注意力分数乘以 1.1。添加数字 :1.2 或 :1.5 会强制模型将该 token 优先于所有其他 token。 Example: '(Red sports car:1.3) drifting on a racetrack, smoke, motion blur, 8k uhd, dslr'

Negative

blue car, slow, parked, cartoon

“打断”技术（概念混合）

Positive

Formula: [Concept A] BREAK [Concept B] 原理：如果你想混合两个独特的颜色或概念而不让它们相互渗透（比如蓝衬衫和红裤子），请使用关键词 BREAK。它会重置上下文窗口，强制模型独立处理下一个块，然后再合并。 Example: 'A woman with blue hair BREAK wearing a red dress'

Negative

purple dress, green hair

“负向盾牌”（质量增强器）

Positive

Formula: [Prompt] ... Negative: text, watermark, bad anatomy, blurry, low quality, cropped 原理：SDXL 没有像 DALL-E 3 那样的内置“质量过滤器”。你必须提供负向提示词来过滤掉其庞大训练集中包含的“垃圾”数据（水印、模糊照片）。 Example: 'An astronaut on mars. Negative: helmet reflection, text, nasa logo, malformed limbs'

Negative

text, watermark, bad anatomy, blurry, low quality, cropped

案例研究：SDXL 精度

案例研究 1：超现实主义构图

SDXL 能完美处理抽象概念。注意“蒸汽朋克城市”和“鲸鱼”是如何自然融合的，没有旧模型中常见的伪影。

a giant whale floating in the sky above a steampunk city, golden clouds, dreamlike atmosphere, surrealism, intricate details, oil painting style --w 1024 --h 1024

案例研究 2：构图控制（“打断”技术）

通过使用 BREAK 关键词，我们可以将主体描述与风格/氛围设置分离，确保艺术风格不会干扰主体细节（例如，眼镜和帽子保持清晰）。

a white fluffy dog wearing round glasses and a blue cap BREAK artistic painting style, warm color palette, simple background, soft lighting, shallow depth of field

SDXL 疑难解答

为什么我的图像被裁剪或重复了？

你可能使用了错误的分辨率。SDXL 讨厌随机尺寸（如 512x512）。始终使用“桶”：1024x1024, 1152x896, 1216x832, 1344x768, 1536x640。坚持使用这些比例以获得连贯的图像。

什么是“精炼器 (Refiner)”？

精炼器是设计用于在基础模型之后运行以清理噪点的第二个模型。然而，许多现代工作流（以及 ImgtoPrompt）对基础模型提示词的优化非常好，以至于精炼器通常是不必要的。我们专注于把基础提示词做对。

我可以使用“Danbooru”标签吗？

可以！与 Midjourney 不同，SDXL 识别流行的图像板标签（如 1girl, upper_body, looking_at_viewer）。将这些与自然语言混合通常是最强大的提示方式。

继续探索

尝试图片转提示词工具

其他模型指南: Midjourney

工程化你的 SDXL 提示词

不要浪费积分去猜测权重和语法。上传你的参考图片，让我们为你构建完美的、权重平衡的 SDXL 提示词。

自动生成 SDXL 提示词